




摘要:將文本挖掘技術應用于ESG信息披露研究,可以高效、客觀地對披露質量進行評估。通過微詞云、ROST CM6等軟件,以高頻詞分析、語義網絡分析、情感分析為切入點,對乳品企業 ESG報告進行文本分析,發現乳品企業ESG信息披露中存在缺乏統一標準、缺乏一定客觀性、渠道不完善、忽視利益相關者需求與反饋等問題,并從企業、政府與監管機構、利益相關者3個層面提出優化建議。
關鍵詞:文本挖掘;ESG;社會責任;信息披露
0 引言
2023年12月,中央經濟工作會議強調,必須把堅持高質量發展作為新時代的硬道理。高質量發展離不開企業社會責任的履行,這也對企業社會責任相關信息的披露提出了新要求。企業ESG
(環境、社會和公司治理)
相關信息披露越發被重視。一方面,企業披露ESG相關信息可以提升影響力,樹立品牌形象,實現綠色可持續發展;另一方面,披露ESG相關信息是對國家呼吁經濟綠色轉型的積極響應,有利于滿足各方利益相關者的期望與要求,實現“碳中和”的長遠愿景。
1 文獻回顧
目前,學術界對于企業社會責任履行的關注度不斷提升。文本挖掘技術是基于文本信息知識發現的過程,通過計算機技術,從大量非結構性文本中提取可用、有價值的信息。由于ESG報告之中文本表述的篇幅在不斷增加,越來越多國內外學者開始嘗試將文本挖掘技術運用到企業社會責任信息披露研究之中。
Shahi等[1]基于監督學習的文本挖掘軟件,利用機器學習方法對文本進行分類,對企業可持續發展報告進行自動分析,并將分析結果與實際結果進行對比。Liew等[2]通過計算企業社會責任報告的TF-IDF(詞頻-逆文檔頻率)值,并對同義詞進行提取與聚類分析,對報告進行深入研究。Spijkers[3]建立荷蘭公司社會責任報告語料庫,利用特征詞訓練機器學習分類器,以單獨基于文本執行二進制文本分類任務。
段釗等[4]通過選取上市公司年社會責任報告進行文本挖掘,按比例抽取若干片段,合并調整形成語料庫,計算主觀性得分,以此探索企業社會信息披露是否客觀。馬文超等[5]利用文本挖掘技術,從個體和上市公司群體角度分析了CSR(企業社會責任)報告,認為文本挖掘技術便利了CSR報告信息獲取,為研究建構CSR報告的本體提供了參考。胡英杰等[6]采用文本分析方法,從詞頻、價值詞匯編碼兩個層面對企業社會責任的關鍵性識別指標進行統計并展開理論驗證分析。段釗等[7]收集上市公司社會責任報告并進行文本挖掘,提取文本特征,對上市公司社會責任信息披露實據性的總體、結構與分布特征進行了大范圍、橫縱向與動態分析。吳珊和鄒夢琪[8]從語調、可讀性、報告長度、定量信息、前瞻性信息5個維度對社會責任文本信息披露質量進行分析。劉艷秋等[9]利用文本挖掘方法,以高頻詞分析和關鍵詞共現網絡圖分析為切入點,研究制造業上市公司履行社會責任所關注內容的演化特征。劉剛等[10]采用機器學習方法,從社會責任報告語調、易讀性和覆蓋范圍3個維度研究企業社會責任信息披露情況。
2 數據獲取及處理
2.1 數據獲取
本文選取乳品企業作為研究對象。由于乳品企業與食品安全及環境保護密切相關,其社會責任履行也被公眾所重視,故乳品行業ESG信息披露顯得尤為重要。據統計,上海證券交易所(以下簡稱“上交所”)、深圳證券交易所(以下簡稱“深交所”)上市的乳品企業共21家,其中發布ESG報告或CSR報告的企業有14家(包括內蒙古伊利實業集團股份有限公司、北京三元食品股份有限公司、光明乳業股份有限公司等)。利用Python爬蟲技術,從上交所、深交所官網抓取這14家企業2011—2022年的ESG報告,共得到56份。以這56份報告為樣本,對乳品企業ESG信息披露進行分析。
2.2 數據處理
樣本選取完成后,對以上56份ESG報告進行文本預處理,具體操作如下:
(1)格式轉換。利用Python軟件中的PDFMiner庫,將獲取的56份PDF版本的ESG報告轉換為TXT格式。
(2)文本合并。利用Python代碼,將已轉換為TXT格式的文本合并為1個文本,將utf-8格式的文本與其轉換為ANSI格式的TXT文本分別保存。
(3)分詞。將合并后的TXT文本導入,利用Python的第三方庫“jieba”中文分詞庫對文件進行分詞,將“ESG”“CSR”“社會責任”相關新詞添加到自定義詞典中,將“哈爾濱工業大學停用詞表”“百度停用詞表”添加到自定義停用表中,去除標點、語氣詞等無意義文本。
3 乳品企業ESG信息披露現狀及質量分析
3.1 乳品企業ESG報告披露現狀
2010—2022年乳品企業發布ESG報告數量統計見圖1。由圖1可以看出,2010—2012年,只有1家乳品企業發布了ESG報告,而從2013年開始,披露ESG報告的企業數量總體呈現上升趨勢。2020年,披露ESG報告的企業數量增加到8家,顯著上升。到2022年,有12家乳品企業披露了ESG報告。這足以說明乳品企業ESG信息披露意識已逐漸加強,越來越多企業發布ESG報告,
對ESG相關信息進行披露。
3.2 乳品企業ESG信息披露質量分析
3.2.1 披露內容完整性分析
通過閱讀乳品企業2010—2022年披露的56份PDF
版本ESG報告,人工提取完整性衡量指標,見表1。由表1可以看出,超過80%的乳品企業的ESG報告文本形式較為規范,制作了封面、目錄,并針對披露內容有相應的圖表敘述。超過50%的乳品企業的ESG報告有定量披露,并有溝通反饋,說明企業開始重視ESG建設,ESG信息披露不再局限于發布信息,而是開始關注信息使用者的反饋。這有利于企業優化ESG相關戰略,推進企業高質量可持續發展。只有17.86%的乳品企業的ESG報告之中存在負面信息披露,其中僅光明乳業股份有限公司發布的ESG報告之中披露了投訴及其回復處理情況,說明乳品企業在負面信息披露方面仍存在欠缺。
3.2.2 詞頻分析
將經過預處理的乳品企業ESG報告文本導入ROST CM6軟件,對文本進行高頻詞統計,導出高頻詞表,刪除與ESG無關的詞匯并合并同義詞。將處理后的高頻詞表導入微詞云軟件,選擇高頻詞Top50,生成高頻詞詞云圖。詞云圖是一種用來展現高頻關鍵詞的可視化表達,通過文字、色彩、圖形的搭配,產生有沖擊力的視覺效果,并能夠傳達有價值的信息。詞云就是形成“關鍵詞云層”或“關鍵詞渲染”,每個詞的標簽由數據的維度決定,每個詞的大小由數據的度量決定,對網絡文本中高頻“關鍵詞”進行視覺上的突出。
2010—2022年乳品企業ESG報告高頻詞詞云見圖2。由圖2可知,在乳品企業ESG報告中,“發展”“員工”“持續”“責任”“質量”“牧場”“消費者”“供應鏈”等關鍵詞出現頻率較高,說明乳品企業作為食品行業的一部分,一直將食品安全放在核心位置,重視產品質量。而在ESG視角下,乳制品供應鏈因自身極具特殊性,其中心產品具有不同于一般產品的特點,所涉及的主體包括奶農(或牧場)、乳制品加工企業、經銷商、配送商、零售商及最終消費者等。乳品企業要實現高質量可持續發展,不只要重視綠色環保,更要在利益相關者問題上加強與產業鏈上下游利益相關方的聯系,共同推進實現行業可持續發展目標,鼓勵和加強合作與創新,主動、及時及完善ESG信息披露履行情況。
3.2.3 共詞分析
將經過預處理的乳品企業ESG報告文本導入微詞云軟件,選取文本中TF-IDF值Top 30的高頻詞,進行共詞分析,構建共現矩陣,生成共現網絡關系圖。共詞網絡方法在知識網絡研究中應用普遍,利用論文關鍵詞及其共現關系構建共詞矩陣,進而映射為共詞網絡并可視化,揭示某一學科、某一領域或某一主題的研究熱點與趨勢、知識結構與演化等。
2010—2022年乳品企業ESG報告關鍵詞共現網絡見圖3。由圖3可以看出,“員工”“安全”“供應商”“消費者”等關鍵詞節點聯系緊密,在乳品企業ESG報告文本之中的重要度較高。“責任”一詞引出了“員工”“社會”“健康”“綠色”等詞,表明乳品企業社會責任履行最關注的是利益相關者;“合作”“技術”“安全”等詞共現,說明乳品企業在ESG建設中重視產業合作、科技創新、食品安全保障。這些關鍵詞的出現都是乳品企業高質量可持續發展意識的體現。
3.2.4 情感分析
將經過文本預處理的ANSI格式TXT文本導入ROST CM6軟件,得到情感分析結果,見圖4。由圖4可以看出,在乳品企業ESG報告中,正面情感占比(54%)較大,負面情感占比(9%)較小。這說明乳品企業信息披露以正面信息為主,傾向于傳達積極情緒;對負面信息的披露較少,存在負面信息披露不足問題。
4 乳品企業ESG信息披露中存在的問題
4.1 缺乏統一標準
目前,多數乳品企業未形成完善的ESG數據披露體系,存在關鍵數據不披露、披露數據不詳細、只談減少不談總量等問題。此外,乳品企業大部分ESG報告存在與本企業往年ESG報告的內容框架與排版相似度高的問題,本年僅用新信息直接替換舊信息。企業之間在信息披露形式和內容上存在較大差異,缺乏統一標準。
4.2 缺乏一定客觀性
從前文不難看出,乳品企業ESG信息披露傾向于回避負面信息,多數對大眾展現正面信息,傳遞積極情緒,以大規模的文字、圖片宣揚本報告年度在ESG建設上取得了哪些成就、獲得了哪些獎項,而刻意弱化了負面信息。這些被刻意展現出的正面信息缺乏客觀性,無法保證信息披露的可信性與真實性。
4.3 渠道不完善
當前,越來越多的企業正在披露ESG信息,但是,不少企業披露的相關信息并不連續,行業內也未形成發布ESG報告的共識,缺乏相關的管理機構。部分企業未將ESG報告上傳至公開平臺,如交易所官網、巨潮資訊等,而是只將其公布在自己的官網上。
4.4 忽視利益相關者需求與反饋
ESG 信息披露必須符合利益相關者的訴求,但是在乳品企業ESG報告中,雖然大部分設有讀者反饋板塊,但是篇幅較短,多數僅征求開放性建議。在獲取反饋意見時,大部分企業采取收取郵寄文件形式,導致反饋意見不夠及時。這種形式也不夠公開透明,可能降低利益相關者對ESG信息披露反饋的積極性,不利于ESG信息披露質量的提高。
5 ESG信息披露優化建議
5.1 企業層面
5.1.1 增強ESG信息披露意識
大部分乳品企業被動參與ESG信息披露,以應對政府與機構的監管要求。為了提升ESG信息披露的質量,企業必須在合乎自身情況基礎上,完善信息披露。企業應當意識到,ESG信息披露并非負擔,而是一種機遇。通過ESG信息披露,企業不僅可以向大眾傳遞積極信號,樹立有責任、有擔當的形象,而且其管理者還可以利用信息,確定發展戰略,引導企業實現綠色可持續發展。
5.1.2 增強ESG信息管理能力
ESG信息披露不只是一種表述,而是源自實踐、基于實踐、促進實踐的過程。ESG信息披露是企業與社會、環境、未來關系的反映,具有坐標、鏡子和窗口的作用。ESG信息披露是一個坐標,指引企業長期發展方向和階段進展;ESG信息披露是一面鏡子,幫助企業審視并傳遞治理、戰略、關鍵議題等;ESG信息披露也是一個窗口,連接企業與社會,使企業融入社會發展大局。因此,企業必須重視ESG信息披露。一方面,提升管理層的ESG信息管理能力;另一方面,成立專門的部門,收集、整理ESG信息并對外公布,將信息管理與信息技術相結合,提升管理效率。
5.2 政府與監管機構層面
5.2.1 加強監督與處罰力度
政府與監管機構應當強化ESG信息披露監管,完善相關制度,明確對ESG信息披露違規行為的處罰措施。無論是負面信息披露、報告“漂綠”行為,還是其他違規行為,在很大程度上都受到監管力度不足的影響,所以加強披露信息監管迫在眉睫。政府與監管機構可通過建立溯源機制等手段,持續關注企業ESG表現。當企業在ESG相關領域出現問題時,政府與監管機構應對其過往信息進行追溯,查看披露的信息是否客觀,如有違規行為,可加重處罰。
5.2.2 提高ESG信息披露強制性
如今,ESG信息披露的乳品企業以大規模企業為主。而這些企業之所以披露ESG信息,主要還是因為迫于強制要求壓力。政府與監管機構在信息披露中充當了重要角色,發揮了重要作用。政府與監管機構可以通過以下方式推動ESG信息披露強制性提高:第一,完善相關政策及法律法規,規范ESG信息披露的內容和格式;第二,引入第三方審計,推動ESG報告強制進行第三方審計,提高報告可靠性;第三,發揮引導作用,對發布高質量ESG報告的企業進行激勵,對所發布ESG報告質量較差的企業進行批評,促使企業關注ESG報告質量。
5.3 利益相關者層面
5.3.1 積極參與ESG信息披露反饋
乳品企業履行社會責任不能缺少與利益相關者的互動。利益相關者不能僅關注企業所披露正面信息,更要關注企業存在的問題。只有利益相關者積極參與信息反饋,才能幫助企業發現問題并進行針對性改進,實現ESG信息披露質量的提高。同時,這也有助于企業發現ESG信息披露方面的共性不足,推動ESG理念融入發展戰略,實現高質量可持續發展。
5.3.2 強化信息識別能力
ESG信息披露質量、報告使用者的決策方向與利益相關者息息相關,而與專業的第三方機構相比,信息使用者的信息識別、處理、利用能力較弱。企業應當鼓勵專業機構參與到相關知識普及與能力提升工作中,參照不同層次利益相關者水平,提升其識別ESG信息的能力。這有助于使各利益相關者切實參與ESG建設,幫助企業實現高質量可持續發展。
6 結語
綜上所述,ESG信息披露在企業高質量可持續發展中扮演著重要角色,越來越被企業所重視。本文利用文本挖掘技術,對14家發布ESG報告的乳品企業ESG信息披露情況進行分析,得出了目前乳品企業ESG信息披露還存在缺乏統一標準、缺乏一定客觀性、信息披露渠道不完善、忽視利益相關者需求等問題的結論,乳品企業ESG信息披露優化任重道遠。
2024年2月8日,上交所、深交所和北京證券交易所發布《上市公司自律監管指引——可持續發展報告(試行)(征求意見稿)》,引入由歐盟委員會提出的披露原則,開辟信息披露新里程。ESG披露進入加速發展階段,y2YuKuJ/dus35eLC9QsRMiW1J9SFqNvi2koW5UZOsNk=正從“選答題”轉變為“必答題”。相信通過多方共同努力,ESG信息披露將逐漸規范化,助力更多企業實現高質量可持續發展。
參考文獻
[1]SHAHI A M,ISSAC B,MODAPOTHALA J R.Automatic analysis of corporate sustainability reports and intellegent scoring[J]. International Journal of Computational Intelligence and Applications,2014,13(1):1450006.
[2]LIEW W T,ADHITYA A,SRINIVASAN R.Sustainability trends in the process industries: a text mining-based analysis[J]. Computers in Industry,2014,65(3): 393-400.
[3]SPIJKERSN.Text mining to detect indications of sustainability information in dutch corporate disclosures,Tilburg university of globalization and regulatory hardening[J].American Business Law Journal,2018,55(1):167-278.
[4]段釗,何雅娟,鐘原.企業社會責任信息披露是否客觀:基于文本挖掘的我國上市公司實證研究[J].南開管理評論,2017,20(4): 62-72.
[5]馬文超,吳商碩,黃麒,等.基于文本挖掘技術的企業社會責任報告研究[J].中國市場,2018(4):16-18.
[6]胡英杰,郝云宏,陳偉.互聯網平臺企業與傳統制造企業社會責任差異研究:基于構建雙循環新發展格局背景分析
[EB/OL].(2020-12-14)[2024-04-10].https://kns. cnki. net/kcms2/article/abstract?v=WOTiXAdNI6NsdR9FlcqTblDLKbi5Rlxu2QNMYxUE9rOt48i7sjyRQAPTxQozPIeiJE5lpluidpgi6fDDrhcpjnwHsiKNbVubOFmPbcO0NfzH1x5x3rTpig==&uniplatform=NZKPT.
[7]段釗,涂秋陽,胡穎.上市公司對社會責任的自述“言之有據”嗎?信息披露實據性質量評估方法與實證研究[J].宏觀質量研究,2021,9(5):68-88.
[8]吳珊,鄒夢琪.社會責任文本信息披露是否具有價值保護效應:基于企業違規處罰沖擊的研究場景[J].現代財經(天津財經大學學報),2022,42(9):76-93.
[9]劉艷秋,郭彥楠,楊艷麗,等.基于文本挖掘的制造業上市公司企業社會責任演化研究[J].財會通訊,2022(11):8-14.
[10]劉剛,唐寅,殷建瓴.分析師關注度視角下企業社會責任對績效的影響機理:基于機器學習與文本分析的研究[J]. 中國軟科學,2024(2):156-166.
收稿日期:2024-04-28
作者簡介:
舒惠琪,女,1999年生,碩士研究生在讀,主要研究方向:財務會計、企業財務。
康玉梅(通信作者),女,1973年生,博士研究生,副教授,碩士研究生導師,主要研究方向:企業財務。