



摘要:在全球金融市場(chǎng)中,Environmental, Social and Governance(ESG)“漂綠”現(xiàn)象頻發(fā),誤導(dǎo)投資者對(duì)企業(yè)ESG表現(xiàn)的理解,掩蓋真實(shí)風(fēng)險(xiǎn)。文章針對(duì)傳統(tǒng)ESG評(píng)估的不足,提出一種基于深度學(xué)習(xí)的ESG“漂綠”風(fēng)險(xiǎn)識(shí)別方法,不依賴評(píng)級(jí)機(jī)構(gòu)評(píng)分,直接處理原始報(bào)告。采用“同行相對(duì)漂綠得分”作為訓(xùn)練標(biāo)簽,結(jié)合TextRank和Ernie-Multi-Head Attention模型,實(shí)現(xiàn)了精準(zhǔn)的風(fēng)險(xiǎn)識(shí)別。在Bloomberg和Wind ESG數(shù)據(jù)測(cè)試集上,該方法平均絕對(duì)誤差為0.7014,性能優(yōu)于基線模型。研究有助于投資者深入理解企業(yè)ESG績(jī)效,推動(dòng)可持續(xù)發(fā)展。
關(guān)鍵詞:ESG評(píng)級(jí);漂綠;深度學(xué)習(xí);金融投資;Ernie-Multi-Head Attention
中圖分類號(hào):E790.37" 文獻(xiàn)標(biāo)志碼:A
0 引言
環(huán)境、社會(huì)和治理(Environmental, Social and Governance, ESG)是評(píng)價(jià)企業(yè)可持續(xù)發(fā)展的重要因素,受到投資者和監(jiān)管機(jī)構(gòu)的高度關(guān)注。ESG 負(fù)面事件可能引發(fā)債務(wù)融資風(fēng)險(xiǎn)、財(cái)務(wù)困境,降低投資者信心,增加股票市場(chǎng)崩盤(pán)風(fēng)險(xiǎn)[1]。然而,由于信息復(fù)雜性和不透明性,部分企業(yè)存在“漂綠”(Greenwashing)現(xiàn)象,即通過(guò)不準(zhǔn)確或誤導(dǎo)性的可持續(xù)發(fā)展信息,營(yíng)造虛假形象[2]。這種行為損害了ESG投資的信譽(yù)和效果,并帶來(lái)了巨大風(fēng)險(xiǎn)。因此,識(shí)別ESG“漂綠”風(fēng)險(xiǎn)成為研究熱點(diǎn)。
針對(duì)“漂綠”現(xiàn)象,學(xué)者們提出了量化評(píng)估方法。例如,Yu等[3] 學(xué)者基于彭博和Asset 4數(shù)據(jù)庫(kù),通過(guò)比較披露數(shù)量和績(jī)效得分的相對(duì)位置,創(chuàng)建了“同行相對(duì)ESG漂綠得分”。然而,人工評(píng)級(jí)難以解決我國(guó)ESG領(lǐng)域的固有問(wèn)題。在企業(yè)信息披露規(guī)則尚不完善的情況下,ESG報(bào)告缺乏統(tǒng)一標(biāo)準(zhǔn),披露細(xì)節(jié)不充分且定量信息不足[4-5]。此外,不同評(píng)級(jí)機(jī)構(gòu)方法論不一致,導(dǎo)致評(píng)級(jí)結(jié)果差異顯著,增加了投資風(fēng)險(xiǎn)[6-7]。同時(shí),許多重要的非量化信息,如戰(zhàn)略描述和語(yǔ)言風(fēng)格等,可能被忽略,而這些信息對(duì)于全面評(píng)估ESG表現(xiàn)至關(guān)重要。
在此背景下,研究逐漸關(guān)注深度學(xué)習(xí)技術(shù)在識(shí)別ESG“漂綠”中的潛力。深度學(xué)習(xí)能夠細(xì)致分析語(yǔ)義信息,如戰(zhàn)略描述和語(yǔ)言風(fēng)格,從而揭露潛在“漂綠”行為。此外,該技術(shù)減少了對(duì)人工評(píng)級(jí)的依賴,提高了分析的客觀性和一致性。因此,探索深度學(xué)習(xí)與ESG“漂綠”現(xiàn)象的結(jié)合具有重要意義[8]。
本研究開(kāi)發(fā)了一個(gè)深度學(xué)習(xí)框架,結(jié)合TextRank文本摘要技術(shù)和Ernie-Multi-Head Attention模型,以“同行相對(duì)漂綠得分”作為訓(xùn)練標(biāo)簽,實(shí)現(xiàn)了對(duì)ESG“漂綠”風(fēng)險(xiǎn)的精準(zhǔn)識(shí)別。這一方法為投資者和監(jiān)管機(jī)構(gòu)提供了更精確的ESG風(fēng)險(xiǎn)分析工具,助力企業(yè)履行社會(huì)責(zé)任,促進(jìn)可持續(xù)發(fā)展實(shí)踐。
1 基于深度學(xué)習(xí)的ESG“漂綠”風(fēng)險(xiǎn)識(shí)別方法框架
基于深度學(xué)習(xí)的ESG“漂綠”風(fēng)險(xiǎn)識(shí)別與評(píng)估方法框架,主要包括利用“同行相對(duì)漂綠得分”獲取樣本、TextRank長(zhǎng)文本摘要模型和Ernie-Multi-Head Attention深度學(xué)習(xí)模型。首先,利用“同行相對(duì)漂綠得分”公式結(jié)合Bloomberg和Wind ESG數(shù)據(jù),獲取樣本的“漂綠”得分;其次,通過(guò)TextRank對(duì)樣本數(shù)據(jù)進(jìn)行長(zhǎng)文本摘要,提取關(guān)鍵信息以滿足深度學(xué)習(xí)模型的需求;最后,采用Ernie-Multi-Head Attention模型對(duì)摘要進(jìn)行分析,實(shí)現(xiàn)對(duì)ESG“漂綠”風(fēng)險(xiǎn)的準(zhǔn)確識(shí)別,為投資者和金融機(jī)構(gòu)提供決策支持。
1.1 “同行相對(duì)漂綠得分”計(jì)算
為了有效識(shí)別企業(yè)的ESG“漂綠”行為,Yu等[3]學(xué)者提出了“同行相對(duì)漂綠得分”方法,通過(guò)比較彭博ESG披露得分(衡量披露數(shù)量)和Asset 4 ESG得分(衡量績(jī)效)的相對(duì)位置,構(gòu)建衡量“同行相對(duì)ESG漂綠得分”的指標(biāo)體系。核心思想是:若企業(yè)ESG披露顯著高于實(shí)際績(jī)效,則可能存在夸大或誤導(dǎo)行為;反之,則可能說(shuō)明信息披露不足。
本研究調(diào)整了“同行相對(duì)漂綠得分”計(jì)算公式,以適應(yīng)國(guó)內(nèi)環(huán)境,在國(guó)內(nèi)應(yīng)用場(chǎng)景中采納了Wind萬(wàn)得數(shù)據(jù)庫(kù)的相關(guān)數(shù)據(jù)替代原公式中的Asset 4數(shù)據(jù)。按此方法,若企業(yè)ESG披露得分遠(yuǎn)高于績(jī)效得分,表明其可能通過(guò)過(guò)度信息披露掩蓋績(jī)效不足,其漂綠得分為正值;反之,則可能隱瞞積極表現(xiàn),漂綠得分為負(fù)值,具體計(jì)算公式如下:
GWS=BloombergESGi,t-μBloombergESGtσBloombergESGt-WindESGi,t-μWindESGtσWindESGt(1)
式(1)中:
GWS是一家公司的“同行相對(duì)漂綠得分”。
BloombergESGi,t是在特定時(shí)間點(diǎn)t,企業(yè)i根據(jù)彭博數(shù)據(jù)庫(kù)所獲得的ESG披露評(píng)分。
μBloombergESGt是在時(shí)間點(diǎn)t通過(guò)對(duì)所有同行業(yè)企業(yè)的BloombergESG披露評(píng)分計(jì)算得到的平均值。
σBloombergESGt是在時(shí)間點(diǎn)t通過(guò)對(duì)所有同行業(yè)企業(yè)的BloombergESG披露評(píng)分計(jì)算得到的標(biāo)準(zhǔn)差。
WindESGi,t是在時(shí)間點(diǎn)t,企業(yè)i的WindESG績(jī)效評(píng)分。
μWindESGt是在時(shí)間點(diǎn)t通過(guò)對(duì)所有同行業(yè)企業(yè)的WindESG績(jī)效評(píng)分計(jì)算得到的平均值。
σWindESGt是在時(shí)間點(diǎn)t通過(guò)對(duì)所有同行業(yè)企業(yè)的WindESG績(jī)效評(píng)分計(jì)算得到的標(biāo)準(zhǔn)差。
1.2 Ernie-Multi-Head Attention深度學(xué)習(xí)模型
本文提出了一種結(jié)合Ernie預(yù)訓(xùn)練模型與多頭注意力機(jī)制(Multi-Head Attention)的深度學(xué)習(xí)架構(gòu),以提升文本回歸任務(wù)的預(yù)測(cè)精度。Ernie通過(guò)大規(guī)模中文語(yǔ)料的知識(shí)增強(qiáng)策略,有效提取ESG報(bào)告中的關(guān)鍵語(yǔ)義特征,幫助識(shí)別和量化ESG“漂綠”風(fēng)險(xiǎn);多頭注意力機(jī)制通過(guò)多個(gè)注意力頭關(guān)注文本不同部分,捕捉全局與局部的依賴關(guān)系,從而全面提升語(yǔ)義理解和預(yù)測(cè)能力。
模型架構(gòu)中,Ernie生成初步文本表示,多頭注意力機(jī)制進(jìn)一步處理,增強(qiáng)對(duì)細(xì)微變化的敏感度,尤其在ESG復(fù)雜回歸任務(wù)中,捕捉關(guān)鍵的長(zhǎng)程依賴關(guān)系。這種方法有效保留長(zhǎng)文本語(yǔ)義信息,生成更具代表性的特征,從而提升ESG風(fēng)險(xiǎn)分析表現(xiàn)。
1.2.1 Ernie預(yù)訓(xùn)練語(yǔ)言模型
由于Ernie-Multi-Head Attention模型對(duì)單個(gè)樣本長(zhǎng)度有限制,采用TextRank摘要方法將文本長(zhǎng)度控制在模型最大范圍內(nèi)。TextRank基于圖排序算法,通過(guò)詞語(yǔ)共現(xiàn)關(guān)系構(gòu)建圖模型,提取關(guān)鍵詞[9]。
習(xí)海旭等[10] 學(xué)者認(rèn)為,TextRank作為無(wú)監(jiān)督抽取式摘要方法,無(wú)需依賴大規(guī)模標(biāo)注數(shù)據(jù),具備較高實(shí)用性,同時(shí)整合句子位置、文檔相似度等特征,優(yōu)化了摘要的相關(guān)性、多樣性和可讀性。在結(jié)合“語(yǔ)步”劃分和依存句法分析后,其簡(jiǎn)潔性與連貫性進(jìn)一步提升,適用于長(zhǎng)文本摘要。
摘要后的ESG報(bào)告數(shù)據(jù)通過(guò)Ernie 3.0進(jìn)行分詞和編碼,生成每個(gè)Token的序列特征表示及文本匯總表示,作為后續(xù)模型輸入。
1.2.2 Multi-Head Attention模型
注意力機(jī)制基于人類視覺(jué)原理,聚焦關(guān)鍵特征,忽略無(wú)關(guān)信息,從而提高處理效率[11]。注意力通過(guò)注意力函數(shù)實(shí)現(xiàn),注意力函數(shù)將dmodel維度的查詢、鍵和值映射為輸出,其中查詢、鍵、值和輸出均為向量。常見(jiàn)的注意力函數(shù)包括加法注意力和點(diǎn)積注意力,后者計(jì)算速度快且空間效率高。然而,點(diǎn)積注意力并不總是優(yōu)于加法注意力,當(dāng)鍵的dk值較小時(shí),兩者表現(xiàn)相近;在較大dk值未按比例放大的情況下,加法注意力反而表現(xiàn)更佳。為減小這種影響,可以對(duì)點(diǎn)積進(jìn)行縮放[12]。其注意力輸出矩陣按照式(2)計(jì)算:
AttentionQ,K,V=SoftmaxQKT dkV(2)
式(2)中,Q,K,V作為點(diǎn)積注意力的輸入矩陣。
多頭注意力模型可以更加高效的關(guān)注序列的全局信息。它是對(duì)輸入Q,K,V用不同的學(xué)習(xí)過(guò)的投影參數(shù)矩陣進(jìn)行線性投影,然后輸入進(jìn)點(diǎn)積注意力,重復(fù)h次這個(gè)過(guò)程。如式(3)、式(4)所示:
MultiheadQ,K,V=Concat(head1,…,headh)wo(3)
headi=Attention(QWQi,KWKi,VWVi)(4)
其中,WQi,WKi,WVi分別是第i個(gè)頭的查詢、鍵、值的變換矩陣;wo是最終的輸出變換矩陣,Concat表示拼接操作[13]。
2 實(shí)驗(yàn)結(jié)果與分析
2.1 數(shù)據(jù)集介紹
本研究選用了國(guó)內(nèi)所有在Bloomberg彭博和Wind萬(wàn)得系統(tǒng)中能夠收集到相關(guān)數(shù)據(jù)的A股上市公司,時(shí)間跨度為2018年至2022年。通過(guò)將這些公司的E、S、G各項(xiàng)得分納入“同行相對(duì)漂綠得分”公式計(jì)算,得到5802個(gè)數(shù)據(jù),這些數(shù)據(jù)的GWS值區(qū)間為-3.665836~5.703895。最終,根據(jù)得到的數(shù)據(jù)在證券交易網(wǎng)站爬取到1808個(gè)樣本數(shù)據(jù),這些樣本數(shù)據(jù)的GWS值區(qū)間為-3.261754~5.703895,這一縮小的樣本數(shù)量主要是因?yàn)椋?/p>
(1)許多公司刪除了之前年度的可持續(xù)發(fā)展報(bào)告或社會(huì)責(zé)任報(bào)告。
(2)我國(guó)對(duì)上市公司ESG報(bào)告仍處于鼓勵(lì)自愿披露的狀態(tài),導(dǎo)致很多公司未披露相關(guān)報(bào)告,而將其作為年報(bào)中的兩個(gè)章節(jié)進(jìn)行披露,信息有限,因此,在數(shù)據(jù)獲取階段舍棄了未單獨(dú)披露可持續(xù)發(fā)展報(bào)告或社會(huì)責(zé)任報(bào)告的樣本。
接下來(lái)將樣本標(biāo)注上對(duì)應(yīng)的GWS值,之后將其寫(xiě)入到CSV文件中,以便訓(xùn)練時(shí)讀取數(shù)據(jù)。數(shù)據(jù)集按照8∶1∶1的比例分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。
2.2 超參數(shù)設(shè)置
深度學(xué)習(xí)模型涉及大量的超參數(shù),取值影響模型檢測(cè)性能。超參數(shù)調(diào)優(yōu)旨在尋找深度學(xué)習(xí)模型中最優(yōu)解與正則化之間的平衡。模型優(yōu)化的目標(biāo)是找到全局最優(yōu)解,或至少是更優(yōu)的局部解,而正則化則關(guān)注模型的擬合效果。盡管兩者在某些情況下存在矛盾,但它們的共同目標(biāo)是最小化期望風(fēng)險(xiǎn)。模型優(yōu)化側(cè)重于降低經(jīng)驗(yàn)風(fēng)險(xiǎn),但容易導(dǎo)致過(guò)擬合,正則化則用于控制模型復(fù)雜度。因此,需要通過(guò)超參數(shù)調(diào)優(yōu)在兩者之間取得平衡,以獲得最優(yōu)或相對(duì)較優(yōu)的解。
在文本輸入階段,句子最大截?cái)嚅L(zhǎng)度設(shè)置為512,每個(gè)訓(xùn)練批次內(nèi),句子數(shù)量為16。在模型訓(xùn)練階段,將損失率設(shè)置為0.1,學(xué)習(xí)率設(shè)置為5e-5,訓(xùn)練周期為20個(gè)epoch。
2.3 評(píng)價(jià)指標(biāo)
實(shí)驗(yàn)采用平均絕對(duì)誤差(Mean Absolute Error,MAE)、均方誤差(Mean Square Error,MSE)、均方根誤差(Root Mean Square Error,RMSE)衡量模型識(shí)別效果的優(yōu)劣。
MAE反映了預(yù)測(cè)值與實(shí)際值之間的平均絕對(duì)誤差,用于衡量模型預(yù)測(cè)的準(zhǔn)確性。其計(jì)算公式為:
MAE=1n∑ni=1y︿i-yi(5)
式(5)中yi表示實(shí)際值,y︿i表示預(yù)測(cè)值,n為樣本數(shù)。MAE越小,表示模型預(yù)測(cè)準(zhǔn)確性越高。
MSE則反映了預(yù)測(cè)值與實(shí)際值之間的平均平方誤差,用于衡量模型預(yù)測(cè)的精度。其計(jì)算公式為:
MSE=1n∑ni=1(y︿i-yi)2(6)
式(6)中yi表示實(shí)際值,y︿i表示預(yù)測(cè)值,n為樣本數(shù)。MSE越小,表示模型預(yù)測(cè)精度越高。
RMSE反映了預(yù)測(cè)值與實(shí)際值之間的平均平方根誤差,用于衡量模型預(yù)測(cè)的穩(wěn)定性。其計(jì)算公式為:
RMSE= 1n∑ni=1(y︿i-yi)2(7)
式(7)中yi表示實(shí)際值,y︿i表示預(yù)測(cè)值,n為樣本數(shù)。RMSE越小,表示模型預(yù)測(cè)穩(wěn)定性越高。
2.4 實(shí)驗(yàn)結(jié)果與分析
為驗(yàn)證本文中提出的基于Ernie-Multi-Head Attention的 ESG“漂綠”風(fēng)險(xiǎn)識(shí)別方法有效性,將所提方法與下列性能較高的深度學(xué)習(xí)模型進(jìn)行對(duì)比實(shí)驗(yàn),對(duì)比模型如下,如表1所示:
(1)Bert模型:谷歌于2018年提出的Bert預(yù)訓(xùn)練語(yǔ)言模型,具備處理中文和多語(yǔ)言任務(wù)的能力;
(2)Ernie模型:百度于2019年提出的Ernie預(yù)訓(xùn)練語(yǔ)言模型,具有較強(qiáng)的處理中文任務(wù)的能力;
(3)Multi-Head Attention模型[13]:使用多頭注意力機(jī)制,以增強(qiáng)模型對(duì)不同位置詞匯的關(guān)注能力;
(4)Bert-Multi-Head Attention模型[14]:結(jié)合Bert預(yù)訓(xùn)練模型與多頭注意力機(jī)制。
實(shí)驗(yàn)結(jié)果顯示,Ernie-Multi-Head Attention模型在MAE、MSE和RMSE等指標(biāo)上表現(xiàn)最佳,展現(xiàn)了較高的準(zhǔn)確性和穩(wěn)定性。其結(jié)合Ernie模型強(qiáng)大的中文文本特征提取能力和多頭注意力機(jī)制對(duì)長(zhǎng)文本的上下文捕捉能力,使其能更有效識(shí)別ESG報(bào)告中的“漂綠”行為關(guān)鍵信息。
對(duì)比其他模型,Bert模型因未針對(duì)中文優(yōu)化,性能略遜于Ernie;Multi-Head Attention模型雖擅長(zhǎng)捕捉詞匯關(guān)系,但在處理長(zhǎng)文本時(shí)效果較弱;Bert-Multi-Head Attention模型表現(xiàn)均衡,但仍不如Ernie-Multi-Head Attention。
3 結(jié)語(yǔ)
ESG 信息披露的復(fù)雜性和不透明性導(dǎo)致了“漂綠”現(xiàn)象的出現(xiàn),給投資者和市場(chǎng)帶來(lái)了巨大的損失和風(fēng)險(xiǎn)。本研究針對(duì)“同行相對(duì)漂綠得分”方法的局限性,采用深度學(xué)習(xí)技術(shù),構(gòu)建了基于Ernie-Multi-Head Attention的模型框架,實(shí)現(xiàn)了對(duì)企業(yè) ESG 報(bào)告中“漂綠”風(fēng)險(xiǎn)的精確識(shí)別。與傳統(tǒng)的評(píng)級(jí)方法相比,該方法直接分析原始 ESG 報(bào)告文本,避免了因評(píng)級(jí)機(jī)構(gòu)標(biāo)準(zhǔn)不一致和信息丟失導(dǎo)致的“漂綠”得分準(zhǔn)確性問(wèn)題,為投資者和監(jiān)管機(jī)構(gòu)提供了更加精確和透明的 ESG 風(fēng)險(xiǎn)分析工具,有助于提升市場(chǎng)透明度和投資決策質(zhì)量。
盡管所提方法在識(shí)ESG“漂綠”風(fēng)險(xiǎn)識(shí)別方面取得了良好的效果,但仍然存在改進(jìn)的空間和局限性:數(shù)據(jù)質(zhì)量和樣本量的限制可能影響模型的泛化能力;模型的解釋性較弱,未來(lái)研究可以結(jié)合領(lǐng)域知識(shí)以提高可解釋性。總體而言,未來(lái)的工作應(yīng)進(jìn)一步優(yōu)化模型,并擴(kuò)展其在實(shí)際應(yīng)用中的適用性。
參考文獻(xiàn)
[1]蔣藝翅,姚樹(shù)潔.ESG信息披露、外部關(guān)注與企業(yè)風(fēng)險(xiǎn)[J].系統(tǒng)管理學(xué)報(bào),2024(1):214-229.
[2]DE F N S V, SOBRAL M F F, RIBEIRO A R B, et al. Concepts and forms of greenwashing: a systematic review[J]. Environmental Sciences Europe, 2020(32): 1-12.
[3]YU E P, VAN L B, CHEN C H. Greenwashing in environmental, social and governance disclosures[J]. Research in International Business and Finance, 2020(52): 101192.
[4]徐婷,田雪瑩.我國(guó)ESG研究脈絡(luò)梳理與展望:基于CiteSpace的可視化分析[J].財(cái)會(huì)研究,2024(2):62-71,80.
[5]張國(guó)富,李鼎.ESG評(píng)價(jià)分歧會(huì)提高審計(jì)定價(jià)嗎:基于企業(yè)內(nèi)外部治理環(huán)境視角[J].財(cái)會(huì)月刊,2024(16):83-89.
[6]張真,王湛,楊青.重點(diǎn)行業(yè)公司ESG報(bào)告研究:演進(jìn)、實(shí)踐及優(yōu)化路徑[J].財(cái)會(huì)月刊,2024(16):103-109.
[7]AVRAMOV D, CHENG S, LIOUI A, et al. Sustainable investing with ESG rating uncertainty[J]. Journal of financial economics, 2022(2): 642-664.
[8]SMEUNINX N, DE C B, AERTS W. Measuring the readability of sustainability reports: a corpus-based analysis through standard formulae and NLP[J]. International Journal of Business Communication, 2020(1): 52-85.
[9]周錦章,崔曉暉.基于詞向量與TextRank的關(guān)鍵詞提取方法[J].計(jì)算機(jī)應(yīng)用研究,2019(4):1051-1054.
[10]習(xí)海旭,何勝,黃純國(guó).融合語(yǔ)步和文本多特征的科技論文結(jié)構(gòu)化摘要生成[J].情報(bào)學(xué)報(bào),2023(10):1176-1186.
[11]高凱,李勛豪,胡林,等.基于多頭注意力的CNN-LSTM的換道意圖預(yù)測(cè)[J].機(jī)械工程學(xué)報(bào),2022(22):369-378.
[12]GIULIARI F, HASAN I, CRISTANI M, et al. Transformer networks for trajectory forecasting[C]// 2020 25th International Conference on Pattern Recognition (ICPR). Italy:IEEE,2021:10335-10342.
[13]ASHISH V. Attention is all you need[J]. Advances in Neural Information Processing Systems, 2017(30): 1.
[14]CHENG L C, CHEN Y L, LIAO Y Y. Aspect-based sentiment analysis with component focusing multi-head co-attention networks[J]. Neurocomputing, 2022(489): 9-17.
(編輯 何 琳)
Deep learning-based ESG “greenwashing” risk identification method
YE" Ninghui
(School of Economics and Management, Jiangsu University of Science and Technology, Zhenjiang 212000, China)
Abstract:" In global financial markets, the phenomenon of Environmental, Social, and Governance (ESG) “greenwashing” occurs frequently, misleading investors’ understanding of corporate ESG performance and obscuring real risks. To address the limitations of traditional ESG assessments, this paper proposes a deep learning-based ESG “greenwashing” risk identification method that does not rely on rating agency scores but directly processes raw reports. Using “peer-relative greenwashing scores” as training labels and combining TextRank with the Ernie-Multi-Head Attention model, the method achieves accurate risk identification. On the Bloomberg and Wind ESG datasets, the proposed method achieves a mean absolute error of 0.7014, outperforming baseline models. This research helps investors gain a deeper understanding of corporate ESG performance and promotes sustainable development.
Key words: ESG rating; greenwashing; deep learning; financial investment; Ernie-Multi-Head Attention