高錦萍(教授/博導)吳美娟 高鶴菲
(北京郵電大學經濟管理學院 北京 100876)
誠實信用,在當今資本市場交易中不僅是道德層面的要求,更是法律層面的要求。失信行為的頻繁發生使得市場主體之間逐漸失去信任,提高了市場交易成本,嚴重影響了市場交易秩序。各類交易主體恪守信用,遵守透明公開的經營原則,主動、真實地公開企業的信用信息是信用管理的基本要求。雖然依托大數據、云管理等現代信息技術的發展,我國已建立較為成熟的企業信用信息公示系統,但仍然存在披露信息不充分、不規范等缺陷。2015年國家標準化管理委員會發布的《GB/T23794-2015企業信用評價指標》(以下簡稱《企業信用評價指標》),將企業信用評價指標細化為“守信意愿”“守信能力”和“守信表現”三個維度共28項指標,為衡量和評價企業信用信息披露質量提供了有力的依據。本文以相對規范的上市公司年報為研究樣本,采用文本挖掘技術與人工復核相結合的方法,以《企業信用評價指標》作為初始評價指標,并結合《公開發行證券的公司信息披露內容與格式準則第2號——年度報告的內容與格式》(以下簡稱《年度報告的內容與格式》)來構建信用信息關鍵詞詞典,以年報關鍵詞詞頻與年報總字數之比構建信用信息披露指數,進而考察上市公司年報中信用信息披露的現狀及其特征。
企業信用信息反映了企業在履行締約關系時交易行為的守信能力、守信意愿和守信表現等方面的綜合信息。信用信息的披露可以減少雙方在契約簽訂后對彼此履約的監督,降低契約履行成本。現有研究從多方面評價了企業的信用信息披露質量,Barron&Staten(2003)以及 Kallberg&Udell(2003)從未償還債務和正償還債務的類型、信貸時長、新申請的信貸、逾期拖欠破產等方面評價了市場主體的商業信用信息披露質量。潘滕杰和梁藝榕(2017)從信用信息披露的深度和廣度兩個方面衡量了商業銀行信用信息披露質量,其中披露深度指標包括是否含有正面和負面的信息、企業和個人的信息、信用信息披露機構類型、信用信息披露時長、信用信息披露標準等,披露廣度指標是指征信機構登記的范圍??傮w來看,現有研究對評價指標體系的構建仍然缺乏全面性和系統性?!镀髽I信用評價指標》基于企業文化管理、學習型企業文化管理、學習型組織管理、文化鏈管理等理論,從我國國情出發,從守信意愿、守信能力、守信表現三個方面衡量了企業信用情況。該指標體系所覆蓋的信用信息全面,且各項指標便于理解、采集和使用,因此本文依據該指標體系來調查和分析上市公司年報中信用信息披露的現狀和特征。
由于其特殊的文本載體,非財務信息難以設置統一和明確的限制標準,因此對于非財務信息披露質量的衡量也需要采用特殊的方法。內容分析法作為一種對傳播內容進行客觀、系統和定量描述的研究,被廣泛應用在非財務信息披露質量研究領域。該方法基于所要分析的內容進行框架性梳理后建立指標體系,通過專家打分予以量化處理。一些國內外學者采用了基于內容分析法的人工評分方式,對上市公司的年報信息如自愿披露信息、社會責任信息、環境信息等的披露質量及經濟效果進行了研究和檢驗。
隨著文本挖掘技術的發展,文本分析法在各個研究領域得到迅速應用。該方法通過量化從文本中抽取的特征項來衡量文本信息,特征項可以是字根、字、詞素、詞、短語、句子等單位。文本分析法可以提高工作效率,增加樣本數量,從而降低抽樣誤差,增強回歸效度,因其具有較強的客觀性、可比性、高效性及可靠性,文本分析法逐漸受到非財務信息披露研究領域的青睞。現有研究利用的文本挖掘工具主要包括ROST CM工具、JAVA語言、自然語言處理方法(NLPIR)、Python程序等。張秀敏等(2014)利用ROST CM工具對社會責任報告中的環境信息進行采集,形成環境信息的高頻詞、高頻詞共現矩陣及社會網絡圖,構建環境信息特征詞詞典,作為環境信息披露質量的評分依據。王華和劉慧芬(2018)借助NLPIR分詞系統,采用人工、軟件雙復核的方式構建研發信息關鍵詞庫,以年報中關鍵詞頻量化研發文本信息。易珩(2019)和宋巖(2020)借助Python程序對年報和社會責任報告中的風險信息和社會責任信息關鍵詞進行詞頻提取和分析以形成關鍵詞表,計算特征詞頻度量相關信息披露質量。
《企業信用評價指標》中的守信意愿信息描述了企業決策者的價值取向、企業在經營過程中追求的目標;守信能力信息描述了企業履行承諾的綜合能力;守信表現信息描述了企業承擔社會責任、履行對利益相關者責任及承諾的情況。本文采用文本挖掘技術提取以上三個維度的三級指標的相應關鍵詞,作為三級指標是否出現的判定。依據語料庫語言學中的“詞頻”及“共現頻率”,頻率高的詞語或詞語搭配說明通用率高。據此本文以信用信息關鍵詞頻與年報總字數之比構建信用信息披露指數。
自2015年我國開始構建企業信用信息公示“全國一張網”,高質量的信用信息披露被提升至戰略高度,但仍然存在企業披露信息不充分、不準確、不規范等問題?;诖?,本文以成熟的、規范的上市公司年報為研究樣本。通過巨潮資訊網下載2015—2018年我國A股上市公司PDF格式的年報資料,并剔除ST與*ST、金融類行業企業,最終得到了11 910個年度公司樣本。由于ROST CM分詞軟件是以TXT文件為基礎進行處理的,因此本研究利用Replace pioneer將PDF年報轉化為ANSI格式的TXT年報,并手工對其進行格式排版方面的整理。
《企業信用評價體系》中有28個三級指標,其中由于各上市公司均會對財務狀況進行披露,屬于強制性披露的內容,與財務能力相關的信息披露質量差異性較小,因此本文未將守信能力的二級指標即財務能力指標下的償債能力、盈利能力、營運能力及發展能力這四個三級指標納入統計范圍之內,僅對剩余的24個三級指標進行統計分析。形成年報信用信息關鍵詞詞典的具體步驟如上頁表1所示。

表1 信用信息關鍵詞詞典的構建步驟
參考張淑惠等(2021)計算風險信息披露質量的方式,以詞頻數與總字數之比來計算信用信息總體及三個維度的披露指數。首先利用Python程序中的jieba分詞功能,統計年報信用信息關鍵詞詞典在年報中出現的頻數。分詞采用結巴分詞中的精準模式,如在“公益慈善活動”三級條目下,代表扶貧的詞語“扶貧”與代表醫療扶貧的詞語搭配“醫療扶貧”同時出現時,該程序能夠準確對“醫療扶貧”進行分詞,并賦予該詞頻率值1,不會對“扶貧”一詞重計。為避免計算機程序錯誤而導致詞頻統計出現誤差,隨機抽取100家公司年報,將PDF版本轉化為Word版本,利用查找功能進行關鍵詞詞頻統計。結果發現,人工統計頻數與計算機程序統計頻數一致,沒有出現錯計或重計的情況。在得到公司年報各關鍵詞詞頻總計后,逐一查看各年報的具體關鍵詞詞頻情況。若發現很明顯的異常詞頻數,則通過人工閱讀年報對不符合語境的詞頻進行剔除,最終得到樣本公司年報信用信息關鍵詞詞頻。其次利用Python統計了每份年報的字數,在文本程序分析中,自動進行文本數據的清洗,過濾掉標點符號與空格等無意義的字符。最后計算詞頻數與總字數之比,得到公司年報總體信用信息及其三個維度的信息披露指數。具體信用信息披露指數的定義如表2所示。

表2 信用信息披露指數的定義
首先對變量在1%水平上進行Winsorize處理。通過表3的描述性統計結果可知,樣本公司信用信息披露指數(cdi)均值為 0.022966,最大值為 0.0309514,最小值為0.0161906,樣本公司之間的信用信息披露質量存在一定差異。

表3 全樣本描述性統計
進一步對樣本公司信用信息披露的三個維度進行結果分析可知:2015—2018年四年內,守信意愿披露指數(cdi1)均值為0.0119553,占信用信息披露總指數的52%左右;守信能力披露指數(cdi2)均值為0.0043689,占比19%左右;守信表現披露指數(cdi3)均值為0.0066102,占比29%左右。這說明年報中守信意愿信息披露質量較高,內容較為全面;守信能力及守信表現內容較少。之所以會出現上述情況,是由于多數公司將經營重點放在了企業戰略、年度治理情況、公司制度情況、股東及董事會情況上,這些信息披露較為集中且數量較多,依據《年度報告的內容與格式》,年報價值觀信息披露格式及內容已成體系,所以公司守信意愿披露質量較高。而公司守信表現即社會責任部分披露零散且少,這是因為社會責任報告將公司年報中披露的社會責任相關信息進一步細化和延伸,公司主要通過社會責任報告披露履行社會責任的詳細信息,年報中承載的社會責任信息較少;此外,年報披露格式也尚未對該指標中的部分條目進行格式的統一。公司守信能力披露較少主要與本文未對二級指標財務能力指標下的償債能力、盈利能力、營運能力及發展能力相關指標進行統計有關。以上分析表明,排除強制性披露的財務指標信息后,公司履行社會承諾的意愿方面的信息在年報中披露最多。
對公司年報信用信息披露指數的分布做進一步分析,結果如上頁表4和圖1所示,在全部樣本公司中,信用信息披露指數處于0.02—0.0225區間的樣本最多,達到3 335家,占全部樣本比重的28%;其次是處于0.0225—0.025區間的樣本,達到3 254家,占全部樣本比重的27.3%;指數超過0.03的樣本最少,僅有212家;指數低于0.0175的也較少,占3.44%。由圖1可以看出,信用信息披露指數近似呈“正態分布”,表明我國上市公司總體信用信息披露質量良好。

表4 總體信用信息披露指數分布

圖1 信用信息披露指數分布
2015—2018年這四年公司年報總體信用信息披露指數的結果如表5所示,樣本公司總體信用信息披露指數平均值從0.0227914增加到0.0230473,呈逐年上升趨勢。這說明在2015年11月國務院倡導提升信用信息披露質量后,公司年報中信用信息的披露質量在不斷提高,說明上市公司逐漸加深對年報信用信息披露重要性的理解,并根據政策導向逐年提升年報信用信息披露質量。

表5 信用信息披露指數年度分布
對信用信息評價指標的三個不同維度每年占比進行進一步具體分析,如表6所示。樣本公司每年的守信意愿信息披露指數(cdi1)占比在2015—2018年呈逐年下滑趨勢。守信能力信息披露指數(cdi2)在2015—2018年呈先下降后上升的趨勢。守信表現信息披露指數(cdi3)占比除2017年略有下降外,基本呈逐年上升趨勢,這說明公司對于年報中守信能力和守信表現方面的信息披露愈發重視。

表6 信用信息披露指數三個維度年度分布
由于各行各業經營范圍及角色特征存在差異,因此,各個行業的信用信息披露指數參差不齊。如表7所示,以樣本公司信用信息披露指數的均值統計為例,排名靠前的行業分別是衛生和社會工作、公共設施管理業、科學研究和試驗發展、信息傳輸軟件與技術服務業、文化體育和娛樂業、建筑業。其中,信息傳輸、軟件與信息技術服務業的披露指數是行業中最高的,得分為0.0249386。信用信息披露指數最低的三個行業是房地產業、批發和零售業、住宿和餐飲業,得分分別為0.0196716、0.0204717、0.0206155。統計結果表明,行業不同,信用相關信息披露的詳細程度也有所不同。

表7 信用信息披露指數的行業分布
考慮到我國經濟制度的現實情況,國有企業與非國有企業面臨著不同的政府支持和融資限制等情況。Chen et al.(2011)等認為國有企業享受著政府更優惠的補貼政策、享有國有銀行更加寬松的融資政策,擁有更高的信用等級,可以較低的成本獲取資金。由于國有企業的政府背景,通常其能夠更加方便地從銀行獲得貸款。國有企業與非國有企業相比擁有更多的資源和關系網、更小的經營風險和更高的發展潛力,可以吸引更多的投資者。因此國有企業與非國有企業披露信息的動機有所不同,非國有企業會通過更多的信息披露來彌補以上方面的不足。
下頁表8描述了在不同產權性質下,公司信用信息披露指數的分布情況。國有企業信用信息披露指數的均值為0.0217378,非國有企業的信用信息披露指數均值為0.0235186,高于國有企業,而且守信意愿、守信能力和守信表現信息三個具體披露指數也呈現出同樣的特征。出現這種情況的主要原因是國有企業與政府存在天然的產權關系,往往可以得到政府更多的資源,企業通過信用信息披露獲取聲譽、降低融資成本的意愿較弱。而非國有企業利用政治關聯獲利的概率減少,提升信用信息披露的動機較高。

表8 信用信息披露指數產權性質分布
本文基于上市公司年報文本分析視角,從履行社會承諾的意愿、能力和表現三個維度來衡量公司信用信息的披露質量,對公司信用信息披露的現狀及年度分布、行業分布、產權分布等特征展開調查和分析。研究發現:
第一,公司年報的信用信息披露中,在排除強制性披露的財務指標信息后,公司守信意愿信息披露最多,守信能力與守信表現披露內容相對較少??傮w來看,信用信息披露指數分布近似呈“正態分布”,我國上市公司總體信用信息披露質量良好。
第二,2015—2018年期間,公司的信用信息披露指數在逐年提高,說明上市公司逐漸認識到信用信息披露的重要性,對信用信息披露的重視程度不斷提高;從三個維度的披露指數占比來看,相比守信意愿信息,守信能力和守信表現方面的信息披露質量呈逐年上升趨勢。
第三,公司年報信用信息披露呈現出一定的行業特征,各行各業的信用信息披露指數參差不齊。其中,信息傳輸、軟件與信息技術服務業的披露指數是行業中最高的;披露指數最低的三個行業是房地產業、批發和零售業、住宿和餐飲業。
第四,在不同的產權性質下,國有企業信用信息披露指數的平均值低于非國有企業,這可能是因為國有企業擁有更多的資源,通過信用信息披露獲取聲譽、降低資本成本的動機比非國有企業有所減弱。