蔣艷輝,馮楚建
(1.湖南大學 工商管理學院,湖南 長沙 410082; 2.科技部 科技經費監管服務中心,北京 100038)
管理層討論與分析(Management discussion and analysis,以下簡稱MD&A)是上市公司財務報告中“董事會報告”的重要內容之一,是上市公司對目前現狀和未來事項的評價與分析,通過對年報內財務數據的解讀,向信息使用者傳達公司可能存在的風險和不確定性因素,以及管理層對未來發展的自身判斷和預期。MD&A按形式劃分包括數據信息與語言信息,但是語言信息所占篇幅遠遠超過數據信息,所承載信息含量必然更加豐富,而且語言表述方式相對通俗化,能夠更好滿足大多數信息使用者(尤其是非財經專業使用者)的需求。雖然財務等數據信息是企業經營效果最重要的體現,但是公司未來發展前景、核心競爭力等重要語言信息在預測企業未來業績時起著舉足輕重的作用,因而越來越多的學者關注MD&A語言信息。
SEC(2003年)新指南是美國目前為止最詳細的MD&A信息披露規范,該指南高度強調MD&A披露內容應當具備無偏、清楚、富含信息含量等特征。IASB項目研究組(2005年底)發布的《管理層評論》(“管理層評論”即“管理層討論與分析”)征求意見稿進一步細化管理層評論披露語言特征,更加強調管理層評論中敘述性語言應該具備如實反應、可理解性、富含信息含量等特征。作為管理層與信息使用者交流紐帶和橋梁的MD&A,語言文字本身的靈活性、復雜性以及多義性特征,為管理層操縱MD&A語言提供了空間。信息使用者只有充分了解MD&A語言特征,才能真正理解管理層披露意圖,才能有效的獲得決策有用性信息。
MD&A語言特征與經營業績的相關性,國內外學者已進行了較多的研究,這些研究主要是從MD&A語言的可理解性、自利性、語言表述時情感傾向等語言特征與業績相關性進行分析。MD&A語言可理解性與業績自利性是語言特征的重要表現形式,其表述靈活,影響程度顯著,因而早前探索語言特征與公司業績相關性研究主要停留在可理解性、業績自利性等語言特征方面[1-4]。但是語言表達豐富,尤其善于傳遞情感和態度信息,增進與信息使用者的感知。因而情感詞匯、時態動詞、積極詞匯等語言特征也與公司經營業績具有積極的正面關系,相應的這方面研究也逐漸顯現[5-6]。回顧語言特征與公司業績相關性文獻,主要集中于研究MD&A語言特征與當期經營業績關系,而研究MD&A語言特征與未來經營業績關系較少,但是信息需求者迫切需要通過語言特征感知上市公司真實的經營情況以及管理層的真實經營能力和意圖,從而更好地預測未來經營情況。
關于MD&A語言特征與未來經營成果的研究還是有一些。Li(2006)發現MD&A語言越復雜,證實企業未來持續收益越短暫[7]。薛爽(2010)通過分析MD&A中提及的外部或者內部原因多少,預測下一年度扭虧[8]。Davis認為,管理層會通過語言信息向投資者傳遞自身對未來業績的預期,其實證發現,語言信息的正負情感混雜度是重要的語言特征,對預測公司未來業績具有顯著的正面影響。Nelson和Pritchard(2007)、Mark(2010)等通過挖掘敘述性語言中風險性詞匯,預測未來破產的公司[9-10]。MD&A語言特征豐富,語言文字隱含管理層的真實心理。當管理層預計不同的未來業績時,會選擇性披露相關信息,語言特征也會隨之表現出顯著差異。但是目前學者僅僅分析某一維度語言特征與未來業績的相關性,極少從多維度衡量語言特征與公司未來業績相關性。語言信息的傳遞是一個綜合性過程,多維度的語言特征有機構成了整體的語言信息,形成豐富多彩的語義,更有效的傳遞管理層的真實意圖,也可以更好地預計未來企業的經營情況。
本文彌補了以往研究單從某一維度來分析MD&A語言特征與公司未來業績相關性的不足。考慮語言信息是復雜的互動過程,如果僅僅分析某一維度的語言特征無法體現完整的管理層的真實心理,因而研究需要進一步細化,但是目前測度手段有限,衡量結果未必科學。鑒于目前國內外學者嘗試從多維度的語言特征衡量電子商務、影評數據的在線評論,從而獲取市場和企業等重要信息[11-14],本文借鑒這一領域的最新進展及趨勢,利用文本挖掘技術分析可讀性、情感傾向、主題詞、自利性等MD&A多維度的語言特征,為信息需求者獲得更深層次、更有價值的信息。相對于傳統研究方法只能適用于篇幅簡短的文字信息,而且需要結合人工閱讀以及定性分析的研究方式,其研究結果可靠性程度低、科學性較弱、可復制性較差。而文本挖掘技術突破了其局限性,通過感知與挖掘技術,自動的對大規模文字信息進行分析處理,從而獲得更深層次的相關信息。
如果管理層與信息需求者之間對稱的掌握公司經營情況信息,就可以降低交易成本,從而達到資源配置的帕累托改進。但在資本市場中,管理層與信息需求者的信息是不對稱的:①管理層對公司內部經營活動、財務狀況、盈利能力和風險信息有確切的了解,他們處于信息優勢;而外部信息需求者既不能直接參與公司的日常經營管理,也無法觀察管理層的全部行動,更加無法了解管理層的能力,而只能獲得關于經理行動和能力的不完全信息,他們處于信息劣勢。②信息需求者在進行投資決策之前不完全了解公司的質量高低,只能根據平均的價值予以投資,結果是,經營業績好的公司會退出市場,而市場上留下的只是業績差的公司。因此,信息需求者對公司經營情況的認知相對于管理層來說是滯后的、不全面的,并在交易過程中始終處于資本市場信息的劣勢地位。在這種情況下,為了改善交易狀況和降低信息不對稱程度,一定的信號傳遞是非常必要的。為了促使交易進行,管理層必須支付一定的信息成本,向信息需求方傳遞一定的質量信號,即信號傳遞。信號機制的存在能夠幫助交易雙方在信息不完全的經濟、市場環境中提高決策效率。MD&A作為管理層向信息需求方傳遞信息的載體,是傳遞公司信息的一種重要信號。
根據信號傳遞的基本原理,任何信息的傳遞都是從信源發出信息,通過編碼器將信息轉變成信號,最后信號通過信道傳遞給信宿。MD&A信號傳遞模式也遵循信號傳遞的基本原理,即管理層披露過去經營狀況的真實經濟業務(信源),只有符合MD&A披露要求(編碼器)的信息才會納入MD&A披露的范圍,經過處理后按照一定的披露規則(信道)進行傳遞,MD&A信息需求者(信宿)在接受信息后,通過管理層對信息自我還原,能夠理性認知公司真實的經營狀況。在MD&A信號傳遞過程中,管理層(信源)是信號傳遞主體。所需傳遞的信息內容是經過管理層(信源)一定的選擇、加工、整理后再向外界傳遞,因而其傳遞作用能否得到充分發揮,能否有效地幫助信息需求者消除信息阻隔,能否加強管理層與信息需求者之間的信息溝通,有賴于這一過程中管理層表達方式是否恰當。
哈貝馬斯有效交流理論認為,主體在交往過程中,語言應該遵循三種有效性原則,即可理解性、真實性、真誠性。也就是說言語者在交流過程中“必須通過可領會的表達方式以便交流雙方能夠相互理解;必須提供一個真實的表述意向,以便對方能夠分享知識;必須真誠的表述自身的意向才能使對方信服”,只有滿足言語有效的三種原則,言語雙方才能有效的交流。MD&A語言信息豐富,文字本身靈活、復雜、多義,管理層操縱空間很大,因而管理層傾向于運用語言信息作為信號,向信息需求者傳遞上市公司真實的經營情況以及管理層的真實經營能力和意圖。鑒于語言信息的傳遞是建立在信號傳遞雙方能夠有效溝通的基礎之上,其傳遞效果受到管理層表述方式的影響。管理層通常會運用不同水平的語言表述方式,向市場傳遞公司價值的信號。因而預計未來業績好時,管理層(信源)對公司經營狀況和發展前景信心強,更加希望通過有效的言語表述方式,向信息需求者(信宿)傳遞清晰的信息;預計未來業績差時,管理層(信源)希望通過一定的言語表述方式傳遞較少的信息含量,盡可能弱化信息需求者(信宿)對公司發展的了解。圖1中,空心箭頭表示信號傳遞基本原理,實心箭頭表示MD&A信號傳遞過程。

圖1 MD&A信號傳遞過程
哈貝馬斯提出,可理解性是指語言只有符合言語規范時,言語交流雙方才能相互理解[15]。基于此,只有當信息的表現方式和所用術語是合乎使用者的知識范圍時,會計信息才具有可理解性(會計信息質量特征研究課題;2006)。
要順暢地完成管理層與信息需求者之間信號的傳遞,語言信息清晰、明了是至關重要的影響因素。正如閻達五(2002)所認為,只有與信息使用者理解能力相匹配時,管理層與信息需求者圍繞公司經營狀況所展開的溝通才會準確、流暢,信息需求者遺漏誤解的比率才會降低,MD&A信息傳遞才能實現高效率[16]。當管理層預計未來業績好時,管理層運用通俗易懂的語言與信息需求者之間建立了良好的互動關系,及時的將自身的動態經營理念、發展規劃以及未來發展趨勢最大化的傳遞給信息需求者,縮短信息需求者對公司未來經營的了解過程,減少信息需求者對公司發展的認知差距,因而預計公司未來業績不俗;相反,當管理層預計未來業績差時,更多的是運用晦澀難懂的語言表述方式傳遞公司經營情況,隱瞞公司短暫的“好消息”和長期的“壞消息”,阻礙信息需求者感知公司的真實經營情況,而這些短暫的“好消息”和長期的“壞消息”很可能在將來給公司未來業績帶來負面影響,因而預計公司未來業績糟糕。基于以上分析,提出以下假設:
假設一:MD&A語言可理解性與公司未來財務業績正相關。
哈貝馬斯(2002)認為,真實性是指言語者必須提供真實陳述的意向,以便聽者能分享言語者的知識[15]。真實性是信息的生命,要求公司所公開的信息能夠正確反映客觀事實或經濟活動的發展趨勢,而且能夠按照一定標準予以檢驗[17]。因此,MD&A信息的真實性包含了兩層含義,一方面要求企業如實陳述過去一定時期內的經濟業務、財務狀況和經營成果,具有無偏性;另一方面要求企業提供的信息能夠與未來決策信息、年度計劃、規劃相匹配,具有可驗證性,兩者缺一不可。
MD&A無偏性是指MD&A在披露內容、行文表述上不偏不倚,不存在“報喜不報憂”現象,能夠客觀地反映公司真實經營情況和企業價值信息[18]。MD&A信號傳遞的核心是讓信息需求者相信所接收的信息是不偏不倚、可以信賴的,如果MD&A傳遞的信息與客觀事實相偏離,即信息不真實,那么信息需求者不但會對企業提供的其他真實信息產生質疑,反而會影響公司在信息需求者心中的形象,產生更多的負面效應。管理層作為MD&A信息的傳播者,應當充分考慮信息需求者對信息的認知。傳遞的理想效果體現在管理層發出的信號能夠得到信息需求者認可。因此,是否傳遞客觀無偏的信息會影響信息傳遞效率高低。當預計未來業績好時,管理層對公司真實的經營情況充滿信心,希望為信息需求者提供更為準確的公司經營和管理近況,從而MD&A言語更為無偏,客觀公正的對公司經營情況進行分析與預計;反之,當預計未來業績差時,管理層通過回避壞消息或者美化涉及自身責任的經營管理問題,操縱MD&A的語言表述,美化自身形象,報喜不報憂。
假設二:MD&A語言無偏性與未來公司財務業績正相關。
FASB和IASB聯合概念框架認為,真實的歷史性財務信息應具有可驗證性。信息使用者通過上下文對照,恰當的分析、加工、整理后獲得一致的信息。因此,具有可驗證性的信息表述才是具有真實意向的信息。MD&A作為敘述性語言信息,所披露的語言信息本身就應該具備前后表述一致,問題與原因,原因與措施對應等基本語言表述邏輯,前后表述的信息可相互對應,相互驗證,才是可靠真實的表述,否則,不認為是真實性的表述。MD&A披露的信息包括兩部分:一部分是對公司當前經營情況的解釋和說明;另一部分是公司未來發展展望。MD&A公司經營情況說明中,管理層通常會對公司的核心競爭力進行披露。公司核心競爭力是否可以維持,從而保持競爭優勢,需要公司在未來年度為保持和鞏固核心競爭力開展一系列的工作和努力,否則公司的核心競爭力可能喪失。當MD&A“公司未來發展展望”中披露的經營工作計劃與“公司經營情況”中披露的公司核心競爭力匹配程度越高時,越說明管理層對公司的核心競爭力識別的更準確、了解的更清楚,未來年度的工作措施也就越具有針對性,因此,公司未來業務就越有可能上升。相反,當MD&A“公司未來發展展望”中披露的經營工作計劃與“公司經營情況”中披露的公司核心競爭力匹配程度越低時,越說明管理層對公司核心競爭力識別的不嚴謹、了解的比較模糊,未來年度的工作措施也就越不具有針對性,因而,公司未來業績上升的可能性就更小。基于以上分析,提出以下假設:
假設三:MD&A語言可驗證性與公司未來財務業績正相關。
哈貝馬斯(2002)認為,真誠性是指言語者必須誠摯表述,使信息接受方能夠相信言語者。信息是言語者表述意向的重要載體。它不僅僅能反映事物的主題,而且能反映認識主體的情感。“情感”表述方式具有多樣性,包括意見、態度、情緒等。語言情感表述方式是語言主觀性的一種體現,體現了認識主體“自我”表現成分——通過一定的結構或形式表明認識主體的立場、態度和情感,從而在話語中留下“自我”的印記(沈家煊,2009)[19]。語言情感表述方式包括顯性和隱性兩種方式。MD&A作為文本信息,不僅反應了管理層對重大歷史事項的理解、對重大風險的評價以及對于未來事項的預測[20],而且字里行間透露管理層的微妙情感,反應管理層“自我”認識,折射出管理層心理活動。因此,可以依據MD&A中的情感表述方式探究管理層的真誠性。本文從兩個方面定義MD&A語言信息真實性,一方面是顯性表述真誠性,另一方面是隱性表述真誠性。
Urmson J.O. (1963) 認為,顯性表述(即主觀化)是通過某種可識別的語法成分表達言語者的主觀信念和態度[21]。言語者為了實現信息交流的目的,利用表達實際意義或客觀描述性的詞語,輔助自身對客觀情形的主觀判斷,向信息需求者傳遞說話的目的、動機、態度和感情[22]。在傳遞過程中,積極運用顯性表述方式,合理的安排語言信息編碼,能夠又快又準確的向信息使用者傳遞自身努力程度。當管理層預計未來業績不俗時, 有強烈的動機向信息使用者展示自我努力意向,通過大量運用顯性表述方式積極的傳遞未來業績利好的信號,因而未來發展戰略的不確定性少,預計公司未來經營業績理想;當管理層預計未來業績不好時,管理層沒有強烈動機向信息使用者傳遞自我努力程度,因而較少的運用顯性表述方式傳遞相關信息,未來發展有更多的不確定性,預計公司未來經營發展不理想[23]。因此,我們預計當公司顯性表述越多,公司未來財務業績越好;當公司顯性表述越少,公司未來財務業績越差。基于以上分析,提出以下假設:
假設四:MD&A語言顯性表述程度與未來公司財務業績正相關。
雷卿(2008)認為,僅僅是通過顯性表述方式往往是不夠的,必須利用隱性表述方式對話語補足和闡述,才能達到對話語的相對完備理解[24]。MD&A語言突出特點之一就是專業性強,如何在粗略閱讀MD&A后激發閱讀者的情感,和管理層建立同一的心理感受,高效率的傳遞公司信息呢?這需要管理層在MD&A語言中增加新的信息,從而更好地吸引讀者注意力。隱性表述方式帶給人們不同認知感受,當隱性表述程度強時,言辭之間包含管理層的強烈情緒,信息接收方認知該信息的程度也會相應增強;反之,當隱性表述程度弱時,管理層平鋪直述的向受眾者傳遞言語者的核心競爭力和發展戰略,信息接受方無法保持積極的情緒閱讀,也不可能最大程度上按照管理層所想來推理,更加不可能認知該信息。因而,當管理層預計未來業績好時,管理層對公司未來發展充滿信心,有強烈的動機向信息使用者展示公司未來經營狀況,通過大量運用隱形表述方式,讓信息使用者強烈的感知公司真實的經營情況,高效率的傳遞公司經營狀況,預計公司未來業績發展趨勢理想;當管理層預計未來業績糟糕時,管理層對未來發展持保守態度,沒有強烈的動機向信息使用者傳遞未來經營狀況,較少的運用隱形表述方式,造成信息使用者無法感知公司的真實經營情況,預計公司未來發展趨勢不理想。基于以上分析,提出如下假設:
假設五:MD&A語言隱性表述程度與未來公司財務業績正相關。
鑒于創業板對市場透明度要求高,披露信息比主板上市公司更加準確、真實。與此同時,創業板市場強調對公司成長性情況、無形資產情況、核心競爭力、風險因素等前瞻性信息披露,因此本文選擇創業板上市公司作為研究對象;我國于2009年正式推出創業板,到2009年12月31日為止只有36家創業板公司,但是2010年創業板加速擴容,至2010年12月31日已有188家上市公司,因此本文以2010年的創業板上市公司披露MD&A為樣本。考慮一季度財務數據披露時間一般為3月31日,而上市公司披露MD&A時間從2月份開始到4月底,本文研究MD&A語言表述方式與未來財務業績相關性,所以排除以第一季度財務業績為研究對象。同樣考慮到2012年年報要到2013年4月底才能全部披露,為了研究的對稱性,本文只考慮2010年半年度財務數據、2010年三季度財務數據、2010年年度財務數據,不再考慮2011年年報、季報財務數據。本文財務數據來自于CSMAR數據庫,數據處理采用EVIEWS6.0處理。
1.因變量。對于上市公司財務業績,僅用一個指標衡量既不全面,也不能夠真實反應公司的財務狀況,因此,本文選擇了兩個指標:ROA(總資產收益率)、ROE(凈資產回報率)共同衡量上市公司財務業績。ROE(凈資產回報率):是衡量公司財務業績的重要指標之一。
它能夠全面地反映企業的整體權益情況,該指標越高代表投資帶來的收益越大;ROA(總資產收益率):反映公司在一定時期內扣除非經常性損益后的盈利能力,側重衡量企業整體資產的盈利能力,具有很強的代表性。該指標越高,表明公司資產利用效果越好,說明公司資產獲利能力越強;
2.可讀性(readability)。刻畫MD&A可理解性最貼切的指標是可讀性。各國學者通過大量實證研究得出一致的結論:年報信息突出特征在于專業性較強,語言理解難度高于信息使用者的認知能力[25]。而這正是由于大量運用財務會計術語導致年報專業性強、信息的表述方式和閱讀程度不一定被大多數信息使用者所接受和理解[26],從而導致MD&A信息傳遞效率不高[27]。管理層在撰寫時,有目的的設計MD&A行文用詞,以此影響MD&A信息傳遞效率。當管理層預計未來業績好時,MD&A語言可讀性高,更容易被信息需求者所理解,能夠更有效的傳達公司未來經營情況;反之亦然。
3.業績自利性歸因(self-serving attribution)。MD&A無偏性可以通過業績自利性歸因從反面衡量。業績自利性歸因是指:當業績表現好時,管理層將盈利歸功于自身,當業績表現差時,管理層將虧損歸因于經濟環境[28]。上市公司管理層在撰寫年報時,試圖控制披露內容和披露的形式,以掩蓋或夸大某些事項,操縱外部投資者對公司的印象,影響利益相關者的決策。MD&A信息應該具備如實反映,不偏不倚(美國財務概念框架,1978;IASB,2005)。可是嚴重的自利性行為會在客觀上損害公司年報信息的無偏性。MD&A自利性程度越大,MD&A語言越有偏;反之亦然。
孫蔓莉(2012)通過將業績歸因劃分為UI(績優,內部歸因)、DE(績差,外部歸因),UE(績優,外部歸因)和DI(績差,內部歸因),設計業績自利性歸因指數SSAB衡量上市公司業績自利性歸因程度。因而本文借鑒業績自利性歸因指數,通過改進衡量MD&A無偏性。
4.匹配信息密度(density)。MD&A可驗證性可以通過匹配信息密度衡量。信息密度能夠度量信息披露詳略程度[29-30],本文提出匹配信息密度是指單位信息量中MD&A“公司未來發展展望”披露的經營工作計劃與“公司經營情況”披露的公司核心競爭力相匹配的信息量,通過匹配信息密度衡量匹配信息的詳略程度。當MD&A“公司未來發展展望”中披露的經營工作計劃與“公司經營情況”中披露的公司核心競爭力匹配程度越高時,MD&A匹配信息密度越大,說明管理層對公司的核心競爭力識別的越準確、了解的越清楚;反之,當MD&A“公司未來發展展望”中披露的經營工作計劃與“公司經營情況”中披露的公司核心競爭力匹配程度越低,MD&A匹配信息密度越小,越說明管理層對公司的核心競爭力認識模糊,了解不清楚。
5.自我指涉度(self-reference)。MD&A顯性表述真誠性可以通過自我指涉度度量。不同的語言表述方式導致信息傳遞效果大相徑庭,管理層運用“我的信息”比一般的語言表述更加能夠傳遞情感傾向,能夠更加有效地溝通情感[31]。因而本文通過“我的信息”度量自我指涉度。在MD&A中“我的信息”包括“我們”、“我公司”、“我們公司”等類似的詞匯,它體現管理層對公司的自我認知,反應管理層努力程度。
6.前瞻性深度(depth)。可以通過前瞻性深度衡量MD&A隱性表述真誠性。信息深度能夠衡量信息披露質量,反應披露的深入程度[32]。前瞻性信息是MD&A核心內容之一,是站在管理層的視角描述未來發展趨勢的重要信息(CICA,2001)。正是由于前瞻性信息如此重要,管理層披露前瞻性信息時一定別具匠心,充分展示企業核心競爭力以及特色之處,言辭之間必然流露管理層的情感。當預計未來業績好時,管理層會大量運用程度副詞,言辭更加具有感染力,能夠高效率的傳遞公司未來經營情況;反之,當預計未來業績差時,管理層會較少的運用程度副詞,而MD&A語言嚴謹而程序化,導致會較差的傳遞公司未來經營情況。故本文通過前瞻性深度衡量管理層對于未來發展的情感態度,從而反映管理層披露前瞻性信息的深入程度。
7.控制變量。銷售凈利潤(ROS):衡量資產運營效率的重要指標,企業在擴大銷售的時候,費用也在增加,故利潤率不一定會增加,但是銷售凈利潤是衡量企業實現凈資產效率最大化的標準。當企業銷售凈利潤增加,說明企業成長性越好,企業價值的增長能力越高,因而可以通過銷售凈利潤衡量企業價值增長能力;資產周轉率(Asset Turnover):衡量企業運營效果的最重要指標,當企業資產運營效率越快,資金利用效率越好,企業成長性越好,發展前景越良好,企業價值越高;鑒于財務指標具有繼承性,許多上市公司業績受到上一年度影響,故本文采用前一年度的銷售凈利率和前一年度總資產周轉率;總資產變化百分比(%△Asset):能夠衡量企業本期資產規模的變化情況,是企業發展的重要衡量指標,當總資產增加會引起會計收益增加,企業價值也會相應增加。凈利潤變化百分比(%△Income):衡量企業經營效益的重要指標,當企業凈利潤正向增加時,企業經營成果好,企業價值越高;反之亦然。速動比率(Quick):衡量企業績效的重要指標,反應企業流動資產變現償還債務的能力,速動比率越高,企業資產流動性越快,企業價值也相應增加。

表1 變量定義
隨著IT技術的迅猛發展,文本信息也在以爆炸式速度增長、傳播和累積。MD&A語言信息也不例外,傳統的人工閱讀效率低下,計算機語言、自然語言理解和文本挖掘技術的結合正在有效的改善這一現狀。信息抽取是文本挖掘技術的重要研究方向之一,即通過自然語言處理方法將大量繁復而非結構化的文本提取成機器可讀的結構化文本,特別是從文本中抽取和識別用戶感興趣的實體、事件、實體關系[33]。通過結構化的形式儲存文本信息,為后續研究發展服務[34]。MD&A語言特征是幫助信息需求者了解公司過去和現在并預測未來的重要材料,但是人工提取效率低,判斷標準難以統一,因而驅動我們采用文本挖掘技術提取MD&A語言特征。
一般來看,文本特征詞的計算方法主要依賴于計算機信息抽取算法,本文是以2010年188家上市公司MD&A報表為載體,依據MD&A語言表達的特點,利用觸發機制、繼承機制和選擇機制和映射原理,設計了一種基于MD&A語言特征抽取算法—包括財務專業術語特征、業績歸因特征、匹配信息密度、自我指涉度、前瞻性深度五種MD&A文本特征,結果證明該算法能夠有效的抽取目標信息。具體處理流程如下。
1.領域本體的構建。本文討論的是MD&A文本特征詞,涉及的領域本體包括財務專業術語本體、業績歸因本體、“我的信息”本體、程度副詞本體。(1)以2006年《企業會計準則應用指南》財務會計術語為基礎建立財務專業術語詞典;(2)手工收集2008年、2009年上市公司年度報告中MD&A的業績歸因解釋,對提及的原因解釋進行分類確定分類標準創建業績歸因詞典;(3)結合MD&A“公司未來發展展望”中披露的經營工作計劃建立戰略計劃詞典;(4)結合“公司經營情況”中披露的公司核心競爭力建立核心競爭力詞典;(5)以MD&A全部內容為基礎建立“我的信息”詞典;(6)結合2009年度CNKI創建的情感詞典以及經整理分析提取的新表述方式,在此基礎上建立程度副詞詞典。
2.文本預處理。首先將MD&A從整篇年度報告中截取出來縮減信息抽取程序的檢索范圍,提高工作效率。語言模塊的截取通過標定“董事會報告”字段的下標實現,自定義函數為Extractpart(董事會報告),其次本文基于通用詞典(內置于分詞器中)和專用詞典(即財務專用術語詞典、業績歸因詞典、戰略計劃詞典、核心競爭力詞典、“我的信息”、程度副詞詞典)使用JE分詞器對文本進行分詞處理。考慮到我們是要對MD&A表述方式語句進行處理,因而需要通過函數“replace(′。′,′識符tag′)和replace(′;′,′標識符tag′)”識別冒號和分號,實現對句子進行劃分。
3.信息抽取。本文采用了信息抽取方法提取出可能表達2010年創業板公司報告期MD&A語言特征的語句,包括財務術語信息、業績歸因信息、“我的信息”、程度副詞信息。本文采用觸發機制篩選可能表達創業板上市公司在報告期內包財務專業術語含義的句子、業績歸因含義的句子、“我的信息”、程度副詞信息。設觸發器為(Tvector),Tvector=(m1,m2,…,mt)為財務專業術語觸發器(依次包括業績歸因關鍵詞觸發器、“我的信息”關鍵詞觸發器、情感傾向關鍵詞觸發器),通過財務專業術語(業績歸因關鍵詞、“我的信息”關鍵詞、“情感傾向”關鍵詞)的存在作為提取信息的依據之一。通過篩選含有觸發器的句子S,提取該句子。

本文采用雙觸發機制篩選可能表達創業板上市公司在報告期內含有匹配信息密度的語句。
設雙觸發器為(Tvector),Tvector=(m1,m2,…,mt)為研究MD&A“公司經營計劃”中披露核心競爭力關鍵字觸發器,通過公司核心競爭力關鍵詞的存在作為提取信息的依據之一;S1為MD&A中“公司未來發展展望”中含有觸發器的經營計劃句子,S2為MD&A中“公司經營情況”中含有觸發器的公司核心競爭力的句子。
首先篩選含有觸發器的句子S1、S2,然后根據抽取公式,計算句子與觸發器的相似度,如果相似度大于制定的閾值,則提取該句子。計算公式如下:

通過MD&A信息抽取技術,我們提取出含有財務專業術語的句子、業績歸因的句子、匹配信息的句子、“我的信息”的句子、前瞻性信息中含有程度副詞的句子,為度量MD&A語言特征指標提供基礎。
為了檢驗本文提出的研究假說,我們建立了如下的回歸模型,其中α為截距項,ε為殘差項,βi為回歸系數。本文選用財務業績衡量;
performanceii=α0+β1Readablityit+β2Self-servingattributionit+β3Selfreferenceit+β4Densityit+β5Depthit+β6Quickit+β7Rosit-1+β8Turnit-1+β9%VAssetit+β10%VIncomeit+ε
(1)
我們考察了可讀性(Readability)、業績自利性歸因度(Self-serving attribution)、匹配信息密度(Density)、自我指涉度(Self-reference)、前瞻性深度(Depth)的相對變化情況以及各變量的描述性統計結果。如表2所示,可讀性、業績自利性歸因、匹配信息密度、前瞻性深度2010年與2011年披露情況還是有較大的變化。但是自我指涉度變化情況不明顯。這可能說明管理層經過深思熟慮之后才披露相關信息,語言特征不是一成不變,是根據公司實際情況和需要,向投資者提供個性化的語言特征。
從表2可以看出,2010年188家樣本公司就可讀性而言,最大值0.193,最小值0.029,均值為0.16,而標準差為0.2696,這說明2010年樣本公司披露MD&A可讀性程度普遍不高,而且公司之間披露語言文字的可讀性較不穩定。就業績自利性歸因而言,最大值1.0000,最小值-0.925,均值為0.348,標準差為0.448,這說明樣本公司2010年披露MD&A業績自利性歸因存在嚴重的自利性傾向。就匹配信息密度而言,最大值為0.268,最小值為0.00,均值為0.087,標準差為0.045,樣本公司2010年前瞻性披露情況不佳,存在小部分企業沒有披露前瞻性信息,但是前瞻性信息是展示企業經營效果中最重要的非財務信息,在預測公司發展前景時舉足輕重,因而公司差異化披露前瞻性信息密度很可能帶來不同的經濟后果。自我指涉度無論是均值、最大值、最小值、標準差都偏小,這說明僅有少數企業運用自我指涉這一語言特征。前瞻性深度的最大值0.588,最小值0.003,均值0.198,標準差為0.076。盡管MD&A語言信息披露是需要遵照《公開發行證券的公司信息披露內容與格式準則第2號<年度報告的內容與格式>》,但是語言信息本身靈活而復雜,披露MD&A前瞻性深度表現出不同的情感強烈程度,因而最大值遠遠高于最小值。

表2 描述性統計結果
本文運用加權最小二乘法(WLS)對方程進行回歸分析,為了避免異方差影響實證結果準確性,賦予各個變量回歸殘差的標準差為權數。有關結果如表3-表5所示:
初步從統計結果來看,表3揭示了MD&A可讀性(Readability)、業績自利性歸因(Self- serving attribution)、匹配信息密度(Density)、前瞻性深度(Depth)對預測公司未來的總資產收益率(ROA)、凈資產回報率(ROE)有顯著的輔助作用。從表3可以看出MD&A可讀性回歸系數在第二期和隨后的兩期呈現出顯著正相關(在5%程度上顯著),這說明MD&A可讀性與未來公司財務業績具有很高的正相關性,假設一得到了驗證。當MD&A語言特征通俗易懂時,信息需求者能夠獲取大量有關公司價值的信息,預計公司未來發展趨勢不錯;當MD&A語言特征晦澀難懂時,管理層試圖掩蓋公司所面臨的問題,撰寫MD&A時有意識的運用復雜的專業術語,通過加大閱讀難度影響讀者的理解能力,信息需求者無法獲得公司相關價值,預計公司未來發展趨勢不佳。
MD&A業績自利性歸因度與未來財務業績具有很高的負相關性(在5%程度下顯著),而且回歸系數在逐年增大(從第二期的-0.00688到第四期的-0.01696),這說明MD&A業績自利性歸因預測未來業績的作用也逐年增加,假設二得到驗證。MD&A業績自利性歸因越高,說明管理層操縱信息程度越高,更多地掩蓋管理層的糟糕經營能力或者夸大了公司治理水平,表示管理層隱瞞自身真實經營能力,因而預計未來公司業績不佳;相反,當MD&A業績自利性歸因越低,更加真實的體現管理層的經營能力,表示管理層希望客觀的信息披露提高“聲譽水平”,預計未來公司業績不俗。

表3 MD&A表述特征與公司ROA的回歸結果
MD&A匹配信息密度與隨后3個季度的財務業績回歸系數也是十分顯著的,假設三得到了驗證。在10%的顯著性程度下,回歸系數分別為0.05510、0.08456、0.13523。本文認為,這可能是因為管理層只有清楚自身的核心競爭力,才能夠向信息需求者傳遞匹配度高的信息,判斷管理層經營能力強。當管理層對自身核心競爭力定位十分模糊的,無法傳遞匹配度高的信息時,判斷管理層經營能力弱。與此同時,當管理層對未來趨勢、事件或者不確定因素的預測不確定性較強時,管理層也很少不愿意過多的披露前瞻性信息[35]。
MD&A自我指涉度(Self-reference)與未來財務業績(包括ROA、ROE、SGR)關系很不顯著,而且隨著時間的推移,不顯著程度越來越明顯。這可能一方面是因為中西文化的差異,西方企業較東方企業在語言表述時,更加傾向于自我提升。Kaibin Xu(2011)研究中美企業披露信息差異時,證實一方面可能因為美國上市公司比中國上市公司,更加傾向于將業績上升歸結為內部原因信息,因而語言表述較少涉及公司自身,也會較少的運用“我的信息”等自我指涉表述方式;另一方面可能因為我國上市公司尚未充分意識到“我的信息”表述方式能夠提高言語交流有效性,運用程度不高[36]。
從模型(1)也可以看到,前瞻性信息深度的系數與未來財務業績相關性很顯著,并且系數為正,因此驗證了假設五,即前瞻性深度越強,公司未來財務業績越好。Lyons(1977)認為,說話人在說出一段話的時候同時表明自己對這段話的立場、態度和感情,從而在話語中留下了自我的印記。因而本文認為,管理層試圖通過MD&A與信息需求者之間溝通、交流時,或多或少也會表明自己的立場、態度和感情[37]。
本文之前是從言語表述的各個子指標分別衡量言語有效性與未來財務業績的相關性,但是言語行為在交際中并不是孤立的、逐個的向信息使用者傳遞有效信息,反而是融合為一個整體,共同產生語言力量影響信息使用者,因而很有必要分析言語整體有效性與未來財務業績的相關性。分析言語整體有效性時需要考慮每個子指標的相對重要程度,而表示重要程度最直接和最簡單的方法就是給各個指標賦予權重。利用熵的原理確定評價指標權重大小具有科學性和精確性。按照熵的思想,熵值是度量系統狀態或信息源不確定性程度的重要尺度,即可以通過熵值度量信息量多寡。當熵值越大,不確定性越高,提供的信息量越少;反之亦然。

各指標的熵權大小反應語言特征提供有用信息量的多寡。語言特征中某一指標的熵權越大,說明該指標能提供有效的信息越少,該指標在同等情況下越不能影響言語有效表述。對各維度所包含指標要素的熵權進行相加,即可得到各維度的熵權。在回歸模型中,可讀性(Readabilityit)衡量可理解性(Comprehensiveit);業績自利性歸因(Self-servingattributionit)、匹配信息密度(Densityit)共同衡量真實性(Truthit);自我指涉(Selfreferenceit)、前瞻性深度(Depthit)共同衡量真誠性(Sincerityit)。因而見表4可知,可理解性指標權重是可讀性指標權重,真實性指標權重是業績自利性歸因權重(業績自利性歸因是從反面衡量MD&A語言無偏性,因而在計算熵權時按其負值進行求解,并且業績自利性歸因權重與匹配信息密度權重正向相加)與匹配信息密度指標權重之和,真誠性權重為自我指涉度權重與前瞻性深度權重之和。

表4 言語表述特征熵權
performanceij=α0+β1Comprehensiveit+β2Truthit+β3Sincerelyit+β4Quickit+β5Rosit-1+β6Turnit-1+β7%VAssetit-1+β8%VIncomeit+ε

(2)
哈貝馬斯明確指出:語言交流過程中,有效性交流需要言語者在表述時傳遞有效的信息作為支撐。即言語者必須借助他的表達隱含的但是準確的提出3種有效表述要求。鑒于表4的實證結果顯示,自變量對未來財務業績的總體解釋度都在97%以上,模型的F值在5%以上顯著。實證結果表明,管理層運用言語表述特征傳遞公司相關價值信息,但是語言傳遞是一個互相聯系的統一體,離開整體分析各個指標只能說明管理層存在運用該種言語表述特征,是傳遞信息過程中的有效組成部分,但是分析研究還需要從語言整體來把握。管理層通過整合各種言語表述特征,系統的傳遞公司相關價值。管理層綜合運用各種言語表述特征的水平越高,越能夠傳遞公司相關價值,越能夠預測公司未來業績;反之,則無法預測公司未來業績。
本文以信號傳遞理論為基礎,按照哈貝馬斯言語有效理論,提出MD&A五種語言特征測度指標,包括MD&A可讀性、業績自利性歸因、匹配信息密度、自我指涉度、前瞻性深度,實證檢驗MD&A語言特征與未來公司財務業績相關性。研究發現,①當預計未來業績理想時,管理層希望運用恰當的表達方式向市場傳遞更多有關公司價值的信號。因而MD&A表述會更加容易表現出如下語言特征:MD&A語言信息更加容易理解,業績歸因解釋更加客觀可靠,“公司未來發展展望”中披露的經營工作計劃與“公司經營情況”中披露的核心競爭力匹配程度越高,前瞻性信息情感越積極。反之,當預計未來業績不理想時,管理層會弱化這些表述方式,從而更少的傳遞公司自身真實的經營業績狀況。②研究結果發現,MD&A語言特征中自我指涉度與公司未來財務業績相關性并不是很顯著。這可能是因為一方面中西文化的差異,盡管國外已經有企業運用自我指涉度傳遞公司信號,但是中國企業在披露業績歸因時,自利性程度低于西方企業,因而較少的會運用“我的信息”等自我指涉表述方式;另一方面中國企業更傾向于運用業績自利性歸因、可讀性等較為成熟的、信息傳遞效果明顯的語言表述方式。③管理層傳遞公司信號時并不是孤立的、抽象的運用某一種語言特征,反而是通過整合各種語言表述特征,系統性的傳遞公司相關價值。
基于上述結論,本文可從企業、政府和學術研究3個層面提出推進上市公司文本披露信息的分析和應用的政策建議:
1.企業層面:關注信息披露的語言表述因素,提高信息傳遞效果
語言文字是上市公司披露企業經營狀況信息的載體、公眾交流的工具,由于語言本身具有復雜性、多義性及情態意識的隱含性,使得不同語言表述形式特征傳達出管理層不同的經營管理理念和意圖。在資本市場上,MD&A是上市公司信息傳遞的重要載體,是信號傳遞的重要媒介。本文的研究發現,上市公司MD&A的語言表述特征會影響上市公司信息傳遞效率,從而影響上市公司在資本市場的表現。因此,上市公司可依據自身的經營狀況,策略性的選擇文本信息表述形式,構建目標導向的信息披露策略,通過言語有效的信息披露方式,向市場有效傳遞企業信息,提高信息傳遞效率,從而更好地獲得經濟利益或者政治利益。
2.政府層面:完善信息披露監管政策,提高信息披露質量
MD&A含有大量增量信息,但是研究中發現一些上市公司的MD&A信息難以讀懂或者仍然存在嚴重的自利性,從而影響MD&A言語有用性,降低了資本市場信息傳遞效率。實證檢驗表明,上市公司MD&A語言特征存在顯著的差異性,未來業績不錯的上市公司語言特征豐富;未來業績糟糕的上市公司語言特征不足。正是由于我國上市公司信息披露還存在許多缺陷,因而很有必要從語言特征探究上市公司信息披露策略,據此進行政策設計,有效引導和規范上市公司信息披露行為,提高資本市場整體信息披露質量。同時,考慮到提高信息可靠性的要求,證券監管方應積極推進上市公司MD&A信息披露評價體系的建立,鼓勵第三方機構從語言特征分析公司信息披露質量,對MD&A信息披露質量進行監管,促使公司不斷改進自身的MD&A信息披露質量。
3.學術研究層面:鼓勵深入研究信息披露語言特征
(1)構建MD&A語言特征分析體系,提高信息獲取能力。MD&A語言信息對于投資者而言是十分重要的,可是MD&A語言復雜而靈活多變,真正能夠“讀懂”管理層隱含信息的人群相對較少,而且分析MD&A語言信息的工具不多,因而很有必要深入研究MD&A語言特征,運用文本挖掘技術,構建MD&A語言特征分析體系,從大量MD&A語言信息中發現并提取的有用信息,幫助信息需求者尋找語言數據間潛在的關聯,發現被忽略的要素,而這些要素信息對預測趨勢和決策行為是十分關鍵的。
(2)構建MD&A語言特征分析體系,形成信息的專業渠道。實證結果顯示,MD&A語言信息特征與公司未來財務業績存在顯著的相關性,具有極強的有用性,但是研究還需進一步深入,迫切需要形成信息專業渠道,提取信息需求者感興趣的信息。顯然,高校和科研機構為深入挖掘相關信息提供了可能性。MD&A語言特征分析體系可以借助高校和科研機構的數據資源單獨構建,也可以申請國家項目輔助構建。鼓勵政府或者專業機構投資構建MD&A語言特征分析體系,全面促進MD&A語言特征分析體系的建立。
參考文獻:
[1] SUBRAMANIAN R, INSLEY R G, BLACKWELL R D. Performance and readability: a comparison of annual reports of profitable and unprofitable corporations[J]. Journal of Business Communication, 1993, 30(1): 49-61.
[2] LANG M, LUNDHOLM R. Cross-sectional determinants of analyst ratings of corporate disclosures[J]. Journal of accounting research, 1993, 31(2): 246-271.
[3]孫蔓莉,王竹君,蔣艷霞. 代理問題、公司治理模式與業績自利性歸因傾向——基于美、中、日三國的數據比較[J]. 會計研究,2012(1):68-74.
[4]MATSUMOTO,MATSUMOTO D, PRONK M,et al.Conference call disclosures and firm performance: An empirical analysis of the length and content of earnings-related conference calls[J].Working Paper, 2007, 17(2).
[5] BAUMEISTER R F, BRATSLAVSKY E, FINKENAUER C, et al. Bad is stronger than good[J]. Review of general psychology, 2001, 5(4): 323.
[6] HACKAM D G, KHAN N A, HEMMELGARN B R, et al.The 2010 canadian hypertension education program recomm- endations for the management of hypertension: part 2-therapy[J]. Canadian Journal of Cardiology, 2010, 26(5): 249-258.
[7] LI F. Annual report readability, current earnings and earnings persistence [J].Working Paper, 2006, 105(1).
[8]薛 爽,肖澤忠,潘妙麗. 管理層討論與分析是否提供了有用信息?——基于虧損上市公司的實證探索[J]. 管理世界,2010(5):130-140.
[9] JOHNSON M F, NELSON K K, PRITCHARD A C. Do the merits matter more? The impact of the Private Securities Litigation Reform Act[J]. Journal of Law, Economics, and Organization, 2007, 23(3): 627-652.
[10]MARK Cecchini, HALDUN Aytug, GARY J Koehler,et al.Making words work: Using financial text as a predictor of financial events[J].Decision Support Systems,2010,11(1).
[11]郝媛媛,葉 強,李一軍. 基于影評數據的在線評論有用性影響因素研究[J]. 管理科學學報,2010(8):78-88.
[12]DELLAROCAS C, ZHANG X M, AWAD N F. Exploring the value of online product reviews in forecasting sales: The case of motion pictures[J]. Journal of Interactive marketing, 2007, 21(4): 23-45.
[13]SEN S, LERMAN D. Why are you telling me this? An examination into negative consumer reviews on the web[J]. Journal of interactive marketing, 2007, 21(4): 76-94.
[14]GHOSE A, IPEIROTIS P G. Designing novel review ranking systems: predicting the usefulness and impact of reviews[C]//Proceedings of the ninth international conference on Electronic commerce. ACM, 2007: 303-310.
[15]HABERMAS J. The theory of communicative a ction [M]. Boston: Beacon Press, 1984. 47-51.
[16]閻達五, 李 勇. 也談美國會計造假事件[J]. 會計研究, 2002 (9): 3-6.
[17]唐躍軍. 審計收費, 審計委員會與意見購買——來自 2004—2005 年中國上市公司的證據[J]. 金融研究, 2007 (4A): 114-128.
[18] 李常青, 王毅輝. “管理層討論與分析” 研究述評 [J]. 廈門大學學報: 哲學社會科學版, 2007 (5): 20-25.
[19]沈家煊. 我看漢語的詞類興[J]. 語言科學, 2009.
[20]李鋒森, 李常青. 上市公司 “管理層討論與分析” 的有用性研究[J]. 證券市場導報, 2008(12): 67-73.
[21]URMSON J O. tractatus logico-philoso- phicus-german-pears, df, mcguinness, bf[J]. 1963, 27(5):41-52.
[22]李秋楊, 陳 晨. 漢語量詞 “把” 的認知研究[J]. 長江學術, 2010 (2): 131-137.
[23] YUTHAS K, ROGERS R, DILLARD J F. Communicative action and corporate annual reports[J]. Journal of Business Ethics, 2002, 41(1/2): 141-157.
[24]雷 卿. 話語含意推導的心理模型分析——以隱喻為例[J]. 三峽大學學報:人文社會科學版,2008(5):103-106.
[25]孫蔓莉. 上市公司年報的可理解性研究[J]. 會計研究,2004(12):23-28.
[26] COURTIS J K. Annual report readability variability: tests of the obfuscation hypothesis[J]. Accounting, Auditing & Accountability Journal, 1998, 11(4): 459-472.
[27] ADELBERG A H. Narrative disclosures contained in financial reports: means of communication or manipulation?[J]. Accounting and Business Research, 1979, 9(35): 179-190.
[28] MCKINSTRY S. Designing the annual reports of Burton plc from 1930 to 1994[J]. Accounting, Organizations and Society, 1996, 21(1): 89-111.
[29]VOLKAN Muslu, SURESH Radhakrishnan,SUBRAMANYAM K R,et al.Causes and consequences of forward looking disclosures in the Management Discussion and Analysis(MD&A) [J].The International Journal of Accounting,2008,61(4):77-83.
[30] BERETTA S,BOZZOLAN S. A framework for the analysis of firm risk communication[J]. The International Journal of Accounting, 2004, 39(3): 265-288.
[31]SHAMPINE L F, GORDON M K. Computer solution of ordinary differential equations: the initial value problem[M]. San Francisco: Freeman, 1975:60-67.
[32] BERETTA S, BOZZOLAN S. A framework for the analysis of firm risk communication[J]. The International Journal of Accounting, 2004, 39(3): 265-288.
[33]GRUBER T R. A translation approach to portable ontology specifications, KSL92-71[R].San Francisco: Knowledge Systems Laboratory of Stanford University, 1993:36-39.
[34]蔣艷輝,姚靠華,周雙文,等.一種基于領域本體的藥品研發信息抽取方法[J]. 情報雜志,2012(12):130-134,64.
[35]VERRECCHIA R E. Information quality and discretionary disclosure[J]. Journal of Accounting and Economics, 1990, 12(4): 365-380.
[36]XU K. An empirical study of confucianism measuring Chinese academic leadership[J].Management Communication Quarterly, 2011, 25(4): 644-662.
[37]LYONS J.Semantics [M]. Cambridge: Cambridge University Press, 1977:77-87.