李程 李聰












摘? ?要:為了解決現有財務風險預警模型中指標大量冗余相關性高、實時分析能力差以及忽略財務文本信息的問題,提出一種管理層語調視角下的財務風險預警模型。選取2016—2020年276家上市公司作為研究樣本,從五個維度篩選了財務數據指標后,對企業財務年報中的前瞻性信息進行中文分詞處理并根據常用情感詞典計算其語調,并加入財務指標,利用因子分析降維,消除指標冗余和其間的相關性,提取出少量共性因子,最后采用支持向量機構建風險預警模型。結果表明,五維指標體系與因子分析所得的共性因子具有較強的一致性,證明了因子分析的經濟意義可解釋性。同時,結合財務文本信息可以有效提高財務風險預測的準確率,驗證了財務文本對風險預警模型的有效性。
關? 鍵? 詞:管理層語調;上市公司;風險預警;財務風險
中圖分類號:F832.5? ? ?文獻標識碼:A? ? ?文章編號:2096-2517(2022)01-0061-11
DOI:10.16620/j.cnki.jrjy.2022.01.007
一、引言
隨著經濟全球化進程的快速發展和上市公司之間競爭的激烈化,企業在經營過程中背負著巨大的財務風險和不確定性,進而可能導致財務危機的發生。在市場經濟中,財務風險對于每一家公司的投資者和經營者來說無處不在。截至2020年年底,國內因為發生財務危機而被ST處理的上市公司就高達272家。被ST或ST*處理的公司,不僅會給投資者帶來巨大的經濟損失,同時也會使上市公司背負較大的運營、生產壓力,隨時都有退市的可能性。
但一般而言,企業的財務危機和破產并不是突然發生的,而是一個循序漸進的過程。在危機的萌芽階段,公司某些局部的財務危機和困難都會在一定程度上暴露,而這種異常在一些財務數據指標上可以體現,并被廣泛用于財務預警。建立高效、準確的預警系統可以在風險發生的早期就向公司管理層發出警報,有助于上市公司實時應對導致其財務狀況惡化的問題,及早消除危機。此外,智能的預警系統還能輔助投資者做出正確的投資決策,有利于信貸風險的防控。因此,精確預測上市公司的財務危機,有效防范金融風險,最大限度地避免金融危機的再度發生,一直是世界各國關注的焦點,具有重要的現實意義。如何建立一套實時、準確的金融風險預警體系一直是國內外學者的重點研究方向,在財務數據指標的選取和模型建立的方法等各個方面取得了出色的成果[1-4]。
20世紀60年代,國外對財務危機預警的研究基于一定的會計信息和統計理論,取得了一定的成果并廣泛應用于實際。如Altman(1968)通過分別對美國20年間的破產公司和正常盈利公司的模式進行深度挖掘后提出的利用財務指標來判斷危機的Z值模型,與設定的閾值對比即可判斷上市公司的財務危機程度[5],但其適用范圍比較狹窄,只能對制造業相關的上市公司進行預測。Beaver(1966)提出了單變量模型,在對財務風險進行預測時選擇了5對財務指標做線性回歸分析,并發現模型結果與現金流動負債比率具有較高的相關性[6],但過于依賴簡單的線性回歸模型并不能對復雜數據做出準確的擬合,一般來說模型處于欠擬合狀態,無法得到較高的預測準確率。
財務危機的判定是一個典型的二分類問題。因此,隨著人工智能和機器學習的迅速發展,涌現出了一批采用機器學習的分類方法對公司財務風險進行研究的學者。比如,文柯(2012)利用Logistics回歸模型構建了我國企業產融結合風險預警模型,并揭示了企業償債能力、盈利水平和營運能力與企業產融結合后發生財務危機的關系[7]。張琳等(2021)利用Logistic模型探究企業ESG表現在債券信用風險預警中的應用[8]。谷慎等(2019)利用支持向量機以我國的碳金融試點市場為研究樣本,構建了風險預警模型[9]。但上述研究中,無論是早期的單變量分析和多變量分析法還是近年來的機器學習方法,均存在一個共同的缺陷,都僅以定量數據為基礎, 而忽略了定性的財務文本信息。
自然語言處理(Nature Language Processing,NLP)和文本分析的迅速發展,為分析財務文本中的語調提供了不可或缺的幫助。情感語調是文本信息語言的重要特征之一。依據心理學效應,文本中正向的情感語調會激發接收者聯想積極、正面的信息,而負向語調則向接收者傳遞消極、負面的信息。類似的, 財務年報作為上市公司的重要文本信息,其管理層討論與分析(Management Discussions and Analysis,MD&A,以下簡稱MD&A)部分語調的走向對于財務風險預警具有一定的參考意義。MD&A文本由董事會回顧和未來展望兩部分內容組成,而未來展望信息具有一定的前瞻性,對風險發生的預測具有互補性的作用。謝仁德等(2015)基于上市公司年度業績說明會的相關文本,對管理層語調和公司業績的關系進行研究,結果顯示二者呈顯著正相關關系[10],這對投資者挖掘和利用文本信息具有重要意義,揭開了國內學者對財務文本語調研究的序幕。劉逸爽等(2018)對公司財務年報文本進行分詞后根據常用情感詞典計算文本語調,并結合公司的財務指標,利用logistics回歸、SVM等機器學習方法證明了文本信息語調對財務危機預警的有效性[11]。
已有的研究為財務危機預警提供了新的視角,引入了語調分析方法,但其研究中加入了大量的財務數據指標,而財務指標之間通常具有較強的相關性,導致嚴重的數據冗余,給公司財務預警系統的實時計算帶來了較大的難度和較高的算力成本,甚至還會降低模型預測的準確率。
綜上所述,為解決現有風險預警模型中指標大量冗余、相關性高以及忽略財務文本信息對于企業破產預測效用的問題,并進一步提高模型預測的準確率, 本文首先從五個維度初步選取財務指標,并對樣本公司的財務年報MD&A部分進行中文分詞,參考常用金融情感詞典計算管理層語調,并考慮單獨加入負向詞頻比率的影響,最后融合財務指標和管理層語調進行因子分析,剔除冗余信息并壓縮數據,提取出少量共性因子,采用支持向量機來構建風險預警模型, 并與未壓縮的模型進行對比。
二、研究設計與指標選擇
(一)樣本選擇
對于上市公司出現財務危機的概念與定義,國內外研究者暫未形成統一的觀點,國內學者一般以上市公司因出現財務異常狀況被ST作為可能的財務風險標志[12]。由于上市公司的財務年報是在當前年度結束后的4個月內發布,因此該公司t-1年年報的發布與其在t年是否被ST處理是同時發生的,本文采納劉逸爽等(2018)的方法[11],模型輸入的數據均滯后兩期,即使用t-2年(2018年)的數據來預測該公司在t年(2020年)是否會因財務狀況異常被ST處理,使模型具有更強的風險預測能力。
本文選取2016—2020年A股全部上市公司中證監會2012版行業分類為制造業的ST公司,并采用樣本配比原則,即選擇行業相同、公司規模相近的非ST公司作為配對樣本。為保證實證結果的準確性,本文選取1:1和1:2兩種比例確定實證樣本中ST公司和非ST公司的數量進行實驗。剔除缺失數據的樣本后,確定ST公司共92家,健康公司(非ST公司)共184家,合計276家,并以7:3的比例劃分得到模型訓練集和測試集。
(二)財務指標的選取與定義
財務指標是指上市公司總結和評價其財務狀況和經營績效的相對指標。通過結合已有文獻和大量實驗的基礎上,本文的財務指標分別從上市公司的償債能力、經營能力、盈利能力、每股指標和現金流分析五個維度選取,包含流動比率(CURRENT)、速動比率(ACID)、現金比率(CASH)、資產負債率(LEV)、權益乘數(EM)、總資產周轉率(TAT)、營業利潤率(OPR)、息稅折舊攤銷前營業利潤率(OMBI)、總營業成本率(TOCR)、凈利潤增長率(NPGR)、營業總收入增長率(GROR)、固定資產增長率(IRFA)和每股凈現金流量(CPS),其定義如表1所示。
本文選取的財務指標均來源于CSMAR數據庫,為了避免離群點對本文實證分析的影響,對所有連續型財務指標均進行了上下1%的Winsorize處理,最終納入本文機器學習模型的有效年度財務指標觀測值為3588個。
(三)財務年報MD&A文本語調計算
Loughran等(2009)指出,管理層人員在金融文件中更專注于討論“公司責任”“社會責任”等類似主題的上市公司更有可能被貼上罪股的標簽,公司治理措施不當, 并在提交文件后的一年被起訴[13]。考慮到上市公司財務年報中MD&A部分能體現出管理層語調對公司持有一定程度的積極或消極態度,本文對此部分文本納入模型。本文上市公司財務年報均來源于新浪財經網,從中截取MD&A部分。在衡量一份金融文件的語氣或情感時,研究人員通常會計算與特定情緒詞列表相關的單詞數,并將其按文檔中單詞總數進行縮放。例如,文檔中較高比例的否定詞傾向于更悲觀的語氣。
Loughran等(2016)指出對金融文本的情感分析主要有兩種方法:機器學習法和詞袋法(Bag of Words)[14]。機器學習方法主要通過樸素貝葉斯(Na?觙ve Bayes)等分類算法對文本進行訓練以確定分類準則, 再應用于全樣本中進行預測,但其分類準則通常帶有一定程度的主觀性。而詞袋法依據情感詞典對文本情感進行正向和負向分類,在使用合適的情感詞典后可以基本避免主觀因素的影響。Connor等(2010)也認為通過詞袋法來分析小型文本的情感傾向尤為合適[15]。LM詞表相對全面, 一般來說,沒有常見的消極或積極的詞缺失;它的創建考慮到了財務溝通。因此本文參考LM詞典,將其作為衡量財務年報文本的基準,同時結合大連理工大學整理的情感詞典中的褒貶義詞, 通過Python的HanLP作為分詞工具對財務年報文本進行分詞處理后,進行正向和負向情感詞頻統計,在此采用歸一化的方法計算MD&A管理層語調Tone, 其計算公式如下:
Tone=? (1)
式中,Positive為上市公司財務年報MD&A文本中正向情感詞頻,Negative則為同一文本中的負向情感詞頻。可以看出,Tone的取值范圍在-1到1之間,且Tone的值越接近1,說明管理層語調越積極,反之則說明管理層的語調偏向消極態度。
同時,考慮到負向詞匯會披露更多的財務風險信息,本文將負向詞頻比率NEGR也納入到模型中訓練,其計算公式如下:
NEGR=(2)
綜上,本文構建了兩個衡量管理層語調的指標,整體指標體系中的變量,如表1所示。
三、財務困境預警模型的構建
國內外學者在財務困境預測的相關研究中,大多使用兩類方法,一是較為傳統的方法,如單變量模型、Altman多元回歸模型和Z值模型;二是基于機器學習中監督學習的分類算法, 如Logistics回歸、支持向量機、決策樹和AdaBoost等。而傳統的Altman多元線性回歸的回歸系數更適用于美國國情,若直接套用會造成某些財務指標畸變,導致分類預測精度較低。而機器學習的方法通常能學習到指標具有的特征,可以得到較高的準確率。因此,本文考慮使用機器學習的方法進行模型的構建和實證分析。
在選擇預警指標進行訓練的時候,可能會遇到較多冗余特征,隨著數據樣本量的不斷增大,模型訓練結果的精確度雖然會有小幅度提升,但同時帶來巨大的時間和算力成本,這在實際情況中是不現實且不被允許的。 因此本文對選取的16個指標使用因子分析,將高維的數據轉化為低維的數據后再次進行訓練,同時與直接使用支持向量機的模型進行對比。
(一)支持向量機
支持向量機(Support Vector Machine,SVM)是一種分類算法,它的基本模型是定義在特征空間上的幾何間隔最大的線性分類器, 而核技巧(kernel method)和軟間隔的引入,使其能夠很好地解決高維非線性分類問題,支持向量機在中小型樣本上具有尤佳的表現[16-17]。
在給定的訓練數據集T={(X1,y1),(X2,y2),…,(XN,yN),}中,待求解的最優分類超平面?仔由W·X+b=0確定。其中,W為特征學習出的權重矩陣,b為偏置,因此超平面可用(W,b)表示。分類超平面將特征空間劃分為正類和負類兩部分,其對應的分類決策函數為f(x)=sign(W·X+b)。
間隔(Margin)可以度量一個樣本點距離分類超平面的遠近,從而表示分類預測的確信度,引入超平面(W,b)關于訓練集T的函數間隔■和幾何間隔?酌分別為:
=min yi(W·Xi+b)
=?(3)
支持向量機考慮求解一個幾何間隔最大的分離超平面,具體地,可以定義為以下最優化問題:
s.t.(W·Xi+b)yi≥? (4)
其中,i=1,2,…,N。因為函數間隔的取值并不影響最優化問題的求解,因此假設=1。這樣一來,X到平面?仔的最大距離為?酌=1/‖W‖。注意到最大化?酌和最小化‖W‖2是等價的,因此得到等價的凸二次規劃問題:
WT·W
s.t.(W·Xi+b)yi≥1? (5)
為了求解該規劃問題,應用拉格朗日對偶性,為了方便求解該優化問題和自然地引入核函數,通過求解其對偶問題(dual problem)得到原始問題(primary problem)的最優解。具體地,引入Lagrange函數,對約束條件分別加入Lagrange乘子?琢i,即:
L(W,b,)=WT·W-i[yi(W·Xi+B)-1]
(6)
令其相應的偏導數為0,可以分別得到:
將求得的偏導數代回Lagrange函數后,求L(W,b,)對的極大,即是求解對偶問題:
求解此二次規劃問題,即可得到最優分類超平面。對于非線性分類問題的求解,首先需要對數據進行歸一化,利用核函數將樣本從原始空間映射到高維空間,使其線性可分。本文使用的函數為高斯徑向基函數:
f(x)=signiyi·exp-+b (9)
(二)因子分析
因子分析(Factor Analysis,FA)是指通過尋找多個可觀測變量相關矩陣的內部依賴關系,從中提取少數共性因子,從而將原始觀測變量表達為共性因子的線性組合的降維技術。因子分析在簡化大規模觀測變量系統、減少觀測變量維度的方面起到了至關重要的作用。利用公共因子代替原始觀測系統,使得因子之間代表的信息互不重疊,在一定程度上解決了數據冗余的問題[18-19]。
設要進行因子分析的原始觀測變量有m個,記為x=[x1,x2,x3,…,xm],n個樣本對應的觀測值為xik(i=1,2,3,…,n;k=1,2,3,…,m),記樣本協方差矩陣為:
sk=(xik-xk)(xik-xk)'=(sik) (10)
其中,xk=xik為樣本均值。
一般p的確定原則為累積貢獻率大于等于75%。
因子分析中的公共因子是不可直接觀測但又客觀存在的共同影響特征,每一個變量都可以表示成共性因子的線性表達及特殊因子之和,即:
X1=a11F1+a12F2+…+a1m Fm+i,X2=a21F1+a22F2+…+a2m Fm+i,…Xp=ap1F1+ap2F2+…+apm Fm+i? (11)
式中,F1,F2,…,Fm為Xi的共性因子,?著i為Xi的特殊因子。因此,因子分析的矩陣表達形式為:
簡記為:
其中,矩陣A稱為因子載荷矩陣,是第i個變量在第j個共性因子上的載荷,由主成分分析確定。
之后,由相關系數矩陣R得到特征值?姿j(j=1,2,3,…,m)及各個主成分的方差貢獻率、貢獻率和累計貢獻率,并根據累計貢獻率確定主成分保留的個數p。
如果共性因子有m個,則需要逐次對每兩個共性因子進行旋轉操作,也就是對每兩個因子確定的因子面正交旋轉一個角度,轉角需要滿足使旋轉后的因子載荷矩陣A總方差達到最大值,并得到因子得分。至此,因子分析的過程全部完成。
四、實證結果與分析
(一)指標的描述性統計與顯著性差異檢驗
為了確定ST公司和非ST公司之間是否存在顯著差異, 本文利用非參數檢驗中的Wilcoxon符號秩和檢驗(也稱Wilcoxon Mann-Whitney檢驗)來考察財務風險帶給兩類公司的差異性。若檢驗統計量顯著, 則說明該指標可以有效區分ST公司和非ST公司,反之則不能有效區分。
表2給出了本文確定的指標體系描述性統計和Wilcoxon符號秩和檢驗結果。 除了凈利潤增長率(NPGR)的Wilcoxon檢驗不顯著外,其余指標均較為顯著,可以很好地區分財務困境和財務狀況健康的上市公司。其中,現金比率(CASH)、總資產周轉率(TAT)、總營業成本率(TOCR)、管理層語調(TONE)和負向詞頻比率(NEGR)的Wilcoxon檢驗Z統計量均小于-5.39,說明這些指標對區分ST和非ST公司起到了至關重要的作用。由管理層語調的定義式可得,當其值大于0時,表明管理層對公司的語調基本呈現樂觀趨勢。實際計算出的管理層語調均值為0.5672,中位數為0.5763,兩者較為接近,說明選取的研究樣本均勻分布,且MD&A文本大多呈現出管理層較為樂觀的態勢。
(二)基于支持向量機的實證分析
本文將主要以預測準確率(accuracy)、第一類錯誤(Type I Error)、第二類錯誤(Type II Error)和AUC四個指標來衡量本文模型在財務風險預警中的作用, 模型測試集為樣本確定的92家上市公司。
在衡量指標中,AUC代表接收者操作特征曲線(Receiver Operating Characteristic Curve,ROC)下所圍成區域的面積,其x軸為負假陽率,y軸為真陽率,是評價二分類模型優劣的重要指標之一。ROC曲線對于正負樣本數量不平衡的模型具有很好的適應性, 考慮到本文采用了1:1和1:2兩種樣本比例, 因此將其作為評價指標。 隨機分類情況下的AUC值為0.5,AUC數值越接近于1, 說明模型的有效性越強。
表3給出了在兩種樣本比例下支持向量機模型的實驗結果。在加入管理層語調指標后,樣本比例1:1時,整體準確率都有一定提高,并較為顯著地降低了第一類和第二類錯誤發生的情況;樣本比例1:2時,模型的預測準確率有一定提升,而加入負向語調詞頻后,預測準確率從89.28%上升至96.43%,并顯著減少了第一類錯誤的發生,AUC也提升至90%以上,證明財務年報文本語調信息對預警起到重要作用。
(三)基于因子分析和支持向量機的實證分析
首先對初步篩選的16個指標利用因子分析進行降維后,再使用支持向量機進行財務預警模型的構建,以比較因子分析在復雜觀測系統中起到的克服相關性、重疊性的問題,并對比SVM模型的預測效果。
在進行因子分析前, 需要使用KMO和巴特利特檢驗判斷原始觀測系統之間是否存在相關性。表4給出了本文所選指標體系的KMO和巴特利特檢驗結果。其中,KMO值為0.612,大于經驗閾值0.6。同時, 巴特利特球形度檢驗的顯著性遠小于0.05,拒絕各觀測指標間獨立的假設,認為變量間具有較強的相關性。因此,檢驗的結果均表明本文構建的指標體系適合進行因子分析。
在進行因子分析的過程中,可以通過因子的總方差解釋表確定要選取共性因子的個數,該表需要計算各個因子的特征值、 貢獻率和累計貢獻率,表示各觀測指標中所含原始信息能被提取的共性因子所表達的程度,即變量信息被提取的占比,如表5所示。
由表5結果可以得出,前6個共性因子包含了原始觀測系統中75.053%的信息,累計貢獻率大于70%,滿足因子分析要求。從第7個共性因子開始,其包含的原始觀測系統信息逐漸減少, 后10個共性因子僅包含原始系統中不到25%的信息,因此可以放棄這10個因子, 利用前6個共性因子代替之前選取的16個觀測指標。
通過共性因子的碎石圖也可以判斷各因子對原始觀測系統的重要性,如圖1所示。橫軸代表共性因子的序號,縱軸代表其特征根大小。坡度越陡,對應的特征根越大, 表示該因子起到的作用越明顯。在因子分析中,一般選取特征根大于1的作為共性因子,因此碎石圖驗證了本文選取前6個共性因子的正確性。
由于在初始的因子載荷中,確定的6個共性因子的意義并不明顯,為了清晰地解釋各公共因子的經濟含義,需要對因子進行旋轉。表6展示了使用凱撒正太化方差最大化的正交旋轉所得到的因子載荷矩陣。
由表6可以看出, 第一共性因子在流動比率、速動比率、現金比率三個指標具有90%以上的載荷量,反映了上市公司的償債能力,因此第一共性因子可以定義為“償債因子”;第二共性因子在營業利潤率、 息稅折舊攤銷前營業利潤率兩個指標具有90%以上的載荷量, 反映了上市公司的盈利能力,因此定義第二共性因子為“盈利因子”;第三個共性因子在營業總收入增長率、固定資產增長率兩個指標具有95%以上的載荷, 反映了公司的規模狀況,因此定義第三共性因子為“規模因子”;第四個共性因子,在管理層語調和負向詞頻比率上的載荷量較高,因此命名為“管理層響應因子”;第五個共性因子在權益乘數、資產負債率上具有較高的載荷量,反映了上市公司的負債程度,因此命名為“負債因子”;最后一個共性因子在每股現金凈流量、總資產周轉率和凈利潤增長率上具有較高的載荷,可以看作公司的“成長因子”。
綜上,六個共性因子與上文選取的財務指標維度較為吻合,驗證了因子分析的有效性和經濟意義可解釋性。
最后,根據旋轉成分矩陣,將原始觀測系統的指標表示為公因子的線性形式,也稱為得分因子函數。至此,因子分析完成,16個指標降維至6個共性因子指標。將因子分析得到的6個共性因子輸入支持向量機中進行訓練,并與直接使用支持向量機的結果進行數據壓縮量對比,如表7所示。
由表7可以看出,與單獨使用支持向量機的模型一樣,FA-SVM模型在兩種比例的上市公司財務風險預測上均取得了90%以上的精確率,而相較于SVM模型所使用的觀測指標系統,FA-SVM模型分別得到了73.33%和60%的數據壓縮率, 這對提升企業預警的實時性起到了至關重要的作用。
五、結論與啟示
上市公司財務年報中MD&A部分的內容是其信息披露的必要組件之一,對這部分文本的處理與分析有助于投資者更好地了解企業的真實財務現狀, 同時幫助企業經營者更準確地預測財務困境,合理做出調節。本文以財務困境公司和正常運營公司的財務數據及年報文本為研究對象,通過初步篩選財務數據指標, 對年報文本進行中文分詞后,根據情感詞典計算語調得分,并將更有可能對風險起到預警作用的負面語調單獨計算作為指標,融合財務指標進行因子分析,得到少量共性因子,采用支持向量機的方法建立財務預警模型,并對進行因子分析前后的模型分別分析。
本文得到的主要結論有:
第一,無論在配對樣本比率為1:1還是1:2的實驗條件下, 向財務指標體系中加入MD&A文本計算所得的管理層語調均可以提升財務風險模型預測的有效性,且在是否加入因子分析方法時均成立。這一結論表明企業財務年報文本內容確實會給風險預警帶來一定的增益信息,量化財務文本內容是對定量財務數據的合理補充。
第二,加入單獨計算的負向語調對模型預測的準確率有一定的提升,說明了文本中揭露的管理層負向信息能更有效地反映企業經營現狀。
第三,基于因子分析處理錯綜復雜的財務指標是有效的。使用因子分析,不僅消除了財務指標之間的冗余性,降低共線性,還賦予了提取出的公共因子以合理的經濟意義,壓縮了模型空間并提升了支持向量機模型的計算速度。
綜上所述,在對上市公司財務困境進行建模和預測時,可通過對其財務年報中管理層披露的文本信息進行多尺度地挖掘和利用,建立合理情感語調指標對更好地強化風險預警具有重要意義。同時,可以將本文對公司財務年報的研究推廣到任何與公司有關的公開文本,如社交媒體輿論、新聞報道等,多元化的信息來源有助于擴展公司信息披露,對于進一步優化風險信用預警有著至關重要的意義。但是需要注意的是,現實中存在較大道德風險的企業管理層可能故意放出正面信息,使得財務風險難以識別,這時不能一味依靠管理層語調的變化來判斷財務風險,而是應該根據其他指標,更加客觀地綜合考量企業財務風險的真實狀況。
參考文獻:
[1]龐清樂,劉新允.基于蟻群神經網絡的財務危機預警方法[J].數理統計與管理,2011,30(3):554-561.
[2]楊毓,蒙肖蓮.用支持向量機(SVM)構建企業破產預測模型[J].金融研究,2006(10):65-75.
[3]鄒清明,黃鐘億.基于比例優勢模型的上市公司財務困境預測研究[J].數理統計與管理,2016,35(3):536-549.
[4]趙冠華.基于遺傳算法和熵的縮減記憶式LS-SVM財務困境預測模型研究[J].運籌與管理,2010,19(5):71-77.
[5]ALTMAN E I.Financial Ratios,Discriminant Analysis and the Prediction of Corporate Bankruptcy[J].Journal of Finance,1968,23(4):589-609.
[6]BEAVER W H.Financial Ratios as Predictors of Failure,Empirical Research in Accounting:Selected Studies[J].Journal of Accounting Research,1966:179-199.
[7]文柯.基于Logistic的上市公司產融結合風險預警模型研究[J].中國管理科學,2012,20(S1):346-350.
[8]張琳,潘佳英.融入ESG因素的企業債券信用風險預警研究[J].金融理論探索,2021(4):51-65.
[9]谷慎,汪淑娟.基于SVM的碳金融風險預警模型研究[J].華東經濟管理,2019,33(3):179-184.
[10]謝德仁,林樂.管理層語調能預示公司未來業績嗎?——基于我國上市公司年度業績說明會的文本分析[J].會計研究,2015(2):20-27,93.
[11]劉逸爽,陳藝云.管理層語調與上市公司信用風險預警——基于公司年報文本內容分析的研究[J].金融經濟學研究,2018,33(4):46-54.
[12]李秉成,苗霞,聶梓.MD&A前瞻性信息能提升財務危機預測能力嗎——基于信號傳遞和言語有效理論視角的實證分析[J].山西財經大學學報,2019,41(5):108-124.
[13]LOUGHRAN T,MCDONALD B,YUN H.A Wolf in Sheep's Clothing:the Use of Ethics-Related Terms in 10-K Reports[J].Journal of Business Ethics,2009,89(suppl.1):39-49.
[14]LOUGHRAN T,MCDONALD B.Textual Analysis in Accounting and Finance:A Survey[J].Journal of Accounting Research,2016,54(4).
[15]O'CONNOR B,BALASUBRAMANYAN R,ROUTLEDGE B R,et al. From Tweets to Polls:Linking Text Sentiment to Public Opinion Time Series[C]// Proceedings of the Fourth International Conference on Weblogs and Social Media,ICWSM 2010,Washington,DC,USA,May 23-26,2010. DBLP,2010.
[16]王澤霞,李正治.基于管理層討論與分析情感性的財務預警研究[J].杭州電子科技大學學報(社會科學版),2019,15(3):1-6.
[17]陳藝云,賀建風,覃福東.基于中文年報管理層討論與分析文本特征的上市公司財務困境預測研究[J].預測,2018,37(4):53-59.
[18]陳艷嬌.基于因子分析的國有農場財務危機預警實證研究[J].經濟問題,2007(5):109-111.
[19]顧雪玲,燕璇.基于顯著性檢驗和因子分析的企業財務危機預警研究[J].商業會計,2015(18):42-45.
Financial Risk Warning from the Perspective of Management Tone
——Research Based on FA-SVM Model
Li Cheng1, Li Cong2
(1. School of Economics and Management, Tiangong University, Tianjin 300387, China;
2. School of System Science, Beijing Normal University, Beijing 100875, China)
Abstract: In order to solve the problems of the existing financial risk early warning models with a large number of indicators, high redundancy, poor real-time analysis capabilities, and ignoring financial text information for corporate bankruptcy prediction, this paper proposes a financial risk early warning model under the perspective of management tone. Selecting 276 listed companies from 2016 to 2020 as the research sample, after preliminary screening of financial data indicators from five dimensions, the forward-looking information in the corporate financial annual report is processed in Chinese word segmentation and the tone is calculated according to the commonly used emotional dictionary, and the financial data is added for indicators. And factor analysis is used to reduce dimensionality, to eliminate indicator redundancy and the correlation between them. We try to extract a small amount of common factors, and finally use support vector machines to build a risk early warning model. The experimental results show that the five-dimensional index system selected in this paper has strong consistency with the common factors obtained by factor analysis, which proves the economic significance of factor analysis and the interpretability. At the same time, the combination of financial text information can effectively improve the accuracy of financial risk prediction, which verifies the effectiveness of financial text on risk early warning models.
Key words: management tone; listed company; risk warning; financial risk
(責任編輯:李丹;校對:盧艷茹)