楊星華


摘要:隨著我國經濟的迅猛發展,金融市場中*ST企業不斷增多。上市企業達到連續三年虧損就會被執行退市預警,這不僅使普通投資者回報下降、也使企業股東權益受損。為了對*ST企業發展狀況更好的評價,文章以基于樸素貝葉斯算法的財務狀況預測模型分析為研究課題,以滬深A股主板*ST企業t-1和t-2年的財務數據為研究樣本,運用混淆矩陣評價指標構建具有適用性的財務狀況預測模型。實證結果顯示模型具有較好的推廣效果與泛化作用,對*ST企業財務狀況具備一定的預測效果。
Abstract: With the rapid development of China's economy, there are more and more *ST enterprises in the financial market. Listed companies will be subject to delisting warning if they lose money for three consecutive years, which not only reduces the return of ordinary investors, but also damages the shareholders' rights and interests. In order to better evaluate the development of *ST enterprises, this paper takes the analysis of financial situation prediction model based on Naive Bayesian algorithm as the research topic, takes the financial data of Shanghai and Shenzhen A-share main board *ST enterprises in T-1 and T-2 years as the research samples, and uses the confusion matrix evaluation index to construct a suitable financial situation prediction model. The empirical results show that the model has a good promotion effect and generalization effect, and has a certain prediction effect on the financial situation of *ST enterprises.
關鍵詞:財務預測;樸素貝葉斯;*ST企業
Key words: financial forecast;naive Bayes;*ST enterprise
中圖分類號:TP311 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1006-4311(2020)24-0028-03
0 ?引言
退市預警制度作為我國資本市場的特有機制,對經濟平穩運行發揮著重要的作用。根據2012年滬深兩個交易所股票上市規范,在上市公司出現財務狀況異常時,將導致其股票存在終止上市風險,這可能損害投資者的投資權益。此時該公司股票交易就會被執行特別處理的風險警示,這主要包括退市風險警示(*ST)與其他風險警示(ST)[1]。
從定量的角度出發對財務狀況預測的研究主要集中在財務危機預測方面。20世紀30年代,國外就開始了對財務狀況預測的研究,國內的類似研究開始于90年代末。對于企業是否發生財務危機的判斷標準,國外一開始以企業破產來界定,后來也有研究學者用企業預期現金流量的凈現值等來對企業財務危機程度進行劃分[2]。由于國內資本市場特有的退市預警制度,國內研究者大都以企業是否被執行退市預警,作為衡量企業是否發生財務危機的標準。王秋瑋等[3]利用決策樹算法和F分數模型,結合償債能力、盈利能力、營運能力和成長能力等幾個財務比率指標構建企業財務危機預警模型,發現對ST企業財務狀況影響最大的是總資產增長率這一指標,ST企業應該有所針對的制定應對策略,從而使企業更好地走出困境。歐國良等[4]將因子分析法利用在房地產企業的財務預警研究中,發現提高企業的經營水平能使陷入財務問題的企業更好的改善財務狀況,最后呼吁現代企業要對財務預警問題給予更多重視。宋宇等[5]利用cox回歸模型尋找出了對企業財務狀況具有顯著影響的指標,并構建出整體正確率達到76.4%的財務預警模型。蘆雅婷等[6]采用貝葉斯判別法對上市公司內部控制缺陷問題進行研究,發現資產安全、內控合規等方面對研究問題具有顯著影響,并構建了整體正確率達85%的上市公司重大缺陷識別模型。石先兵[7]選取滬深A股主板上市的制造業企業為研究對象,構建PCA-SVM財務危機預警模型,實現了對原始數據的降維,有效解決了樣本數據的線性相關性問題,使財務狀況預警模型的分類水平與泛化性得到提升。吳靜等[8]在傳統財務比率分析的基礎上,以具有股權質押行為的A股上市公司為研究對象,結合股權質押率和公司治理等變量,發現其能有效提升預警模型的預測效果。這為上市公司及時發現財務風險,改善財務危機預警機制提供了參考。
近些年對正常經營的企業進行財務狀況預警的研究較多,但很少有對*ST企業未來財務狀況進行預測的研究。針對這個問題,本文利用樸素貝葉斯分類算法并基于t-1年和t-2年財務指標,構建預測模型來判斷*ST企業未來財務運行狀況的優劣。實證結果表明,該模型準確率分別達到了90%和80%,具有較好的推廣效果與泛化作用,對*ST企業財務狀況預測效果較為顯著。本文將首先介紹企業財務預警模型指標體系的建立與樣本的選擇,接著對樸素貝葉斯分類算法和模型評估方法進行原理說明,最后對實證結果進行分析并闡述本研究的結論及局限性。
1 ?指標體系的建立與數據的來源
1.1 指標體系的構建
本文旨在構建*ST企業未來財務狀況的預測模型,相關數據指標一方面要體現企業的財務能力,另一方面也要方便獲取。基于此并結合*ST企業的實際情況,本文篩選出了分別衡量企業償債能力、盈利能力、經營能力和發展能力的11個具體財務指標,建立起如表1所示的指標體系。
1.2 數據的來源
本文數據來源于國泰安數據庫(CSMAR),因滬深A股采用國內會所審計與會計準則,滬深B股企業采用國際會所審計與會計準則,所以不能將滬深A股與B股企業財務指標進行結合分析,再考慮到滬深A股數據完整性高且更易收集。因此,將符合標準的樣本(2019年25家解除退市預警企業和25家繼續被執行退市預警企業)進行劃分,包括30%測試樣本組與70%訓練樣本組兩類,以此進行財務狀況預測的測試。因為上市企業被特別處理的短時性,財務狀況預測模型的研究將以*ST企業的第t-1和t-2年相關數據為前提展開比較分析。
2 ?樸素貝葉斯分類模型與評估方法
貝葉斯分類方法是在貝葉斯原理上,利用概率統計的相關知識對數據集樣本進行分類。貝葉斯方法不僅考慮了事件發生的先驗概率,還結合了后驗概率,這有效避免了只利用事件先驗概率的主觀片面性,也避免了數據集噪聲帶來的過擬合現象 [9]。樸素貝葉斯方法以目標值屬性之間相互條件獨立為前提假設,即各個屬性變量對分類結果的影響都有一個適當的比重。這使得算法得到極大簡化的同時還能保持很好的分類效果,在實際應用中也更具操作性。
2.1 算法原理
樸素貝葉斯分類器(naive bayesian classification)通過一個給定的訓練集,假設各個特征之間相互獨立,訓練從輸入向量到輸出結果的聯合概率分布,最后利用訓練出來的模型,給定X即可得到后驗概率最大的輸出Y[10]。
若有樣本數據集D={d1,d2,…,dn},其中特征屬性集是 X={x1,x2,…,xd},類標簽變量為Y={y1,y2,…,ym},也就是說D可以分為ym類別。其中x1,x2,…,xd也滿足相互獨立且隨機的假設,則Y的先驗概率Pprior=P(Y),Y的后驗概率Ppost=P(Y|X),由樸素貝葉斯原理可得,后驗概率可以由先驗概率Pprior=P(Y)、證據P(X)、類條件概率P(X|Y)計算出:
2.2 模型評估方法
實際應用中無法得到分類結果完全正確的分類器,所以對訓練數據得到的模型需要進一步的評價其分類效果,以發現模型的不足,從而繼續改善分類器性能。但模型評估方法有很多種,針對不同的領域和目標要求,應該選擇適當的模型評估方法。鑒于混淆矩陣評價的精細性,本文選擇其對*ST企業財務預測模型的準確率、精度以及召回率等進行系統評價。本文通過以下典型的二分類混淆矩陣[11]對此類模型評估方法的原理進行說明。
表2中各項說明如下:
TP(Ture Positives):被分類器正確分類的正元組。
TN(Ture Negatives):被分類器正確分類的負元組。
FP(False Positives):被錯誤的標記正元組的負元組。
FN(False Negatives):被錯誤的標記負元組的正元組。
在該矩陣中,每個類別中被正確識別的樣本數量是通過主對角線的數值來體現,而非主對角線上的數值則表示了被錯誤識別的樣本數量。在實際應用過程中,通常還會利用混淆矩陣特點,通過指標設定方式來定量評價分類器性能,最終實現模型分類效果的評價。
本文依次選擇了準確度、精度、召回率以及F分數四項度量指標對分類模型結果進行解釋。因為樣本整體準確率不足以支撐對模型的評價,本文又追加了精度、召回率與F1分數這三個指標用以補準確率反映內容存在的空缺。本文以*ST企業被取消退市預警為正元組,*ST企業被繼續執行退市預警為負元組。其中精度即標記為取消退市預警的*ST企業實際為取消退市預警的*ST企業的百分比,召回率即取消退市預警*ST企業標記為取消退市預警*ST企業的百分比。因為精度與召回率呈現相反的關系,為有效解決兩者之間的矛盾,本文對其進行加權平均進而構造了指標F分數從整體上對精度與召回率的作用進行綜合考量。其中,F分數取值區間為[0,1],其值與模型分類效果成正比。
3 ?實證分析
本文將50個樣本(2019年25家繼續被執行退市預警企業和25家解除退市預警企業)中的30%作為測試樣本組,70%作為訓練樣本組。整個實驗過程利用Python的集成開發環境anaconda完成操作,并結合準確度、精度、召回率以及F分數四個指標對該模型的性能進行評價,最后以50個*ST企業的第t-1和t-2年相關數據為依據展開比較分析。
由表4可知,基于*ST企業t-1與t-2年財務指標訓練的模型,在30%測試集上的整體準確率分別達到了93%和80%,綜合顯示了模型具有的一定預測能力。使用2018年財務指標數據得到的回歸模型精度為89%,說明標記為取消退市預警的*ST企業實際為取消退市預警的*ST企業占的百分比為89%。其召回率更是達到了100%,說明所有取消退市預警的*ST企業,即2019年財務狀況改善的企業均被標記了出來,其中F分數達到了94%,說明基于*ST企業t-1年財務狀況的預測模型,分類效果顯著;使用2017年財務指標數據得到的回歸模型精度為100%,說明標記為取消退市預警的*ST企業都實際為取消退市預警的*ST企業。其召回率則為62%,即實際取消退市預警*ST企業有62%被標記了出來,雖然召回率不是太理想,但其F分數還是達到了77%,說明基于*ST企業t-2年財務狀況的預測模型,也具有一定的分類效果。
根據假設檢驗的原理,因為第一類錯誤和第二類錯誤發生的概率不能做到同時減小,所以這兩個錯誤之間需要一定的權衡。這里我們假設原假設和備擇假設分別為:
H0=公司繼續被執行退市預警
H1=公司被取消退市預警
本問題中的第一類錯誤是將一家被繼續執行退市預警的企業做了取消退市預警處理;本問題中的第二類錯誤是沒將一家未來轉為正常的公司做取消退市預警處理。本文將主要關注第一類錯誤的發生,因為人們普遍對*ST企業的財務狀況保持謹慎態度,將一家被繼續執行退市預警的企業做取消退市預警處理會對市場預期造成錯誤的沖擊,從投資者本身出發,這是不愿意看到的結果。這在混淆矩陣評價指標里主要表現在精度上。實證結果顯示,基于t-1年和t-2年財務指標數據得到的回歸模型精度分別達到了89%和100%,說明標記為取消退市預警的企業大部分都實際為取消退市預警企業,第一類錯誤得到了很好的控制。
綜合來看,基于*ST企業t-1年財務指標訓練的模型對*ST企業的未來財務狀況有很好的預測效果,但由于上市公司財務數據披露的滯后性,其參考意義有限。基于*ST企業t-2年財務指標訓練的模型對*ST企業的未來財務狀況的預測效果雖然沒有t-1年訓練模型顯著,但因為其提前兩年做出預測,所以不管是對投資者還是上市公司本身評估企業未來發展狀況都具有一定的參考意義。
4 ?結論
通過構建的樸素貝葉斯財務狀況預測模型及對實證結果分析,可以得到下面的結論:利用樸素貝葉斯分類算法對*ST企業未來財務狀況進行預測是可行的,并且具有一定的準確度。基于*ST企業t-1年財務指標訓練的模型分類效果要好于t-2年數據得出的模型。同時本文也存在一定局限性。一方面,選取的*ST企業樣本數據集較少,較難體現不同危機程度的*ST企業在財務指標上的不同表現。另一方面,本文指標體系的構建主要考慮了企業的財務比率指標,沒有加入非財務因素,這可能對模型的可靠性具有影響。最后基于對我國上市公司中的*ST企業財務狀況預測研究,本文認為*ST企業應該提高危機防范意識,健全財務危機預警機制和指標體系,同時積極尋找企業擺脫困境的發展方向,避免退市情況的產生。投資者應該對*ST企業財務狀況和發展前景有全面的認識,不能對*ST企業持全面否定的態度,上市企業可能只是因為短期的經營戰略調整或者決策失誤,使企業陷入一時的困境。
參考文獻:
[1]王晨.退市制度變革與ST企業盈余管理方式研究[J].財經界,2020(01):89-91.
[2]趙智繁,曹倩.基于數據包絡和數據挖掘的財務危機預測模型研究[J].計算機科學,2016,43(S2):461-465.
[3]王秋瑋,葉楓.新常態下ST公司財務困境預警研究——基于C5.0算法的財報面板數據 [J].財會通訊,2018(23):107-111,129.
[4]歐國良,吳剛,朱祥波.基于因子分析法的房地產企業財務風險預警研究[J].社會科學家,2018(09):56-63.
[5]宋宇,秦學志,李鴻禧.基于Cox回歸的中小企業財務預警模型及實證[J].管理現代化,2019,39(01):108-110.
[6]蘆雅婷,田宇.基于貝葉斯判別的上市公司內部控制缺陷識別——內部控制目標偏離視角的實證研究[J].會計之友,2018(08):19-25.
[7]石先兵.基于PCA-SVM的企業財務危機預警模型構建[J]. 財會通訊,2020(10):131-134.
[8]吳靜,袁芳英.股權質押、公司治理與財務危機預警[J].財會通訊,2020(12):45-49.
[9]朱軍,胡文波.貝葉斯機器學習前沿進展綜述[J].計算機研究與發展,2015,52(01):16-26.
[10]李航.統計學習方法[M].清華大學出版社,2012.
[11]JiaweiHan, M., JianPei. 數據挖掘:概念與技術[M].機械工業出版社,2012.