郭毅夫,權思勇
(1.湖南文理學院 經濟與管理學院,湖南常德415000;2.東華大學旭日工商管理學院,上海200051)
采用Clementine10.0的神經網絡建模工具,采用創新型企業的財務數據進行預測,其輸出為“危險fail、不確定warning、安全safe”三種狀態。Clementine10.0的神經網絡建模工具是一種完全的黑盒模型,不需要用戶構建任何數學函數,完全通過機器的學習,改善神經元之間的連接權重,儲存學習狀態,以完成學習訓練。工具提供幾項特有的功能,包括:敏感度分析(sensitivity analysis)以輔助解釋神經網絡結果,修剪(pruning)和驗證(validation)以避免過度訓練,動態網絡(dynamic networks)以自動找出合適的網絡結構設計。
文章選擇的研究總樣本是一定數量的“財務危機”企業和與之相對應的同樣數量的“非財務危機”企業。將總樣本分為兩組:一組為估計樣本組;另一組為測試樣本組。用估計樣本組的數據來構建預警模型,而用測試樣本組的數據來檢驗預警模型的有效程度。
本文研究創新性企業上市公司的財務危機預警問題。因為數據的可得性等原因,選取2010年被特別處理的上市公司為樣本,以A股上市公司是否因“財務狀況異常”而受到“特別處理”為界定該公司是否陷入財務危機的標志。選擇非財務危機公司(即作為參照對象的非ST公司)的具體原則如下:
(1)滿足樣本時間性要求。為獲得足夠的數據進行對比分析,選取ST公司被特別處理的前三年作為樣本的時間范圍,這就要求與其配對的非ST公司必須有那三年的財務數據。
(2)符合本文界定的創新型企業的條件,即必須符合8個基本條件中的至少3個基本條件。
(3)行業相同或相近、時期相同,規模相差不大。
從而研究樣本達到共48家。現將24家ST公司和24家非ST公司隨機分為兩組,估計樣本組24家(12家ST公司和12家非ST公司),測試樣本組24家(12家ST公司和12家非ST公司),研究樣本如表1所示。
在本研究中所選取的樣本都是2010年被特別處理,應采取2009年公布的2008年財務報表數據預測2010年是否可能陷入財務困境,即以2008年財務數據建立預警模型。

表1 財務危機預警研究樣本表
國內外很多學者已經利用財務指標,對公司財務危機預警進行了實證研究。盡管不同學者得出的預測公司發生財務危機的有效財務指標不同,但研究結果類似,即基本上都是從公司的償債能力、盈利能力、營運能力等方面進行研究的。結合我國實際情況以及財務數據的可獲得性,本文選取了如下20個財務指標作為財務危機預警理論體系,見表2所示:

表2 財務指標
本應用模型目的是要應用K-Means方法對每一個指標項的特征進行分析,自動判斷每個企業在各個指標項上表現出來的特征。由于K-Means工具不支持同時輸出多個指標的不同類,為了同時輸出各個指標的不同類,需要構建企業對財務指標各項的分類模型。從X1開始,生成X1-1、X1-2、X1-3、X1-4和 X1-5五類,并和原有的20 個指標一起作為下一個X2分析的輸入,生成包含X1指標的五類在內的X2-1、X2-2、X2-3、X2-4和X2-5五類,依次類推,直至生成所有各項的所有分類項,共計21個子模型。各指標項中各類中的-1、-2、-3、-4和-5并不代表等級,只代表類別,在各指標項中的意義也不相同,由計算機工具自動生成,其具體的意義需要根據其均值的大小來確定,可以對五個類的均值進行排序以構成五個等級,例如:很好、好、中、差和很差。以指標項X1為例,在47條記錄中,其X1-1的均值為0.492,共38個,標準差為0.374;X1-2的均值為13.313,共1個,標準差為0.0;X1-3的均值為6.525,共1個,標準差為0.0;X1-4的均值為2.102,共6個,標準差為0.397;X1-5的均值為5.444,共1個,標準差為0.0。圖1表示該指標項的分類分布圖。對X1的均值進行排序,則為:X1-1、X1-4、X1-5、X1-3和X1-2,由于流動比率通常應大于200%比較合適,顯然大多數企業處于不合適位置。

圖1 各個企業對財務指標的各項分類模型

圖2 X1指標的五類分布圖
表3列出了各個指標的5類子指標及其每類的均值和標準差。

表3 各指標項的分類表
將上面根據K-Means方法劃分出來的類別表替換為離散型的數據如下表4,由此可進行基于C5.0的財務預警決策樹建模。

表4 企業財務指標經過聚類劃分處理后的數據特征
圖3為Clementine10.0分析工具中,兩種輸入狀態下的財務預警神經網絡模型。聚類值是利用K-Means處理后的財務指標體系,如表4;連續值是利用原始數據。
在Clementine10.0中,使用聚類值輸入的財務預警神經網絡模型參數設置如下:

圖3 在Clementine中構建2種預測模型
(1)Fields頁簽:Targets,對應輸出Risk;Inputs,對應20個聚類以后的財務指標值。
(2)Model頁簽:選擇使用數據分區(use partitioned data);學習方法(Method)選擇 Dynamic;防止過度訓練(Prevent overtraning sample%)選擇50.0;停止時間(Stop on times)為5.0分鐘(mins)。使用內存優化。
(3)Option頁簽:選擇持續訓練已有模型(continue traning existing model);顯示反饋圖型(show feedback graph);選擇使用最優網絡(use best network);報告敏感度(sensitivity analysis)。
(4)其他頁簽內容默認。
為說明問題,下面比較財務風險預警的連續值決策樹模型和離散值決策樹模型。聚類值輸入的財務預警模型整個學習過程相對平穩,波動性小,尤其是后期階段。整個過程中,最好的預測值(Best Predicted Accuracy)為89.04%,實際到達且穩定的一定時間的預測值為89.041%。
下圖4為其一段時間內,聚類輸入的財務預警模型運算結果反饋時序圖。

圖4 聚類輸入的財務預警模型運算結果反饋時序圖
該次模型運算實際達到的準確度估計值為89.041%。報告顯示,本次模型使用了100個神經元作為輸入層;2個隱含層,一個為25個神經元,另一個為8個神經元;輸出層有3個神經元。使用了50%的數據作為訓練,50%的數據作為預測。預測結果顯示在141條數據中,有12條數據預測出錯。
在Clementine10.0中,使用連續值輸入的財務預警神經網絡模型參數設置與聚類值輸入的模型基本相同,只在輸入值的類型完全不同,連續值輸入的是小數點后達到4位精確度數據,輸出一樣。
連續值輸入的財務預警神經網絡模型每次運行的結果差異比較大,當前預測精確度隨時間波動性大。數十次運行的情況來看,整體準確度要略低于聚類值輸入形式下的預測。圖5就顯示了連續值模型的這種特點。

圖5 連續輸入值的財務預警神經網絡模型運行時序反饋
該次模型的精確度估計值為84.5%,實際的精確度為76.6%,在141條記錄中預測實際出錯為33條。運行報告指出,本次神經網絡模型輸入層有20個神經單元,隱含層有2層,一層有4個神經單元,另一層有6個神經單元,輸出層有3個神經元。
對于企業的財務指標,一般都是連續值,但其并不具有良好的直觀特征,尤其是對于企業在群體中的定位則不清晰,人工評估的方法則帶有較多的主觀性,為此引入了容易為計算機程序實現的K-Means方法。
就直觀的聚類值與精確的連續值2種輸入進行比較。每種模型經過數十次的運算實驗表明,每次運算結果會有差異,有時可達到90%,有時只有73%;二種不同輸入模型的最終輸出準確度,平均而言略微有差異,會隨著時間的流逝而波動。整體來說,使用了聚類值作為輸入的神經網絡預測準確度要優于連續值,連續值模型的波動最大。
[1]Odom M.,Sharda R.A.Neural Networks Model for Bankruptcy Pre?diction[C].Proceedings of the IEEE International Conference on Neu?ral Network,1990.
[2]Coats Pamela K.,Franklin F.L.Recognizing Financial Distress Pat?terns Using a Neural Network Tool[J].Financial Management,1993,3.
[3]Atiya A.F.Bankruptcy Prediction for Credit Risk Using Neural Net?works:a Survey and New Results[C].IEEE Transactions on Neural Networks,2001,12(4).
[4]Charalambous Chris,Andreas Charitou,Froso Kaourou.Comparative Analysis of Artificial Neural Network Models:Application in Bank?ruptcy Prediction[C].IEEE Proceedings,1999,139(3).
[5]王今,韓文秀,侯嵐.西方企業財務危機預測方法評析[J].中國軟科學,2002,(6).
[6]劉洪,何光軍.基于人工神經網絡方法的上市公司經營失敗預警研究[J].會計研究,2004,(2).
[7]周輝仁,唐萬生等.基于遞階遺傳算法和BP網絡的財務預警[J].系統管理學報,2010,(2).