摘 要:本文根據財務危機預警實證研究中的實驗樣本的選取方法的不同,將從基于平衡數據的財務危機預警模型研究和基于非平衡數據的財務危機預警研究兩個方面進行文獻綜述,并指出國內外學者在財務危機預警模型研究中存在的不足。通過財務危機預警的研究現狀的梳理,以期為財務危機預警模型的研究提供新的思路和理論指導。
關鍵詞:財務危機預警 非平衡 模型
企業財務困境預測模型是指基于一定的分類方法從歷史數據中學習得到分類模型,并以得到的分類模型為基礎對新樣本未來的財務狀況進行預測評估。在財務困境預測實證研究中,實證樣本數據的選取已從平衡數據集發展到非平衡數據集。因此本文將從基于平衡數據集的財務困境研究現狀和基于非平衡數據集的財務困境預測研究現狀兩個方面對國內外財務困境預測研究的理論成果進行文獻綜述。
一、基于平衡數據的困境預測模型研究現狀
平衡數據是指實證樣本中財務困境樣本的數量與非財務困境樣本的數量相同。在傳統財務困境預測研究中一般采用財務困境樣本和非財務困境樣本配對樣本方法來保證實證樣本數據的平衡,進而對分類模型進行訓練學習。企業財務困境預測的模型從單分類器模型發展到多分類器模型。單分類器模型包括統計模型發展和人工智能模型,多分類器模型包括混合多分類器集成和多個同類分類器集成。
1.單分類器財務困境預測模型。
1.1統計模型。最早Beaver提出了單變量財務困境預測模型,開創了財務困境預測研究的先河,但單變量預警模型在預測評估時只能使用單個財務指標,單一指標預測的有效性很難擴展到其他樣本空間,極大地限制其進一步的發展。Beaver之后,為克服單一變量預測的不足,Altman首次利用多元判別分析進行財務困境預測研究,將財務危機預警領域從單變量預測階段發展到多變量預測階段。但多變量分析模型要求指標符合正態分布假設,而現實中財務指標并不符合這一特性。后續的研究對多元判別分析模型提出了改進,也取得一定的成果。20世紀80年代,Ohlson首次將Logistic回歸分析模型引用到引入財務困境預測領域,有效的解決了多元判別分析的指標必須符合正態分布假設的這一限制問題,推動了財務危機預警領域的進一步發展。
1.2人工智能模型。隨著計算機和信息技術的發展,20世紀90年代初,神經網絡方法開始被引入到財務危機的預測研究,并以MAD和Logit模型為基準,取得了良好的預測效果,如Odom和Sharda。1998年,Vapnik提出了支持向量機模型,而它最早被應用于求解模式識別問題。Shin等將SVM模型引入韓國企業破產預測,結果表明SVM的預測性能要優于MDA,Logit和NNs的結論。遺傳算法是一種根據生物遺傳進化的規律,在復雜空間內的通過有效搜索,以實現最優解的方法。該方法一般用來搜索決策規則和系統參數。陳強和薛華針對倒傳神經網絡算法無法迭代到最優解的問題,運用遺傳算法來協助倒傳神經網絡算法進行最優解的搜索。作為機器學習方法之一的決策樹也被廣泛應用于財務危機預警領域。Li、Sun等也證明了See5.0的財務危機預警效果優于MDA。
2.多分類器財務困境預測模型。多分類器集成是指在處理分類問題時,把多個分類器通過某種集成機制組合在一起,然后綜合各分類器的預測結果得到最終的分類結果。當前分類器集成模型大體可以分為兩類:多個同一分類器集成模型和混合分類器集成模型。
2.1多個同類分類器集成模型。對于多個同類分類器的集成可以通過以下兩類方法來實現:一是利用不同的訓練樣本子集獲得基本分類器,如 Bagging方法和boosting方法;二是利用數據集的不同特征子空間構建基本分類器,如隨機特征子空間法。Tsai等利用bagging和boosting對svm,DT和MLP三種分類器分別集成,通過對中國,澳大利亞,日本三國的企業進行信用評估表明:boosting和DT的集成模型的預測表現最好。Sun和Li提出了對同一數據樣本集進行不同的財務指標特征子集的選取從而生成核函數各不相同的多SVM的集成模型,與單一的SVM模型相比預測性能更好。
2.2混合多分類器集成模型。混合多分類類器集成模型是指融合兩種以上的統計方法或人工智能方法而構建的分類模型。Cho等先通過神經網絡算法分別賦予每個基本分類器不同的權重,然后將各個基分類器組合在一起構建集成分類器。經過實驗得到了與前人一致的結論:集成分類器比單個分類器具有更高的預測精度和穩定性。孫潔等提出了多分類器混合組合模型,實現了并聯組合和串聯組合的優勢互補,統計分析表明:該模型顯著優于現有的單分類器財務困境預測模型。
二、基于非平衡數據的困境預測模型研究現狀
當前,有少數研究者意識到財務困境預測中的非平衡數據的問題,即類別非平衡問題。樣本中某類樣本的數量遠大于另一類樣本的數量的類間不平衡現象稱之為類別非平衡。最近越來越多的學者投入到基于類別非平衡的企業財務危機預警研究中,取得一定的研究成果。有部分學者研究了類別非平衡對分類器的性能影響。Louzada等研究發現違約樣本和非違約樣本的比例取值不同對Logit回歸的預測效果有影響,尤其是當非平衡度很高(如1:9)時預測的性能顯著下降。Crone和Finlay也探討了樣本非平衡對分類器性能的影響,包括Logit回歸、線性DA、決策樹和神經網絡,研究結論表明類別非平衡的確很影響分類器的性能,但所采用的四種分類器中Logit回歸分析方法受類別非平衡的影響最小。還有部分的學者致力對不平衡數據處理方面的研究。如Li和Sun提出了一種新的過抽樣方法產生更多少數類樣本來平衡數據集,構建基于近鄰支持向量機為基本分類器的財務困境模型,與原始的非平衡數據集相比,新構建的模型預測性能更好。Ligang Zhou比較了過抽樣和欠抽樣方法對基于非平衡數據的企業破產預測表現的影響,研究結果表明,合適的處理非平衡的方法的選擇主要取決于訓練集中財務困境企業的數量,當訓練集中財務困境企業的數量較少時適合采用smote過抽樣的方法,而當訓練集中財務困境企業的數量較多時適合采用欠抽樣的方法。
三、財務危機預警模型未來的研究方向
通過以上文獻的閱讀和歸納,發現當前研究存在以下幾點不足:(1)絕大部分的研究集中于平衡數據的財務困境預測模型研究,而在基于非平衡數據的財務困境預測模型研究較少,基于非平衡數據的研究財務困境預測模型研究還處于初步探索階段,應在非平衡數據處理方法成面和分類器算法層面進一步拓展,以提高對財務困境類樣本的準確率。(2)絕大部分的研究還處于靜態建模階段,只針對某一特定時間段類的數據集建模,而隨著時間的推移,已建立的模型將對存在于財務困境中的概念漂移現象無法有效適應以及對新概念樣本無法有效評估。因此,需加強企業財務危機預警動態模型的研究,以實現財務困境預測模型的動態更新機制。(3)絕大部分的財務困境預測模型時都采用財務指標進行研究,而對影響財務困境的非財務指標因素考慮較少,只利用財務指標的數據進行實證研究,無疑會影響到模型的科學性。因此,在未來的財務危機預警模型的構建中應考慮納入非財務指標。
四、結語
本文從基于平衡數據的財務危機預警模型研究和基于非平衡數據的財務危機預警研究兩個方面對當前國內外財務危機預警模型研究現狀進行概述,旨在了解相關研究,找出其中的規律,為以后的發展提供一些借鑒和線索。改善財務危機預測模型,提高模型對財務困境公司和財務正常公司預測的準確率,是財務困境預測模型研究的重心。今后財務危機預警模型的研究應基于非平衡數據的基礎上,在構建指標體系、建立動態模型方面深入拓展。
參考文獻:
[1]C.F.Tsai,Y.F.Hsu,D.C.Yen.A comparative study of classifier ensembles for bankruptcy prediction.Applied Soft Computing 24(2014)977–984
[2]J. Sun, H. Li. Financial distress prediction using support vector machines: Ensemble vs. Individual .Applied Soft Computing, 12 (2012)2254–2265
[3]Cho S, Kim J, Bae J K.An Integrative Model withSubject Weight Based on Neural Network Learning for BankruptcyPrediction[J]. Expert System with Applications. 2009, 36(1): 403-410.
[4]孫潔, 李輝, ZHANG Meng.企業財務困境的多分類器混合組合預測[J]. 系統工程理論與實踐. 2009, 29(2): 78-86.
[5]F. Louzada,P.H. Ferreira-Silva , C.A.R.Diniz.On the impact of disproportional samples in credit scoring models: An application to a Brazilian bank data.Expert Systems with Applications 39 (2012) 8071–8078.
[6]I.Brown, C.Mues. An experimental comparison of classification algorithms for imbalanced credit scoring data sets.Expert Systems with Applications 39 (2012) 3446–3453
[7]H. Li, J. Sun, Forecasting business failure: the use of nearest-neighbour support vectors and correcting imbalanced samples: evidence from the Chinese hotel industry, Tourism Manage. (2012).
[8]Ligang Zhou. Performance of corporate bankruptcy prediction models on imbalanced dataset:The effect of sampling methods.Knowledge-Based Systems 41 (2013) 16–25.