[摘 要]財務困境預測已成為國內外廣泛關注的研究領域。財務困境預測方法主要包括多元線性判別法、邏輯回歸法等參數方法以及神經網絡等非參數方法,本文對各主要方法的優劣進行了評價,闡述了邏輯回歸模型在財務困境預測領域的應用現狀,并應用Logistic模型對我國上市公司進行了分類預測,在T-2年上取得了較好的預測精度。
[關鍵詞]財務困境;預測;邏輯回歸
doi:10.3969/j.issn.1673-0194.2009.15.037
[中圖分類號]F275[文獻標識碼]A[文章編號]1673-0194(2009)15-0124-03
1 引 言
從20世紀末的亞洲金融危機到如今的全球經濟衰退,日益復雜多變的競爭環境使得陷入財務困境的企業數量越來越多,企業管理者、債權人和投資者等都希望建立有效的財務困境預測機制,及早采取行動止損。因此,財務困境預測已成為國內外廣泛關注的領域。
關于財務困境的本質問題,迄今為止國內外也沒有一致的觀點。本文認為可以從兩個角度來定義財務困境,一是當企業財務報表出現資不抵債時,稱之為存量破產;二是當企業實際上不能夠清償到期債務時,稱之為流量破產。
企業財務困境長期困擾著經營者和資本持有者們,他們積極地尋求一些預測手段,希望能較早預見財務困境,避免更大的損失。財務困境預測研究在西方已經經歷了相當長的一段時間,我國則是2000年后才陸續有實證研究出現。Fitzpatrick(1932)、Beaver(1966)、Altman(1968)、Ohlson(1980)等學者是這個領域的開拓者,他們先后應用單變量分析法、多元線性判別法以及邏輯回歸等參數方法構建預測模型,以大量的變量組合以及恰當的方法,探索如何不斷提高模型的預測精度。20世紀90年代初期,開始有學者嘗試神經網絡、生存分析、基于案例推理、DEA模型、決策樹分析、粗糙集分析和支持向量機等非參數方法。參數方法和非參數方法相比而言,參數方法具有計算簡單、運用方便、容易解釋等優點,因此在財務困境預測方面得到了廣泛的應用。單變量分析法計算簡便、易于理解,但是一個財務變量包含的信息有限,而且根據不同的財務指標進行判斷對同一個企業有可能得出相反的結論;線性多元判別法考慮了多個財務指標,但要求自變量服從正態分布,協方差矩陣相同等假設條件,而Logistic回歸模型的理論前提相對判別分析法要寬松得多,它不限制自變量的分布,沒有關于分布類型、協方差矩陣等方面的嚴格假定,因此Logistic在財務困境預測領域的應用日益廣泛。
2 Logistic方法的基本思想及應用
Logistic模型是由J. Berkson于1944年提出的,適用于因變量為定性指標的二分類問題,其假設前提是:①因變量y是二分變量;②數據必須來自于隨機樣本;③因變量y被假定為m個自變量xi(i=1,2,…,m)的函數,因變量與自變量之間的關系是非線性的;④自變量之間不存在多重共線性。模型可表述為:
p=11+e-s ,s=c0+∑mi=1cixi 。
式中,xi為第i個指標變量,p為第i個變量的系數,p為因變量。p是s的連續增函數,s∈(-∞,+∞),因此:
lims→+∞ p=lims→+∞11+e-s=1,
lims→+∞ p=lims→+∞11+e-s=0。
因為p∈(0,1),所以p常被視為某一類概率。當Logistic回歸應用于財務困境預測研究中,p越接近1,表示該企業陷入財務困境的概率越低;p越接近0,則表示該企業陷入財務困境的概率越高。
首先將Logistic模型應用于財務困境預測的是Martin(1977),他引入Logistic回歸分析法,以1969-1974年為樣本期間,選出25個財務比率構建模型,預測兩年后銀行可能倒閉的概率。我國也有許多學者嘗試應用Logistic方法進行財務困境實證研究。吳世農 等(2001)選取了70家處于財務困境的公司和70家財務正常的公司為樣本,分別建立3種預測財務困境的模型,結果表明,Logistic預測模型的誤判率最低。
3 研究數據和實驗
3.1 樣本的選擇
西方財務困境樣本企業一般選擇破產企業,但是在中國,由于上市殼資源的稀缺性,上市公司破產事件寥寥無幾,因此我國絕大多數的財務困境預測的樣本一般選擇的都是ST上市公司。本實驗以最近兩年連續虧損而被ST的公司作為企業陷入財務困境的標志。本文實證研究樣本集合為2002-2006年的我國滬深兩市包括中小企業板A股上市公司,共789家企業,其中困境樣本99個(分別由2005、2006、2007年首次被ST的樣本構成),配對樣本690個(均為2006年非財務困境公司,并且從2003-2005年從未有ST經歷)。本文數據來自于色諾芬CCER數據庫。
本實驗采用大規模平衡采樣方法進行數據抽樣,具體來說,是從非ST樣本中隨機選取99個樣本,將其和全部99個ST樣本合并成訓練樣本,再把剩下的591個非ST樣本和99個ST樣本合并成測試樣本。
3.2 特征子集的篩選
困境公司和正常公司的分類過程依賴于待識別對象的一組基本特征,特征選擇的目的是辨識關鍵特征,用較少變量達到精確決策。因此理論界和實務界一直致力于尋找一套完美的指標變量組合,配以恰當的預測方法,能夠精確地辨別處于財務困境初級階段的企業。但遺憾的是,迄今為止,眾多的實證研究所應用的變量組合大多是根據經驗或前人的研究實踐而確定的,并且對企業財務困境產生重大影響的許多定性指標難以量化到變量組合中去。
本文確定了如下指標庫:(總)資產收益率,凈資產收益率(凈利潤),凈資產收益率(營業利潤),(總)資產留存收益率,總資產營運資本率,速動比率,流動比率,資產負債率(債務資產比率),應收賬款周轉率,存貨周轉率(存貨的周轉次數),總資產周轉率,現金流動負債比率,現金負債比率,現金債務總額比,銷售現金比率,全部資產現金回收率,長期股權投資效率比率,銷售營業外收入比率,總資產增長率,主營業務收入增長率,資產總計(Log)。
根據我國關于ST特別處理上市公司的規定,如果T年是標簽年,那么只要T-1年零利潤為負數、T-2年零利潤為負數,T年將毫無疑問地被ST特別處理,因此用T-1年的屬性來預測T年是沒有意義的。所以本實驗直接根據T-2年的屬性預測企業在T年的二分類情況。
T-2年有21個變量,如果把21個變量全部納入到建模當中,由于統計不顯著的變量的加入,會影響模型的準確率,也會增加模型應用時的成本,因此要進行變量的篩選,選擇出對模型區分度最大的屬性。具體篩選變量的方法有很多種,本文通過逐步邏輯回歸(Stepwise)選擇變量。具體使用SAS 9.0,根據Stepwise方法篩選變量,通過Logistic回歸,用T-2年的數據進行建模。完成以上過程,入選的變量為T-2年的資產收益率和凈資產收益率。具體的建模結果如表1所示。
表1 財務困境前2年Stepwise特征集篩選結果
凈資產收益率(X8)1-13.842 64.922 67.907 70.004 9
從表1的結果可以看出,以95%為置信水平,則資產收益率和凈資產收益率通過了檢驗,這兩個屬性對于分類貢獻較大。
3.3 建立分類模型
根據表1,通過Logistic建模得到的分類模型為:
p=11+e-(-1.2659-33.5000X2-13.8426X8)
式中, p為公司陷入財務困境的概率。
從模型看,公司的資產收益率和凈資產收益率是判斷企業是否會陷入財務困境最好的解釋變量。公司的資產收益率和凈資產收益率對于公司是否會陷入財務困境都有負影響,如果公司上一年度的資產收益率和凈資產收益率越大,那么公司在下一個年度陷入財務困境的可能性越小。模型的結果和實際的經濟業務是吻合的,模型很好地擬合了公司現實中財務困境的實際狀況。另外,該模型只有兩個變量,那么在進行模型應用時只需要計算這兩個變量就可以判斷下一年公司陷入財務困境的可能性,成本非常低。
3.4 模型測試
下面測試模型預測企業陷入財務困境的能力。當樣本均衡時,Logistic模型預測擬合檢驗的闕值一般選擇0.5,當預測概率結果大于0.5時,判定結果為困境公司,否則為正常公司。困境公司用“1”表示,正常公司用“0”表示。根據標簽前兩年(T-2年)的數據得到的模型在測試集上進行預測,Logistic模型預測結果見表2。
表2 T-2年Logistic模型的分類準確率
從邏輯回歸預測結果來看,Logistic模型將99家困境公司中的9家誤判為正常公司,稱為一類錯誤;將591家正常公司中的58家誤判為困境公司,稱為二類錯誤,總誤判率為9.45%,判別模型的預測能力達到90.55%。很顯然,一類錯誤的成本要高于二類錯誤的成本,因此我們更關注如何降低一類錯誤。
3.5 基于T-3年特征集篩選及預測
同使用前面的數據建模一樣,根據Stepwise方法篩選變量,通過Logistics回歸,用T-3年的數據進行建模。完成以上過程,入選的變量為T-3年的資產收益率,凈資產收益率,銷售現金比率,全部資產現金回收率。構建模型過程與T-2年類似,根據T-3年的數據得到的模型在測試集上進行預測,預測結果見表3。
從預測結果來看,Logistic模型將99家困境公司中的22家誤判為正常公司;將591家正常公司中的220家誤判為困境公司,總誤判率為29.725%,判別模型的預測能力僅為70.275%,已經不能滿足預測的需要(一般認為75%是預測模型應該達到的基本準確率)。可以看到,使用提前3年的數據并不能夠進行企業財務困境預測,這主要是由于企業發展過程中面臨很多外部和內部不確定因素的變動,沒有財務指標能夠提前兩年預測企業的財務狀況,T-3年的財務數據基本不能預測公司未來的財務狀況。
使用T-2年數據篩選變量預測準確率較高,單獨用T-3年的數據篩選變量錯誤率非常高,不能滿足預測的需要,預測結果僅作為參考。
4 結 論
目前Logistic邏輯回歸被廣泛用于分類研究中,其主要原因是Logistic回歸不限制自變量的分布,而且應用起來相對簡便,準確率也相對較高。本文實驗結果也證明了在T-2年上,Logistic取得了較好的預測精度。但是,盡管Logistic回歸模型克服了多元線性判別分析的缺陷,不限制自變量的分布,沒有關于分布類型、協方差矩陣等方面的嚴格假定,但要求自變量之間不存在多重共線性干擾,否則會干擾模型的預測能力,并且Logistic回歸同樣基于統計學理論,因此要求大樣本。因此,在運用Logistic進行預測時,應盡可能保證最終輸入模型的變量之間不存在共線性,本文應用的Stepwise就是一種較好的能夠剔除變量共線性的特征子集篩選方法。
主要參考文獻
[1] W H Beaver. Financial Ratios as Predictors of Failure[J]. Journal of Accounting Research, 1966, 4(s): 71-111.
[2] Daniel Martin.Early Warning of Bank Failure:A Logit Regression Approach[J]. Journal of Banking and Finance, 1977, 1(3): 249-276.
[3] J A Ohlson. Financial Ratios and the Probabilistic Prediction of Bankruptcy[J]. Journal of Accounting Research, 1980,18(1): 109-131.
[4] 吳世農,盧賢義.我國上市公司財務困境的預測模型研究[J]. 經濟研究,2001(6):46-55.
The Application ofLogistic Model Financial Distress Prediction
LI Xiao-jing1, NIE Guang-li2,ZENG Jing3
(1. School of Economics and Management,University of Science and Technology Beijing,Beijing 100083,P.R. China;
2. Research Center on Fictitious Economy and Data Science, Chinese Academy of Sciences, Beijing 100190,P.R. China;
3. School of Applied Science,University of Science and Technology Beijing,Beijing 100083,P.R. China;)
Abstract: Corporate Financial Distress Prediction attracts a lot of people’s attention. The article summarized the main models in predicting financial distress which are Univariate Analysis, Multiple Discriminant Analysis, Logistic Regression, Neural Network, and so on. And features of different methods are discussed later. Then Logistic model is discussed in details. Finally, Logistic is applied to classify Chinese listed companies into ST and non ST groups. A good performance is received in year T-2.
Key words: Financial Distress;Prediction;Logistic Regression