摘要:隨著計量方法的改進,對企業破產的實證預測,重新成為理論界和實務界關注的重點。40年來代表性的破產預測實證模型包括專家評分系統、分離模型、多元分離模型、Logit模型、生存分析模型、神經網絡模型等。對于每種模型的假設前提、所選擇的解釋變量、預測能力以及可能的局限性進行評述,可以得出結論:多元分離模型雖然傳統,但實用性最強;分時風險模型因為改善了分離模型的靜態性,預測準確率也更高,是目前應用最廣泛的模型。
關鍵詞:破產預測;多元分離模型;分時風險模型
中圖分類號:F275.2 文獻標識碼:A 文章編號:1007-2101(2012)03-0051-04
從微觀經濟學的角度,如果企業到達停止營業點,就應該破產,但對于具體一個企業而言,停止營業點幾乎是無法計算的,因此,在實踐中只能從公司財務的角度,利用凈利潤、利息保障倍數等財務指標來預測企業的破產。很長一段時間以來,破產是公司財務問題,而非微觀經濟學問題。破產研究中,最吸引人的題目當屬如何預測破產。如果能相對早地獲得企業破產的信息,對于每個利益相關者來說,都可以避免破產所帶來的損失。從20世紀60年代開始,有關倒閉預測的實證研究出現開始,各種實證模型層出不窮,但哪種模型的預測能力最強,卻沒有定論。通常的實證研究只選擇其中的一種,對其他模型避而不談。實際上,選擇合適的模型,是實證研究最重要的一步。在下文中,作者對主流的破產預測模型逐一介紹,并就它們的優缺點簡單評述,以期為其他倒閉實證研究提供方法上的參考。
一、破產預測模型開端:財務指標的簡單排序
對破產或關閉的研究,始于專家評分系統(Credit Scoring)。直到現在,這種方法依然是像標普、穆迪這樣的國際評級機構衡量信用風險時所使用的主流模型。專家利用信譽(Character)、財務杠桿(Capital)、資本充足度(Capacity)以及擔保情況(Colateral)等信息形成對企業財務狀況的主觀判斷和評分。根據經驗和行業一般狀況,對4個“C”進行5檔分類,并對每一類的狀況進行具體描述。根據評級結果,得出正常還是關閉的結論。如Rosenberg和Gleit所說,建立在4“C”法基礎上的專家系統(Expert System)法仍然是判別破產的流行方法(Rosenberg 和Gleit,1994)。只不過,新的專家系統(Expert System)在傳統的“事實—結論”的基礎上,對是否被授予信用的過程做了更詳細的解釋,這也被稱為中間層。從理論研究的角度,評分法和專家系統法都缺乏理論基礎,使得結果像個黑盒子(Barakat和Bradley,2010),通常建立在專家的主觀判斷基礎之上,而主觀判斷的可延展性較差。
沿著評分的思路,更規范的方法是比率分析。Altman c.f.(1968),Altman、Haldeman和Narayanan(1977),Collins(1980),Olson(1980),Platt(1991)等都采取比率分析方法對破產問題進行過研究。他們所采取的比率分析主要是兩分法,即將樣本數據按大小排列,在中位數附近選出關鍵值,如果樣本觀測值大于這個值,就是倒閉,如果小于,就歸于非倒閉。Boritz(1991)曾經采用65個指標進行比率分析。 Hamer(1983)的分析認為,所選擇的指標與比率分析的準確性沒有直接關系。但Karels和Prakash(1987)卻認為恰恰相反:如果仔細選擇指標,對提高模型的預測準確性有很大幫助。在實際應用中,選擇關鍵值是一個試錯過程,分類的正確與錯誤只有在決策完成后才能看到。因此,關鍵值的確定無法完全準確,且總體關閉的預測與樣本也可能呈現很大不同。
比兩分法更進一步的是均值分析,即將正常組和關閉組樣本數據分別求平均值,得出正常組均值和關閉組均值。如果關閉和不關閉的兩組樣本的分布很“密”,或者說,每組樣本的均值幾乎沒有重疊,則均值法非常合適。因為均值不重疊,意味著兩組樣本之間差別明顯。而如果均值很松,或者說重疊很嚴重,則用均值無法對兩組樣本進行有效區分。
比率分析簡單,但有一定前提。首先,規模對比率分析有很大的影響,因為企業的償付能力往往與規模相關,因此,比率分析應該在同行業和同規模的基礎上進行。同樣的比率對于不同規模的企業,是否產生破產的結果,答案可能并不相同。其次,比率分析有時無法對關閉預測提供明確的答案。如A企業比B企業的償付能力更高,并不能說明A的關閉可能性,如果B的償付能力很差的話,比B好并沒有特別的意義。比率與其說可以預測倒閉,反倒不如說可以預測重大事件,而關閉僅僅是重大事件之一。
二、經典判別模型:分離模型(DA)
比率分析操作簡單,但不同比率可能得出不同的結論,而且,針對某一個企業所得出的結論只能應用于該企業,無法應用于其他企業的破產分析。建立具有在數理統計上可獲得穩健分析結果的模型,才能避免此類問題。
單變量的DA模型(discrimant analysis)以及在此基礎上發展出來的多變量MDA模型(multi-data analysis)是將統計方法用于預測企業破產最早的模型。
單因素DA方法與兩分法類似。首先,利用單個財務數據,比如,前1~3年的資產回報率,計算指標均值,然后,比較樣本實際值與均值,如果高于均值,則認為是危險的,如果低于,則是安全的。與兩分法相比,DA方法在分類的過程中,采用更多統計方法,使得檢驗結果更準確。比如,將樣本分為控制組和對比組,使用控制組,獲得能顯著分離兩類樣本的分離指標后,用于對比組企業的破產預測。所謂顯著分離,指的是在權衡發生第一類錯誤(將破產企業判斷為正常企業)和第二類錯誤(將正常企業判定為破產企業)的成本后,所能接受的顯著程度。從統計上說,追求更低的第一類錯誤,通常也意味著發生第二類錯誤的可能性更高;反之,追求更低的第二類錯誤則意味著犯第一類錯誤的可能性更高。因此,不可能獲得兩類成本都低的“最好”結果,只能權衡,獲得可接受的結果。一般情況下,因為第一類錯誤的成本遠高于第二類錯誤的成本,因此,使第一類錯誤更低的指標,更容易被接受。從已有的DA模型看,能夠顯著分離兩類樣本的財務指標包括如下五類:財務結構、償債能力、盈利能力、經營效率和成長能力。每一類指標下又有若干具體的財務指標來衡量。比如,財務結構指標可以由負債/總資產、負債/凈資產、流動負債/總資產、固定資產/總資產等指標來體現,但不同的研究采用不同的指標,這種不同可能與數據獲取、研究習慣等有關,而對研究結論不會產生太大影響。
因為不同的指標可能產生不同甚至相反的結果,使得判別變得難以抉擇。研究者試圖利用不同財務指標的線性組合,即MDA的方法,獲得比單因素指標更準確的預測指標。MDA的具體做法是,對每一個問題企業,找一個正常企業作為控制組,將樣本混合,然后重新分組;以控制組的多項財務指標作為自變量,破產(取1)和正常(取0)做因變量,回歸獲得每個指標的系數,將系數重新代入回歸方程,獲得因變量的估計值,對這組估計值排序,并在正常與破產之間劃定關鍵值,稱為Z值;將用控制組得出的回歸系數與實驗組的相應指標代入方程,得出因變量,并與Z值進行比較,如果大于關鍵值,則關閉,如果小于關鍵值,則正常。Altman開發的七因素的ZETA模型,就是MDA模型的代表。它的本質內涵是,用會計和市場指標的線性組合來區分兩組樣本,即使組間方差最大而組內方差最小。
Altman(1968)的分析表明,Z值在1.81以下的可以判定為關閉,2.97以上為不關閉,在兩者之間是灰色區域。他認為,MDA準確性相當高,發生第一類錯誤和第二類錯誤的可能性都在可以接受的范圍內,第一類樣本的準確率可以達到90%以上。第一類錯誤和第二類錯誤分別只有3%~4.5%左右,比兩分法和單因素DA方法都低。
MDA模型有著廣泛的適用性,這可以從Altman(1997)對22個國家從1968—1996年預測企業破產的研究所做的回顧中看出來。在近30年的研究中,采用MDA模型的研究仍是主流的方法。雖然,新的研究對經典的MDA做了一些拓展,比如,自變量非線性假定、為減少多重共線性而進行的主成分分析方法以及加入考慮行業特征的變量等,但從已測準確程度和誤判成本兩方面權衡后發現,經典模型繼續保持自身的優越性。例如,在針對意大利企業破產的研究中,將MDA和神經網絡模型的預測進行比較(Altman、Marco和Varetto,1994)后發現,MDA模型具有更好的穩定性以及更低的模型調整成本。當然,線性的MDA模型也有自身無法解決的問題,比如,每個指標的權重確定,往往比較主觀。再者,線性模型的基礎是最小二乘估計,假定組內變量間的方差相等,才能用線性模型來估計。如果變量之間的方差不等,則必須用非線性模型進行估計,否則得出的結果將是有偏且不一致的。此時一般采用最大似然估計。Martin(1977)邁出了銀行關閉實證研究方法從線性向非線性方法轉變的關鍵一步。他假定企業破產的風險服從Logit分布,即累積分布函數,而非線性函數。在Logit假定下,自變量不需要遵循正態分布,因此,可以是離散的,甚至可以是虛擬變量,因變量最終取值在0~1之間,而不是負無窮到正無窮。函數關系采取Probit或Logit模型。線性模型的缺點是,因變量不能控制在0~1的范圍內,對事件發生的解釋有一定困難。Probit和Logit模型的分布分別為正態分布和Logistics分布,可以使因變量控制在0~1的范圍內,便于進行概率分析。而在因變量為離散變量的前提下,普通的最小二乘估計方法所得出的結果是無效的,必須采用極大似然估計。這時非線性模型更有優勢。以logit方法為代表的非線性估計也有缺陷,正如Shumway(2001)所說,Logit估計容易產生向下的偏差,因為同一樣本不同年份的觀察值被認為是獨立的,但實際上,同一樣本不同年份的觀察值之間很有可能相互關聯。
無論是MDA,還是Logit,自變量僅選擇財務指標。Shumway(2001)建立了分時風險模型(discrete time hazard model),同時考慮財務指標和市場指標。市場指標可能更快地感受到企業的未來,而不是通過歷史來推測未來。與傳統方法的靜態研究方式不同,分時風險模型的最大特征是,考慮了破產事件本身的動態特征,而且避免了MDA模型“事先選擇”樣本,造成的估計結果的有偏和不一致。在考慮了時間因素的基礎上,分時風險模型不僅使用倒閉當年的數據進入樣本,也使用之前的數據作為樣本,大大提高了樣本容量的預測精度。在方法上,分時風險模型的估計和普通的logit模型一樣,也采用最大似然估計,但所選取的自變量不僅包括財務指標,如流動資產/總資產、留存收益/總資產等,還包括像股票收益率、收益率標準差等資本市場指標。他的實證研究表明,將財務指標與市場指標結合的模型的預測能力更強。因此,建立在計量經濟學發展基礎上的分時風險模型是目前預測精度最高、應用范圍最廣的實證模型。
三、預測破產的其他方法
MDA方法是傳統的預測破產的方法,也是使用最廣泛的預測方法。由于現實經濟中的數據通常無法滿足統計假設,這會導致模型出現無法克服的缺陷。比如,極值數據點偏差、多元正態假設和組間協方差假設無法滿足時,MDA所得出的結論可能是錯誤的(Balcaen和Ooghe,2006)。同時,MDA僅考慮財務指標,但不同地區、不同行業的同一個指標是否具有可比性,是不確定的,因此,按照同一標準考察破產的可能性,可能會產生錯誤的結論。在這樣的背景下,開發其他實證模型也就順理成章了。數據挖掘(data mining)技術的最新進展,也使這一設想變成了現實(Chung和Gray,1999)
(一)遞歸分割算法
Recursive partition analysis(RPA)是二元樹形結構。根據先驗概率和錯誤分類的成本將樣本分為若干類,也就是樹形圖的節點。分類的標準是使期望的錯誤分類成本更小。RPA將樣本空間分成多個矩形,而DA方法只能將樣本分成兩個區域。DA方法首先使組間和組內的方差最大化,然后才按照錯誤分類成本和先驗概率將樣本分入不同的組。而RPA在最初選擇自變量以及組的分類時,同時考慮錯誤成本和先驗概率。因此,分類成本和先驗概率的變化,對RPA的結果影響很大,但對MDA沒有太大影響。從分類準確率來看,取決于誤判成本,在誤判成本較高或較低時,RPA是更好的選擇,而當誤判成本取中間值時,二者有相當的風險。從準確率的角度,RPA都大于MDA,但從模型的可解釋性上看,MDA顯然超過了RPA。
(二)生存分析
MDA模型考慮的時間序列通常較短,因為實證研究發現,時間越長,模型預測的準確率越差。一般而言,超過5年的數據的準確率不超過30%,因此,模型通常涵蓋的時間都不超過5年。但公司從經營不善到破產,持續的時間可能超過5年,而且模型所選取的時期也有可能沒有涵蓋企業破產的時點,因此,生存分析中的COX模型考慮時間序列的特征,更適合處理如下狀況:估計企業從某個起點事件到終點事件之間的生存時間,而不是像MDA模型那樣,在某個固定的時點判斷企業破產的可能性。COX模型的核心是生存函數。通過風險函數的偏似然估計得出回歸系數,再利用回歸系數計算基礎生存率,最后得出生存函數。若特定時點的生存概率小于某一特定分界值C,則可以判定為財務困境公司;若生存概率大于C,則可以認定是財務健康的公司。與MDA相比,生存分析可以避免組內同方差、實驗組和控制組間規模行業等各方面必須一致、統計上不太現實的假定等,因此,所獲得的檢驗結果也更穩健。但COX模型與MDA模型的優劣沒有壓倒性的一致結論,取決于誤判成本和樣本的時間跨度。在第一類誤判成本較高的前提下,COX不如MDA,反之,則COX更優。
(三)神經網絡(neutral network)模型
這是神經網絡系統模仿人腦對事件分類時采用的方式,是一種由大量簡單、互相關聯的處理單元(也稱為節點)組成的計算系統。每個處理單元都會接受和整合輸入的信號,并把它們轉換成單一的輸出信號。同時,每個處理單元也可以作為其他單元的輸入信號被發出。通過神經網絡模型進行分類類似于不斷提高受歡迎的節點的比重,同時降低不受歡迎的節點的比重,使得對決策空間的分類更加準確。最終,建立訓練集,對應輸入與輸出之間的完美映射。完美映射的標準是,最小化平均預測殘差,這時,調整的過程最后停止。如果也用決策空間的語言來描述MDA模型,它只能用定量指標,通過直線的方式,對空間進行劃分;而神經網絡模型,可以同時使用定量和定性指標,通過隱藏節點,將決策空間分成任意數目的由復雜邊界定義的區域。從分類的準確率來看,MDA在短期的準確率較高,而神經網絡模型在較長時間時,分類準確率可以達到80%以上。很多研究(Alici,1996;Tyree和Long,1996)證明,神經網絡模型的預測準確率高于MDA。Altman(1994)持不同看法,在他看來,神經網絡模型在透明性、結論可解釋程度方面都不如MDA。確實,神經網絡模型最大的缺點在于結論缺乏可轉換性(transportability)(David L Olson,2011):因為模型的節點集太復雜,每個節點的比重也很難確定,因此,即使在當前數據集中獲得很好的分類結果,也難以應用到未來的預測中。
上述方法可能都比MDA方法能獲得更好的分類效果,但問題在于,結果很難解釋:所謂的“黑匣子”問題,無法確定每個因素對破產的具體貢獻,從而也就無法深入了解將公司劃定為破產或不破產的原理。也正是因為這樣的原因,MDA繼續得到廣泛應用,而一些更新、更復雜的模型應用卻不那么廣泛(Crook和Overstreet,1996;Altman和Saunders,1998)。
四、宏觀環境與破產
企業的破產,不僅與自身經營狀況有關,更與行業因素、宏觀環境相關。研究發現,不同行業和處于不同的宏觀經濟狀況時(衰退和復蘇),同樣的一組財務指標在預測破產時,所得出的結果差異很大。在衰退時期,資金,尤其是流動資金不足、現金流不足、應收款和存貨過多,都會導致破產的可能性增大。在此階段的破產模型中,資產負債率、獲得現金流的能力、流動性以及存貨比率等指標更重要。而在經濟上升時期,利率、通貨膨脹率等指標在模型中處于更重要的地位。宏觀經濟增長的幅度,尤其是行業增長的水平,通常和該行業中企業破產的比率負相關。在增長比較顯著的行業,破產的可能性相對也更低;反之則相反。通貨膨脹率、利率也都對破產的發生產生影響。傳導的途徑是,通貨膨脹通過影響存貨、利潤率、資產收益率等,對破產的可能產生影響;而利率水平通過影響資金成本,從而影響利潤率,并進而對破產可能產生影響(Yaw M. Mensah,1984)。
問題在于,預測破產的模型是靜態的,如果在不同周期階段,采用同樣的模型,會產生非平穩性問題。在模型形式上,仍然采取傳統的Logit模型。采取配對的方法,對于破產企業,根據資產規模和行業分類,選擇類似的非破產的企業作為配對,然后對兩組樣本的相應指標進行對比,看是否存在顯著差異。因為考慮宏觀因素和行業因素后,自變量太多,導致共線性問題非常嚴重,因此,更近的研究一般采取主成分分析法,將宏觀因素、行業因素以及財務指標合并獲得主成分,然后將主成分代入模型。Swanson和Tybout(1981)研究阿根廷軍事政變后,一系列改革措施對企業破產的影響。他們所采取的方法是,將宏觀因素每兩個一組放入回歸模型中,檢測每組變量對破產的影響。研究發現,利率變量和信用等級是解釋能力最強的兩個因素。
五、公司治理與破產的聯系
企業面臨的環境還包括微觀治理環境,比如經理的積極性、承擔風險的能力、產權結構以及利益相關者之間的關系等。Rose(1992)認為,如果企業進行多元化經營,破產的可能性更低;相對于無限責任的股東,有限責任股東有擴大風險的傾向,因此,企業更容易走向破產;如果經理人的財富大多集中于不可分散的人力資本,會更偏向于風險規避;如果他們同時持股或擁有期權,利益與股東趨于一致,風險規避的程度會有所降低(Rose,1992;Anthony Saunder、E Strock和N Travlos,1990)。影響破產的治理因素還包括企業的規模、成立時間等。因為因素眾多,無法將所有的因素同時納入模型,因此一般采取案例研究的方式,對類似的破產案例進行類型化研究,并總結出可能導致破產的原因(Hubert Ooghe和Sofie De Prijcker,2008)。
參考文獻:
[1]Alici,Y. 1996,Neural networks in corporate failure prediction:The UK experience. In Neural Networks in Financial Engineering. A. Refines,Y. Abu-Mostafa,and J. Moody (Eds.):London:World Scientific.
[2]Altman,E. I. and Marco and F. Varetto. 1994,Corporate distress diagnosis:Comparisons using linear discriminant analysis and neural networks (the Italian experience).” Journal of Banking and Finance 18:3:505-529.
[3]Altman,E. I.,and Saunders,A.,1998,Credit risk measurement:Developments over the last 20 years. Journal of Banking and Finance,21(11-12),1721.
[4]Anthony Saunder,Strock and N Travlos,1990,Ownership Structure,Deregulation and Bank Risk Taking ,the Journal of Finance。
[5]Balcaen,S.,and Ooghe,H.,2006,Thirty-five years of studies on business failure:An overview of the classic statistical methodologies and their related problems. The British Accounting Review,38,63-93.
[6]Chung,H.M. and Gray,P. 1999,“Data mining”,Journal of Management Information Systems,Vol. 16 No. 1,pp. 11-13.
[7]Barakat.N and Bradley A.P.,2010,Rule Extraction from Support Vector Machines:A Review,Neuro computing 74 (1-3),pp178-190.
[8]Desai,V. S.,Crook,J. N., Overstreet,G. A.,1996,A comparison of neural networks and linear scoring models in the credit union environment. European Journal of Operational Research,95(1),24-37.
[9]David l Olson,2011,Comparative analysis of data mining methods for bankruptcy prediction,Decision Support Systems.
[10]Hubert Ooghe and Sofie De Prijcker,2008,Failure processes and causes of company bankruptcy:a typology,Management Decision,Vol. 46 No. 2,pp. 223-242.
[11]Martin,D.,1977,Early warning of bank failure:A logit regression approach. Journal of Banking and Finance,1,249-276.
[12]Rosenberg E,Gleit A. 1994. Quantitative methods in credit management:a survey. Operations Research 42(4).
[13]Rose,David,1992. Bankruptcy risk,firm-specific managerial human capital,and diversification,Review of Industrial Organisation 7,65-73.
[14]Yaw M. Mensah,1984,An Examination of the Stationarity of Multivariate Bankruptcy Prediction Models:A Methodological Study,Journal of Accounting Research,Vol. 22,No. 1,pp. 380-395.
責任編輯、校對:王巖云
The Enterprise Bankruptcy Forecast Empirical Model
Wang Lina
(Economy Research Institute, Chinese Academy of Social Sciences, Beijing 100083, China)
Abstract: With the improvement of the measurement method, the empirical prediction of the enterprise bankruptcy again becomes the critical concern of theory and practice. The representative bankruptcy predicted empirical model of 40 years includes experts marking system, separation model, multiple separation model, Logit model, survival analysis model, the neural network model, etc. By conducting recitation for each model hypothesis, the choice of explanatory variables, and the limitation of the prediction ability, we can draw the conclusion that the multiple separation model is traditional, but its practical applicability is the strongest. Time-share risk model can improve the quiescent condition of the separation model, its predict accuracy is higher too, and is now one of the most widely applied model.
Key words: bankruptcy forecast; multiple separation model; time-share risk model