吳旭東
摘 要:企業在發生破產之前,它的很多財務指標會跟財務良好的企業之間有一定的區別。文章運用多元統計分析中的判別分析,對21家破產企業和25家財務狀況良好的企業的幾項不同的指標做了分析,用SPSS構造了費希爾線性判別函數,并運用此函數判定企業的財務狀況是否良好。
關鍵詞:判別分析;破產企業;財務狀況
1 判別分析原理
在生產、科研和日常生活中,經常遇到需要判別的問題。判別分析本質上具有探索性。作為一種分割方法,它通常在因果關系不甚明了的情況下被一次性地用來對所觀察到的差別進行調查。例如,在地質勘探中,我們在某地區采集到某種礦物標本,需要判定它是哪種礦物;又如,在醫院對一名患者作各種化驗檢查、獲得有關指標和數據、要診斷患者得的是哪一種疾病,等等,這些都屬于判別問題。
判別分析是應用性很強的一種多元統計方法,已滲透到各個領域,但不管哪個領域,判別分析問題都可以這樣描述:設有k個m維總體G1,G2, …,GK,其分布特征已知(如已知分布函數,或知道來自各個總體的訓練樣本)。對給定的新樣本,我們要判斷它來自哪個總體。
常用的判別方法主要有下列幾種:
(1)最大似然法
用于變量均為分類變量的情況。該方法建立在獨立事件概率乘法原理的基礎上,根據訓練樣本信息求得因變量各種組合情況下樣品被分為任何一類的概率。當新樣品進入時,則計算它被分到每一類中的條件概率(似然值),概率最大的那一類就是它最終評定的歸類。
(2)距離判別
它的方法是由訓練樣本得出每個分類的重心(中心)坐標,然后對新樣品求出它們離各個類別重心的距離遠近,從而歸入離得最近的分類。最常見的距離是馬氏距離,偶爾也采用歐氏距離。
距離判別的特點是直觀簡單,適合于對因變量均為連續的情況進行分類,且它對變量的分布類型無嚴格要求。
(3)Fisher判別
亦稱典型判別,該方法的基本方法是投影,即將原來在R維空間的因變量組合投影到維度較低的D維空間去,然后在D維空間中再進行分類。投影的原則是使得每一類內的方差盡可能小,而不同類別之間的投影的方差盡可能大。
Fisher判別法的優勢在于對分布、方差等都沒有什么限制,應用范圍較廣。另外,用該判別方法建立的判別方程可以直接用手工計算的方法進行新觀察對象的判別,這在許多時候是方便的。
(4)Bayes判別
許多時候對各類別的比例分布情況有一定的先驗信息,比如說客戶對投遞廣告的反應絕大多數都是無回音,如果進行判別,自然也應當是無回音居多。Bayes判別就可以利用這種先驗信息,它的基本方法是認為所有P個類別都是空間中互斥的子體,每個觀察都是空間中的一個點。在考慮先驗概率的前提下,利用Bayes公式按照一定的準則建構一個判別函數,分別計算該樣品落入各個子體的概率,所有概率中最大的一類就是被認為是該樣品所屬的類別。
Bayes判別的強項是進行多類判別,但是它要求母體呈多元正態分布。
在下面的應用中,主要使用SPSS軟件分析輸出以Fisher判別為主給出的結果。在指定選項后,也可以給出Bayes判別式的結果。
文章中主要運用Fisher判別。Fisher的想法是將多元觀測值x變換成多元觀測值y,使得總體?仔1和?仔2導出的y盡可能地分離開。Fisher建議用x的線性組合來建立y,因為它們是x的非常簡單的函數,易于掌握。
Fisher的線性判別函數是在假定兩個總體有相同協方差的條件下得到的。因此,毫不奇怪Fisher方法與最小錯分代價法則這種特殊情況相對應。Fisher分類法則等價于在相同先驗概率和相同錯分代價下的最小ECM法則。
為具有均值向量?滋i和協方差矩陣?撞i的正態密度函數的情形。若進一步假定c(i|i)=0,c(k|i)=1,k≠i(或等價的,所有錯分代價相同),則上述最小ECM分類法則變成:
則將x分配到?仔k。
在上式中,常數(p/2)ln(2?仔)可以略去,因為對所有的總體都相同,因此我們將第i個總體的二次判別得分定義為
實踐中?滋i和?撞i兼屬未知,但常可獲得一組已經正確分類的訓練樣本,因此可以用樣本均值xi來估計總體均值?滋i,以及用樣本協方差矩陣Si來估計總體協方差矩陣?撞i。此時二次于是基于樣本的分類法則如下:
估計的最小TPM法則(對?撞i不同的多個正態總體)
若二次判別得分
則將x分配到?仔k。
若先驗概率未知,通常的做法是令 。
2 多元判別分析法
2.1 判別分析的基本步驟
應用SPSS進行判別分析模型的構建,其過程為:對于分為k組的研究對象,可建立(k-1)個典型判別函數(原始自變量的線性組合),和k個Fisher判別函數,然后將各樣本的自變量回代到判別函數中,計算器判別分數或屬于各組的概率,根據數值的大小,判別樣品所屬組別,對樣品的原始組別給出錯分率。具體步驟如下:
(1)選擇自變量和組變量。
(2)計算各組單變量描述統計量,包括組內均值、組內標準差、總均值、總標準差、各組協方差矩陣、組間相關矩陣、并對組間均值相等和協方差矩陣相等的零假設進行檢驗。
(3)推導判別系數,給出標準或未標準化的典型判別函數系數,并對函數顯著性進行檢驗。
(4)建立Fisher線性判別模型。
(5)按照一定的規則進行分組。
(6)進行樣本回判分析,計算錯分率。
(7)輸出結果。
(8)結合實際情況進行分析。
2.2 建立模型的數據假定和原始數據的選擇。
對破產的企業收集它們在破產兩年的年度財務數據,對財務良好的企業也收集同一時期的數據,數據涉及四個變量,X1=CF/TD(現金流量/總債務),X2=NI/TA(凈收益/總資產),X3=CA/CL(流動資產/流動債務),以及X4=CA/NS(流動資產/凈銷售額),數據列于表1所示。
表2是獨立變量的全部和各組的均值和標準離差。
表3給出了合并類內協方差矩陣和相關矩陣,陣中個元素是各類協方差或相關陣中對應元素的均值。從表中可以看出,X1=CF/TD(現金流量/總債務)和X2=NI/TA(凈收益/總資產)的相關系數值(0.758)較大,說明這兩個變量有較好的相關性,如果需要剔除這四個變量中的某個變量,通常采取剔除X1=CF/TD(現金流量/總債務)和X2=NI/TA(凈收益/總資產)這兩個變量中的一個比較好。
表4給出了各類的協方差矩陣和總協方差矩陣。
表5給出了Fisher線性判別方程的系數。利用表中的數據可直接寫出判別方程,有幾類就有幾個分類方程。將某個樣品代人方程計算其在各類別上的得分,并根據分值多少判斷其所屬類別,比較不同類的判別分值,哪個大就屬于哪一類。
破產企業的判別函數為:
未破產企業的判別函數為:
例如,第一行的原始數據為(-0.45,-0.41,1.09,0.45)代入上述式中,得
y1=7.40191,y2=2.00561,y1的數值比y2大,所以這個企業屬于破產企業。
表6給出了判別分析結果的統計評價。從表中可以看出,它給出了全部樣品建立判別方程的正確分類的樣品數,錯分樣品數和錯判率;交叉驗證建立判別方程的正確分類的樣品數,錯分樣品數和錯分率。全部樣品建立判別方程的正確分類結果為破產企業的錯判率為9.5%,財務狀況良好的企業錯判率為8%;交叉驗證建立判別方程的正確分類結果為破產企業的錯判率為14.3%,財務狀況良好的企業錯判率為16%。如果對判定的結果不滿意的話,可以進一步收集數據,或者引入其他的財務指標進行分析。會提高判定的準確性。
參考文獻
[1]RichardoA.Johnson、DeanW.Wichern.實用多元統計分析[M].陸璇,葉俊譯.北京:清華大學出版社,2008,11.
[2]張潤楚.多元統計分析[M].北京:科學出版社,2006,9.
[3]章紅波,陳紅艷.實用數據統計分析及SPSS12.0應用[M].北京:人民郵電出版社,2006,2.
[4]林杰斌等.統計建模與應用實務[M].北京:中國鐵道出版社,2006,
2.
[5]劉晶等.基于多元判別分析的財務預警系統[M].北京:中國管理信息化,2010,2.
[6]衷克定.統計數據分析與實踐[M].北京:高等教育出版社,2005,4.
[7]周皓.統計基礎和SPSS入門與提高[M].北京:清華大學出版社,2005,10.
[8]何少華,文竹青,等.實驗設計與數據處理[M].北京:國防科技大學出版社,2002,10.
[9]高惠璇.應用多元統計分析[M].北京:北京大學出版社,2005,1.
[10]林震巖.多變量分析-SPSS的操作與應用[M].北京:北京大學出版社,2007,8.