Logistic回歸模型的經(jīng)驗(yàn)似然統(tǒng)計(jì)方法及其應(yīng)用

信用風(fēng)險(xiǎn)又稱為違約風(fēng)險(xiǎn),是商業(yè)銀行面臨的最主要風(fēng)險(xiǎn).要想避免其發(fā)生,首先需要解決的就是如何度量及預(yù)測風(fēng)險(xiǎn).由于Logistic模型在數(shù)據(jù)采集、變量選擇和模型構(gòu)建方面比較符合我國的實(shí)際情況,且具有可靠的識(shí)別和預(yù)測能力。故采用該模型來構(gòu)建針對我國上市公司的信用風(fēng)險(xiǎn)預(yù)警模型.在對Logistic模型的參數(shù)進(jìn)行估計(jì)時(shí),采用經(jīng)驗(yàn)似然估計(jì)法。
經(jīng)驗(yàn)似然的估計(jì)方法
經(jīng)驗(yàn)似然方法最早由 Owen提出,其本質(zhì)是在約束條件下,求非參數(shù)似然比的極大值,而總體參數(shù)由約束條件帶入極大似然比中.假設(shè)Xi(i=1,2…n)是獨(dú)立同分布的樣本,F(xiàn)為分布函數(shù),θ為p維待估參數(shù)向量.由于F分布未知,用非參數(shù)似然來對θ進(jìn)行討論,定義如下非參數(shù)似然函數(shù):

把E( g( x,θ))=0作為約束條件,從而定義了似然函數(shù):

即是Qin & Lawless于1994定義的半?yún)?shù)模型中,參數(shù)θ的經(jīng)驗(yàn)似然函數(shù)。由拉格朗日乘子法,可以將問題轉(zhuǎn)化為最大化其約束條件為:

則拉格朗日函數(shù)可表示為:
則θ的對數(shù)經(jīng)驗(yàn)似然函數(shù)可表示為:

Logistic模型的經(jīng)驗(yàn)似然估計(jì)
對于Logistic模型,

參數(shù)β的對數(shù)似然函為:

關(guān)于參數(shù)β求導(dǎo),化簡可得到估計(jì)方程為:

則參數(shù)β的對數(shù)經(jīng)驗(yàn)似然函數(shù)為:

把γ, β看成兩個(gè)獨(dú)立變量,定義


數(shù)據(jù)與指標(biāo)選取
本文以滬深A(yù)股2015年18家ST公司作為風(fēng)險(xiǎn)樣本,遵循相應(yīng)原則選擇不存在風(fēng)險(xiǎn)的54家非ST公司為配對樣本.Y表示t年的狀態(tài),X表示財(cái)務(wù)指標(biāo)比率,使用樣本t-2年的財(cái)務(wù)數(shù)據(jù)構(gòu)建信用風(fēng)險(xiǎn)預(yù)警模型.在前人基礎(chǔ)上選擇了常用的18個(gè)指標(biāo):凈資產(chǎn)收益率、總資產(chǎn)收益率、主營業(yè)務(wù)利潤率、每股凈資產(chǎn)、每股收益、固定資產(chǎn)與股東權(quán)益比率、應(yīng)收賬款周轉(zhuǎn)率、固定資產(chǎn)周轉(zhuǎn)率、總資產(chǎn)周轉(zhuǎn)率、凈資產(chǎn)周轉(zhuǎn)率、資產(chǎn)負(fù)債率、流動(dòng)比率、速度比率、產(chǎn)權(quán)比率、主營業(yè)務(wù)增長率、固定資產(chǎn)投資擴(kuò)張率、總資產(chǎn)擴(kuò)張率、凈資產(chǎn)增長率。
因子分析
選取的財(cái)務(wù)指標(biāo)間具有很高的相關(guān)性,為了克服變量間的多重共線性,采用因子分析法對指標(biāo)進(jìn)行簡化.運(yùn)用SPSS對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,再對變量進(jìn)行KMO和Bartlett球形檢驗(yàn),其KMO值為0.696,Bartlett檢驗(yàn)對應(yīng)的顯著性概率為0.000,說明原變量適合做因子分析.由因子分析的總方差解釋表可知,變量相關(guān)矩陣的前 5個(gè)因子的特征值大于 1,它們解釋了總方差的 86.11%。最終選出5個(gè)因子。通過因子旋轉(zhuǎn)方法得到成分得分系數(shù)矩陣,如下表所示。

從旋轉(zhuǎn)成分矩陣中可看到,主營增長率、固定擴(kuò)張?jiān)鲩L率在第一個(gè)因子的載荷較高,反應(yīng)了企業(yè)的成長能力;固定資產(chǎn)與股東權(quán)益比率和每股資產(chǎn)收益在第二個(gè)因子上載荷較大,反應(yīng)了股東獲利能力;流動(dòng)比率和速度比率在第三個(gè)因子上載荷較高,反應(yīng)了償債能力;總資產(chǎn)收益率和主營業(yè)務(wù)利潤率在第四個(gè)因子上載荷較高,反應(yīng)了盈利能力;固定資產(chǎn)周轉(zhuǎn)率在第五個(gè)因子上載荷較高,反應(yīng)了運(yùn)營能力。因此,由上表可得到各主成分因子的表達(dá)式f1、f2、f3、f4、f5。
Logistic模型參數(shù)估計(jì)及有效性驗(yàn)證
利用R語言求出logistic模型的極大經(jīng)驗(yàn)參數(shù)估計(jì)值為β0=-0.38,β1=0.78,β2=0.69,β3=-0.64,β4=-2.45,β5=0.2,則logistic模型可表示為

對模型進(jìn)行驗(yàn)證,把24家測試樣本t-2年的數(shù)據(jù)帶入到模型中,并以0.5為最佳判別點(diǎn),得到判定結(jié)果如下:

由表可以看出,在檢驗(yàn)樣本中有 3 家公司被誤判,其正確率為 86%.所以文中所構(gòu)建的 logistic 回歸模型的效果還是比較理想的。
將Logistic 回歸模型的經(jīng)驗(yàn)似然方法應(yīng)用到數(shù)據(jù)的分類問題中,通過樣本篩選、模型創(chuàng)建及模型檢驗(yàn)等步驟,建立了基于logistic回歸的風(fēng)險(xiǎn)評估模型.將該方法應(yīng)用到實(shí)例中,其預(yù)測正確率達(dá)到了86%,是一個(gè)較為成功的模型.但本文也有很多不足,文中得到的結(jié)果都是在參數(shù)個(gè)數(shù)小于樣本容量下產(chǎn)生的,關(guān)于參數(shù)發(fā)散情況下Logistic模型的經(jīng)驗(yàn)似然方法的統(tǒng)計(jì)推斷和分類問題還有待進(jìn)一步研究。
10.3969/j.issn.1001- 8972.2016.20.010