唐建榮,譚春暉
(江南大學 商學院,江蘇 無錫 214122)
信用風險又稱為違約風險,是指借款人、證券發行人或交易對方因種種原因不愿或不履行合同條件而構成違約,致使銀行、投資者或交易另一方遭受損失的可能性[1]。國內外不少學者對信用風險評估問題進行了探索和研究,但由于缺乏足夠的數據,傳統的分析方法顯得捉襟見肘。本文引入一種基于小樣本學習的方法——支持向量機(SVM),并運用其構建商業銀行信用風險模型,取得了較好的評估效果[2]。
支持向量機(SVM)是在高位特征空間使用線性函數假設空間的學習系統,它由一個來自最優化理論的學習算法訓練。此學習策略由Vapnik和他的合作者提出,是一個準則性的并且強有力的方法[3]。
支持向量機對企業預期違約概率的度量主要有以下四個步驟:(1)樣本空間的選擇。一般來說,以企業資產價值作為標準來選擇違約企業,并注重這些企業資產價值的均值、標準差和范疇。(2)選取解釋變量。在企業違約風險度量分析中,作為解釋變量的財務指標的設計和選取關系到支持向量機和預測企業信用狀況的成敗。上市公司的信用數據主要來源于企業不同時期的財務報表,如資產負債表、損益表和現金流量表等,以及企業資產、債務等的市場價值或價格。(3)模型分析。運用支持向量機分析選取最優的財務指標,將其轉換為唯一的企業信用狀況判別值,并在此基礎上度量企業的預期違約概率。(4)模型檢驗。利用不同的統計量對模型結果進行驗證,對模型是否準確預測企業違約做出評價[3]。
經營失敗企業的財務數據難以搜集,在很大程度上阻礙了企業違約風險的理論和實證研究。中國證監會要求上海證券交易所和深圳證券交易所對企業經營出現異常狀況的上市公司的股票實行特別處理,這些上市公司的財務數據可以替代度量企業的信用違約風險。
本文選取滬深兩市的150多家上市公司的財務比率數據進行分析,數據來源于金融界網站。其中樣本由經營正常組和經營失敗組組成,排除掉一些數據缺失的企業,最終留下123家有效企業數據,其中包括經營正常組73家,經營失敗組50家,見表1。

表1 樣本分布情況
行業的劃分是按照中國證券監督管理委員會關于上市公司行業劃分的最新方法,樣本來自包括農業、各類制造業、房地產業、商業和零售業、其他各種服務業和綜合業。
論文考慮了各方面的影響要素,依據指標選取原則,參照常用的企業績效評價指標體系和國內外文獻的相關研究,從金融機網站中選取了反映上市公司財務狀況的償債能力、每股收益、經營效率、盈利能力和財務結果等6方面的財務比率數據[8]進行分析(見表2)。對這16個財務比率指標進行主成分分析,最終得到10個主成分,使其盡可能多的包含原始數據的大部分信息并解決了指標變量之間的多重共線性問題。
設模型樣本數為 n,X=(X1,X2,…,Xp)T是一個 P 為向量,X是模型選取的財務比率指標矩陣。構造樣本集(x,y),x維數為10,y是樣本的類別,設經營正常企業y=1,經營失敗企業y=-1。支持向量機中有多種不同的核函數,主要包括徑向基核函數,穩態高斯核函數,多項式核函數,雙曲正切核函數等。有研究表明,不同的核函數得到的結果性能相差不大[7]。本文構造的支持向量分類模型的核函數采用最常見的徑向基核函數:K (xi,xj)=e-|xi-xj|/2σ2。本文使用OSU SVM Classifier Matlab Toolbox3.0工具包進行分析。

表2 模型使用的財務比率指標
不同的徑向基核函數的參數懲罰系數C和σ2取值不同,所得到的支持向量個數、第一類錯誤誤識率,第二類錯誤誤識率、準確率也不盡相同。通過反復試算選取最佳的核函數參數:
當σ=1時,無論懲罰因子C取何值,通過Matlab軟件得到的模型的支持向量的個數為69,對測試樣本進行預測:第一類錯誤,即將違約企業錯分為正常企業的概率為25%,第二類錯誤:即將正常企業錯分為違約企業的概率都為24.24%,測試樣本的準確率為75.47%。由此可知,當σ=1時,模型對懲罰因子C的變化并不敏感;
當σ=5時,隨著懲罰系數C的不斷變化,模型所得到的支持向量的個數不斷變化。當C=1時所得到的支持向量的個數為49,隨著C的不斷增加,支持向量的個數不斷減少。當C=50時,模型所得支持向量個數減少至23,接著又隨C的增加而增加。第一類錯誤誤識率在15~20%,第二類錯誤誤識率隨著C的不斷增加而增加,C=1時達到最小,為9.09%,測試樣本的準確率也隨著C的不斷增加而減少,C=1準確率達到86.79%;
當σ=10時,支持向量的個數隨C的不斷增加而減少,當C=800時支持向量個數為24,此時達到最少。第一類錯誤誤識率在10~20%之間,第二類錯誤誤識率隨C的不斷增加而不斷提高,測試結果的準確率隨C的不斷增加而降低,當C=10和C=30時,準確率最高,為86.79%。
第一類錯誤為將違約企業錯分為正常企業,第二類錯誤為將正常企業錯分為違約企業,兩類錯誤相比較,第一類錯誤較為嚴重,第二類錯誤的發生,僅僅是失去可以償還貸款的客戶,損失的只是貸款所得的利息;而第一類錯誤的發生,將直接導致銀行嚴重的損失,銀行放貸給違約企業,損失的是本金和利息。因此要嚴格控制第一類錯誤的發生。部分模擬結果(見表 3)顯示:δ=5,C=1;δ=10,C=10;δ=10,C=30 三組核函數參數所得到的準確率相等,都為86.79%,但是第一類錯誤誤識率,第二類錯誤誤識率都不相同。綜合考慮,本文最終選擇σ=10,C=30的模型,此時第一類錯誤誤識率為15%,第二類錯誤誤識率為12.12%,準確率為86.79%。
本文在實證分析中采用逐步判別分析,并借助SPSS16.0軟件實現。
1.4.1 多元判別分析建模
假設模型樣本企業數為n,X=(X1,X2, …,Xp)T是一個 p 維向量,X是模型選取的企業財務比率,i為財務比率的數量,bi是判別系數,b0是常數項。令Zu為企業u的經營狀況判別值,判別方程為:

線性判別分析采用線性判別法則來分類和預測企業經營失敗與否。將企業u劃入經營失敗組g的原則是u屬于組g的后驗概率大于其屬于經營正常組g’的后驗概率,即:

為與支持向量分類機模擬出來的結果對比,樣本選取和指標的選取都與支持向量機的樣本一致。本文采用SPSS16.0對樣本進行多元判別分析。
1.4.2 結果分析
通過SPSS逐步判別分析逐步進入判別方程式的變量為主因子A1,主因子A8和主因子A7。模型采用系統默認的分析方法和判據:進入模型的F值為3.84,從模型中剔除變量的F值為2.71。通過判別分析得到判別函數Z=0.714A1+0.399A7-0.487A8+0.048,非標準化判別函數系數,即費歇爾判別函數系數。預測變量的原始數據乘以判別系數得到判別得分。兩組在判別函數上的重心不同(-1.179,0.885)。根據組重心函數值可以得到 Z0臨界值0.147,當Z得分大于-0.147時為組1不違約組,當Z得分小于-0.147時為組-1即違約組。
應用所得到的模型做判別預測。本文所使用的測試組樣本與支持向量機的測試組樣本一致。使用判別方程式計算測試樣本的判別得分,并且根據所得的臨界值-0.147進行判別預測。
多元判別分析的判別預測結果,從表3中可知,對訓練樣本的回測準確率為91.43%,其中第一類錯誤,即將違約企業的概率判定成正常企業的概率為20%;第二類錯誤,即將正常企業判定成違約企業的概率為0;對預測樣本進行預測的結果為準確率為84.91%,其中第一類錯誤率為25%,第二類錯誤率為9.09%。
表3中僅列出支持向量分類機核函數參數σ取不同值時所得的最優判別結果。
支持向量分類機對訓練樣本重新進行回測,準確率為100%。從預測結果中選擇最優的預測結果,即σ=10,C=30測試樣本分類的準確率為86.79%,第一類錯誤15%,第二類錯誤12.12%。通過比較可知,支持向量機無論是訓練樣本的回測還是對未知類別測試樣本的預測準確率高于多元判別分析,而兩類錯誤發生的概率也都低于多元判別分析。
支持向量機能夠較好的解決小樣本、高維數和局部極小點等實際問題。本文構建了一種基于支持向量機的上市公司信用風險評估模型,通過與多元判別分析的比較,發現支持向量機具有比較高的準確率和較低的第一類錯誤率。
研究中也遇到一些未能解決的問題,本文只解決了支持向量機的兩類分類問題。實際上應當推廣到更為復雜的多類信用等級評估研究以更精確的反映上市公司的信用情況,為銀行、投資者提供更有利的輔助工具。論文模型中第二類錯誤率控制的較好,但是引起較大損失的第一類錯誤率較高,本文中第一類錯誤和第二類錯誤的懲罰因子選取相同,如有可能應當選取不同的懲罰因子。在懲罰因子C和核函數參數的選擇上還沒有成熟的理論支持和方法,只能通過不同懲罰因子C和核函數參數的不斷試算結果中,選取結果最好的一組參數構造模型并且進行企業違約與否的預測。

表3 模型判別結果
[1]鄒新月,李漢通.運用典型多元判別分析法評估上市公司信用風險[J].統計與決策,2007,(7).
[2]美Cristianini,N.著,李國正等譯.支持向量機導論[M].北京:電子工業出版社,2004.
[3]梁琪.商業銀行信貸風險度量研究[M].北京:中國金融出版社,2005.
[4]Cortes C’Vapnik V.Support-vector Networks[J].Machine Learning,1995,20(3).
[5]Vapnik V N著,張學工譯.統計學習理論的本質[M].北京:清華大學出版社,1990.
[6]張樹德.MATLAB金融計算與金融數據處理[M].北京:北京航空航天大學出版社,2008.
[7]侯惠芳,劉素華.基于支持向量機的商業銀行信用風險評估[J].計算機工程與應用,2004,(31).
[8]原始財務比率數據略(來源于金融界網站http://stock.jrj.com.cn/cominfo/AllStock.asp)