[摘要] 貸款風險分類是一個對借款人現金流量、財務指標及其非財務指標進行綜合評價的過程。本文把貸款風險分類看作是一個模式識別問題,在此框架下,就統計模式識別領域中最新使用的神經網絡方法、分類樹法、以及支持向量機三種方法的建模思想、適用性進行分析,從而對我國貸款風險分類提供一些啟示。
[關鍵詞] 模式識別 風險分類 適用性
一、引言
貸款風險分類,就是根據借款人的當前經營情況和違約跡象來判斷其按時還款的可能性并給予風險等級評價,是銀行綜合了借款人財務、非財務因素,對貸款未來安全收回可能性的評價。如何判斷借款人的每個因素對貸款償還的影響程度,以及如何將上述各種因素定性和定量分析歸納匯總,作出全面科學的風險評定是貸款風險分類操作的難點和關鍵。
在現代信用風險度量模型出現以前,測度信貸信用風險的方法主要有:專家制度法、評級法和信用評分法。近年來,一些大的金融機構相繼構建了比較規范的、有重大影響的四大信用風險度量模型:JP 摩根的Credit Metrics 方法;KMV公司的KMV 模型;CSFP(Credit Suisse Financial Products) 的Credit Risk + 方法;麥肯錫公司的信用組合觀點模型(Credit portfolio View)。這四大信用風險度量模型對中國銀行業都有一定的借鑒意義。模型最大的問題是任何一個模型都沒有全面考慮到借款人的道德風險,還有借款人的具體情況,如銀行合同、貸款合同、擔保能力、借款期限等,而且由于經濟制度、金融發展水平等方面的差異,因此,借用西方信用風險模型應慎重,我國應用這些大型量化模型的條件還不成熟。
本文把貸款風險分類看作是一個模式識別問題,在此框架下,就統計模式識別領域中最新使用的神經網絡方法、分類樹法、以及支持向量機三種方法的建模思想、適用性進行比較,并給出有關結論。
二、貸款風險分類是一個模式識別問題
所謂模式識別,就是用計算機的方法來實現人對各種事物或現象的分析、描述、判斷和識別。目前我國實行的貸款風險五級分類法(簡稱風險分類),它是根據貸款對象的第一還款來源與第二還款來源共同特征(財務指標)或屬性(非財務指標)進行識別判斷而進行分類的,其核心在于它以借款人的償還能力作為分類標志。
貸款風險分類的模式識別系統的精度及其正確性,主要取決于(1.3)式中的一些參數的估計的精度。訓練時如果輸入模式樣本的類別信息是已知的,這時可以用“有監督”的模式識別技術,讓識別系統執行一個合適的學習訓練過程,把系統“教”成可使用各種適應修改技術再去識別模式。如果采集到樣本模式是未知類別的,這時可用“無監督的模式識別技術,即必須通過系統的學習過程去得到其所屬的范疇。
三、模式識別技術的建模思路及其適用性分析
目前用于統計模式識別的方法很多,主要有判別分析法、回歸分析法、人工智能(專家系統)、神經網絡、決策樹法、K近鄰法、支持向量機等。本文僅就目前最為流行的人工神經網絡、決策樹法、支持向量機三種非參數模式識別方法建模思路、適用性進行比較分析。
1.神經網絡模型(ANN)
(1)建模思路
人工神經網絡(Artficial Neural Networks ANN )是一種具有模式識別能力,自組織、自適應,自學習特點的計算方法。神經網絡模型建模思路是,首先找出影響分類的一組因素,作為ANN的輸入,然后通過有導師或無導師的訓練擬合形成ANN風險分析模型。對于新的樣本輸入(即一組影響因素值),該模型可產生貸款風險的判別。
(2)適用性分析
神經網絡的適用性首先表現為分類的準確性比較高。特別是在測試數據為非線性關系的情況下,尤其如此;其次是神經網絡有較強的適應訓練樣本變化的能力,當訓練樣本增加新的數據時,能夠記憶原有的知識,根據新增的數據作恰當的調整,使之表示的映射關系能夠更好的刻畫新樣本所含的信息。這一點不僅使得神經網絡具有較強的適應樣本變化的能力,還使它具有動態刻畫映射關系能力,也克服了線性判別分析方法的靜態特點;再次是其具有魯棒性。神經網絡對于樣本的分布、協方差等沒有要求,對樣本中存在的噪音數據、偏差數據不敏感。監管部門在面對眾多監管對象銀行時, 可以根據其報表中的監管指標與監控指標的輸出結果,迅速、準確地判斷商業銀行的經營狀況,就可以輔助以現場檢查的手段,對商業銀行進行適當、適時的干預。
神經網絡方法的主要缺點一是對樣本的依賴性過強,對樣本提出了很高的要求。因為它很少有人的主觀判斷因素的介入;二是解釋功能差。它僅能給出一個判斷結果,而不能告訴你為什么;三是在神經網絡方法中輸入特征變量的確定出關鍵指標問題時,需要依賴于其他的統計分析方法;四是是樣本分成多少個種類,這些問題都是神經網絡方法無法獨自解決的,要依賴于其他方法;五是神經網絡的訓練速度慢且極易收斂于局部極小點,推廣能力差,以及容易出現“過學習”現象。
2.分類樹方法(CART)
(1)建模思路
分類樹方法(CART)是一種由計算機實現,基于統計理論的非參數識別方法。其建模思路是:在整體樣本數據的基礎上,生成一個多層次、多節點的樹,按廣度優先建立直到每個葉節點包含相同的類為止,以充分反映數據間的聯系。然后對其進行刪減,參照一定規則從中進行選擇適當大小的樹,用于對新數據進行分類即建造最大樹,對樹刪減,選擇適當的樹用于新樣本分類。
(2)適用性分析
分類樹方法在銀行貸款風險分類中的適用性首先在于通過借款人經營狀況的變化及其破產的可能性的判斷,來估計其違約的可能性,進而來推測該借款人持有的貸款風險程度。它不但具有哲學上的二分法的優點,而且其分類標準的選擇也包含著經濟理論上的合理性。反映申請者信用關系中各項指標之間的相關性是應用分類樹于信貸信用分類的有利條件,它可以有效地利用定性變量進行分類。
分類樹的缺陷表現在:一是計算量大;二是在一些連續型定量變量的處理上,分類樹就顯得有些力不從心;三是對結點屬性的判定上,往往以葉結點中所含多數樣本的屬性來決定該葉結點的屬性。但如果碰到訓練樣本中某種樣本(譬如好樣本,占大多數)。此時分類的結果很可能是幾乎每個葉結點都是好樣本占多數,或出現一些好壞樣本的個數相當的葉結點。于是就可能出現幾乎所有的葉結點都是好樣本集合,或其中一些結點無法判斷。無論哪種情況出現,都將導致對壞樣本的辨別率降低,進而導致分類樹的效率降低。
3.支持向量機模型(SVM)
(1)建模思路
(2)適用性分析
由于支持向量機出色的學習性能、泛化性能、良好表現和所估計的參數少等特點,能夠較好地解決小樣本、高維數、非線性、局部極小等問題。鑒于支持向量機的諸多優點,國外學者 Van.Gestel(2003)將支持向量機應用到信貸風險分類與評估領域,并與神經網絡及Logistic回歸相比較,得到了較好的結果。同時利用支持向量機,能提高學習機的泛化能力,能成功地解決風險分類、函數逼近和時間序列預測等方面,對構建貸款分類模型也具有重要的實踐意義。
但SVM是解決一個二分類問題,現實中遇到的大都是多分類問題,如支持向量機無法解決信貸風險的五級分類問題。另外,影響支持向量機模型分類能力的參數選擇存在人為確定的主觀性等。
四、結論
從信貸風險管理角度看,信貸風險分類與量化管理是一個必然趨勢。為了提高貸款分類的準確性,必須將上述兩種或兩種以上的方法結合起來使用,取長補短。同時,中國銀行業在運用這些相對復雜的預測技術時,不僅要根據國內的實際情況和銀行業自身發展階段,科學地制定信貸風險管理流程,還要加強人才培養和數據庫建設,盡可能地運用信貸風險管理先進技術將信貸風險損失降到最低限度,實現可持續發展。
參考文獻:
[1]J.P. Morgan.Credit Metrics—Technical Document.1997, 4:2
[2]KMV.Global Correlation Factor Structure. San Francisco:KMV Corporation.1996,8 :16~17
[3]Credit Suisse First Boston. Credit Risk+, A Credit Risk management Framework. Credit Suisse First Boston Internation, 1997
[4]McKinsey and Co, Credit Portfolio View. New York, Mckinsey and Co.1997
[5]曹道勝等:商業銀行信用風險模型的比較及其應用[J].金融研究,2006年第10期
[6]王振民,中國商業銀行貸款風險分析[D].天津大學博士論文,2005年5月,P33
[7]Mark T.Leung,Hazem Daouk,An-Sing Chen.Forecasting stock indices: a comparison of classification and level estimation models, International Journal of Forecasting,2000(16)
[8]李玉霜張維:分類樹應用于商業銀行貸款5分類的探討[J].系統工程學報,2001年8月