[摘要] 本文從定量分析角度出發,在一組商業銀行汽車貸款數據樣本的基礎上,建立了Logistic回歸、分類樹、神經網絡三種模型并進行了實證比較。結果顯示,由于神經網絡模型所具有自學習能力、容錯能力和泛化能力,是一種更適用于我國目前個人信用現狀的評估方法。
[關鍵詞] 個人信用評估Logistic回歸神經網絡
個人信用評估的主要目的是對可能引起信用風險的因素進行定性分析、定量計算,以測量消費者的違約概率,為授信方決策提供依據。
在我國,商業銀行的信用分析與評估技術還處于傳統的比例分析階段,該方法的最大缺陷在于指標和權重的確定帶有很大的主觀性,使得評估結果與消費者個人的實際信用狀況有很大出入,遠不能滿足商業銀行對消費信貸安全性的準確測量。因此需要引入科學方法來確定有效指標,并建立準確的定量模型來解決信用評估問題。
本文的目的在于:根據我國商業銀行的具體情況,結合國際上目前較為流行的個人信用評估方法,就國內外個人信用評估領域使用較多的判別分析、Logistic回歸、神經網絡方法以及分類樹法,利用中國商業銀行的數據分別建立評估模型并對它們進行比較,最后給出有關結論。以此研究我國商業銀行個人信用風險評估問題。
一、指標與樣本數據
本文隨機選取我國某商業銀行某城市分行的個人汽車貸款1253個樣本作為樣本總體,按照銀行的標準將其劃分為“好”客戶(293人),“壞”客戶(960人),并將其隨機分為兩組,其中的四分之三作為訓練樣本用于構建模型,剩下的四分之一作為保留樣本對模型的性能進行檢驗。參考銀行客戶貸款申請表及還款記錄,選取類別(class),性別(sex ),年齡(age),婚姻〔marry〕,受教育狀況(edu),月均收入(income),行業(company),職業(job),共八個指標。模型中class為被解釋變量,sex, age, marry, edu,income, company, job為解釋變量。
表1個人信用指標定義表
二、信用評估模型的構建
1.Logistic回歸
在本建模總體中,由于將一個“好”客戶錯分為“壞”客戶(即第一類錯誤)所造成的平均利潤損失L和將一個“壞”客戶錯分為“好”客戶(即第二類錯誤)所引起的平均壞賬損失D很難估計出來。為簡單起見,將它們取為相等。將選取的訓練樣本(共940個)使用SAS EnterpriseMiner,選擇stepwise方法選擇最優的自變量指標進入方程對因變量進行擬合,自變量指標進入方程的順序是:edu, sex, marry, income, age, job;company被剔除,最后得到式(1)的回歸方程。
2.分類樹
分類樹方法的思想是把所有申請表的答案分成不同的組,然后依據每組中多數成員是好還是壞而判別每個組為好或壞。申請數據組A首先被分成兩個組,在針對申請人最終無法償還貸款方面,相對于未分開的總體組來說每個分開組的內部成員具有更相似的性質。每個這樣的組又經過一分為二,得到更具有相似性質的更多小組,這樣的過程不斷重復。當小組內的成員達到樹的終止節點條件時,分區程序停止。然后每個終止節點被分類為“好”的或“壞”的,整個過程可以用一個樹的形式來表示(參見圖1)。
圖1修剪后的分類樹
本文使用CART算法建立分類樹模型。依據國外學者的研究結果(Lyn C.Thomas,2000),在本研究樣本總量為1253的情況下,為了防止樣本訓練過度,設定節點最小樣本數目為5(節點中較少的一類樣本的數量已經不超過預先設定的5個,此時停止分割)。這棵分類樹共產生了14個葉節點。
3.神經網絡方法
神經網絡模型的建立主要需考慮兩方面的問題:一是確定網絡結構;二是學習參數的調整。本文使用只包含一個隱含層的BP神經網絡模型,并采用試值法確定隱含層結點數。
表2隱含層節點數的影響
我們分別就隱結點數為1、2、3、4、5、6、7的情況進行了模擬,各種網絡的輸出情況見表2。對于保留樣本,綜合分析第一類錯誤、第二類錯誤和總誤判率,可以得出當隱含層結點數為5時,總誤判率最低且第二類錯誤比率也最低。采用同樣的方法,我們最終選定了神經網絡模型的學習率η=0.4,慣性參數α=0.6。
三、不同模型結果比較
由于Logistic回歸具有假設條件少、具有可解釋性和操作簡單的特點,這里將其作為線性方法建模的代表,將其與非參數方法(分類樹和神經網絡)進行比較。
1.比較之一:錯誤分類率
實際上,以總的損失最小為標準是衡量模型優劣最合適的評價方法。但是在實際問題中,上述兩類錯誤造成的損失往往是未知的而且難以精確的估計出來。因此,這里將綜合考慮總錯分率、第一類錯誤比率和第二類錯誤比率,以此作為彌補。
從表3中可以看出,就本文的建模數據而言:
(1)3種模型對測試樣本的總錯誤分類率均高于訓練樣本的總錯誤分類率。這說明僅用訓練樣本計算的錯誤分類率還不能真正地反映模型的預測能力,對測試樣本的錯分率才是對模型預測能力的一個較好的評估。
(2)就測試樣本的總錯誤分類率而言,logistic回歸、分類樹、神經網絡的總錯誤分類率均在15%~17%之間,差別不大。這說明所比較的3種方法均具有一定的分辨能力,能夠在相當程度上將“好”客戶和“壞”客戶區分開來。
(3)在使用logistic回歸、分類樹法和神經網絡3種方法對測試樣本進行分類時,其第二類錯誤的比率均較高,最低的神經網絡方法也達到37.65%。就模型的穩健性而言,理論上Logistic回歸作為一種線性建模方法其穩健性應優于非參數方法,而我們的實證結果表明神經網絡方法最優。因此,綜合總錯分率、第二類錯誤比率和穩健性看,神經網絡方法是一種較好的方法。
2.比較之二:模型驗證的全程比較分析
圖2和圖3是將Logistic回歸、分類樹、神經網絡三種方法所得的模型驗證曲線放一起進行比較。圖3是圖2的累積分布形式。
將25%的測試集數據(在建模過程中從未用過的)根據模型算出分值,這樣就可以定義“好”(1)與“壞”(0)值。將這些觀察點按信用評估分值從大到小排列(模型中,分值大意味著“好”,分值小意味著“壞”)。排列好后將所有觀察點大致分為10份,每一份中約有測試集中10%的觀察點,然后依次對這10份中每一份內的“好”與“壞”進行計算,算出“好”的比率。比如在第一個10%中有31個觀察點,其中29個是“好”,2個是“壞”;在100%處,可以看到“好”的比率約為3%。將10份“好”的比率繪成圖形,連線而成得到圖2。
圖2 模型驗證比較圖圖3 模型驗證累積分布比較圖
可以看出兩圖形的曲線并不平滑,有凹凸,表明模型的效果在某些范圍內并不很好,這是因為采集的樣本數據數量有限造成的。這些不平滑會對信用評估的應用產生一定的影響。三個模型的分類結果圖放在一起比較,可以方便地得出上面已分別陳述過的結論:
神經網絡模型要比其他兩個模型的分類效果更好些,因為其更加平滑;而分類樹模型比回歸模型要好一些;實際上在全程范圍內三種模型的分類效果幾乎同樣的好,這點與國外的研究結論一致(A.D. Lovie and P. Lovie,1986)。
四、結論
由于我國個人征信工作剛剛起步,信用記錄有限,導致信用數據的信息缺失和我國目前還沒有形成經過驗證的信用指標體系。基于上述原因,雖然logistic回歸被國外證明為一種相當成熟的評估模型,卻不能很好的適應我國現階段的個人信用指標的多樣性、不確定性和大量信息缺失等特點。相比之下神經網絡方法由于其所具有的自學習能力、容錯能力和泛化能力,更適用于我國目前個人信用問題的研究。
本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。