李佳成,任姿霖,王 攀
(四川工商學院經濟管理學院,四川 眉山 620000)
自我國實施改革開放政策至今,國內銀行業實現了快速穩定發展。目前而言,商業銀行的貸款經營模式是依靠信用而進行的,其存在的風險也會在日常治理中體現。商業銀行的盈利一直以來也是依靠存貸款利率之差來維持良好的運營。一旦出現大規模的不良貸款,相關的經濟鏈也會受到牽連。考慮到商業銀行貸款規模、社會變化影響以及不良貸款發展趨勢諸多問題,通過建立一個更完善的信用評分模型,以此來降低不良貸款規模以及不良貸款率,維持商業銀行穩定發展是非常必要的。
本文通過主成分分析建立新的銀行個人信用評分模型,精確的判斷每個客戶的信用分數,以此觀測對方逾期還款的可能性,在此基礎上可以清楚的做出拒絕其貸款請求或者提高貸款利率等決策。由此能提高銀行資金的使用率,針對不同信用積分的客戶靈活調控貸款利率。
在國外,陳啟偉(2018)等人提出了一種基于梯度提升迭代決策樹集成的信用評分模型,使用不同的特征子集和參數干擾的方法,訓練得到了多個梯度提升迭代決策樹分類器,再使用投票法將所有的基分類器進行集成,實現了信貸客戶的風險評估。Wang Bao(2019)等人提出了將無監督學習與監督學習相結合的信貸風險評估組合策略,使用K-Means 對數據集聚類,然后使用自組織映射模型進行訓練得到分類器,實現了對信貸客戶的分類。[1]
目前國內的信用模型主要分為傳統算法和機器學習。為探究兩種算法對銀行信用評分模型的影響,張杏枝(2019)通過對比Logstic 回歸和XGBoost 在銀行信用評分中的應用效果,說明了KGBoost 在模型精度和處理缺失值上占優,但計算速度和解釋性不如Logistic回歸,容易被方差較大的數據和異常值影響。[2]周麗峰(2021)采用隨機生存森林建立大數據信用模型,由于大數據的超大數據容量、高度復雜數據類型、信息稀疏性等數據特點,致使模型預測貸款客戶的違約風險效果未能達到最佳。[3]
以上國內外文獻通過大量的數據與實證分析,對銀行信用評分模型從預測精度,主觀依賴,解釋性,穩定性等方面進行了分析,因此本文放棄采用“黑箱”特點的模型并盡量避免需要專家知識和經驗,最后采用以主成分分析為主,灰色關聯度和Q 型聚類分析為補充的組合模型。
本文主要對個人的信用風險進行評分及劃分信用等級兩個目的,由于影響個人信用風險的因素較多,因此本文決定選用主成分分析對數據進行降維處理,并根據其主成分的貢獻率建立主成分評分模型。隨機選取了總金額額度、信用額度、成功借款次數、借款總額、逾期次數、還清筆數、嚴重逾期次數、月收入、投資類型九個因素作為模型的原始變量。
主成分綜合模型只能對數據進行評分,無法有效的對信用風險劃分等級,因此,本文采用灰色關聯度對數據樣本的優劣進行排序,再以Q 型聚類分析根據灰色關聯度的結果劃分為五個類別,對應五個信用等級,按照灰色關聯度結果對五個類別進行內部排序,選擇內部五個灰色關聯度最低的樣本作為代表兩個信用等級之間的臨界樣本,將四個臨界樣本帶入主成分綜合模型中計算得到五類信用等級之間的臨界值得分。其他客戶數據就能根據主成分綜合模型得到其對應得分,并根據其得分與臨界值之間的比較確定自身的信用等級。
2.2.1 利用層次分析法求取指標權重
(1)構造判斷矩陣
首先將總金額額度、信用額度、成功借款次數、借款總額、逾期次數、還清筆數、嚴重逾期次數、月收入、投資類型九個指標數據作為準則層,分別設為,用表示和對上層目標的影響比。
(2)層次單排序及其一致性檢驗
設準則層中與措施層因素的成對比較判斷矩陣在單排序中經一致性檢驗,求得單排序一致性指標為CI,相應的平均隨機一致性指標為RI,則B 層總排序隨機一致性比例為

2.2.2 計算灰色關聯系數及灰色加權關聯度
(1)計算灰色關聯系數

(2)計算灰色加權關聯度
灰色加權關聯度的計算公式為

2.2.3 評分等級的劃分
通過Q 型聚類分析對客戶樣本灰色關聯度進行五級劃分,將客戶樣本劃分為五個等級,并將每個等級內樣本灰色關聯度最小的作為等級之間的臨界值。

2.2.4 建立主成分評分模型
(1)對原始數據進行標準化處理

對應地,如公式6 這樣

為標準化指標變量。
(2)計算相關系數矩陣R

(3)計算特征值和特征向量



第二步,計算綜合得分:

本文選用的是MS 建設銀行個人信貸,所用數據都經過了去除客戶隱私,再將數據進行分析和研究。我們選取總金額額度、信用額度、成功借款次數、借款總額、逾期次數、還清筆數、嚴重逾期次數、月收入、投資類型九個指標數據。數據都來源于問卷調查。
其中月收入是一個區間范圍,例如5000-10000,因此,將月收入取其區間的均值作為其準確的月收入,另外投資類型指客戶所借資金的用途,分為個人投資和非個人投資,用1 和0 來量化這兩種情況。由于用戶的資料填寫不完善,月收入變量中有不少樣本是空,直接刪除不完整客戶樣本后還剩13963 個樣本。
3.2.1 利用層次分析法求取指標權重
(1)構造判斷矩陣

表1 對比矩陣表
(2)層次單排序及其一致性檢驗
根據公式(1)(2)計算得出,一致性比率 滿足一致性要求,故前面的權重向量可以使用。
3.2.2 計算灰色關聯系數及灰色加權關聯度

表2 部分樣本關聯系數和關聯度值
由公式(3)(4)計算得出的8 個樣本的結果顯示,按照灰色關聯度排序可看出表中所展示的8 位客戶,,由于樣本中客戶7 與虛擬的最優客戶的關聯度最大,即客戶7。由于其余七位,銀行在放貸時即可優先處理客戶7 的貸款申請,給予一定的貸款優惠。利用此算法可對當前銀行所有待處理的貸款申請根據客戶與最優客戶的關聯度進行排序,以此區分用戶的貸款優劣程度。

圖1 聚類圖
根據公式(5)得到的聚類結果和灰色關聯度排序,AB 類臨界值樣本為第12676 位,關聯度為0.6429,BC 類臨界值樣本為第8733 位,關聯度為0.5759,CD類臨界值樣本為第969 位,關聯度為0.4328,DE 類臨界值樣本為第1059 位,關聯度為0.3704。
根據公式(7)求得相關系數矩陣,再根據公式(8)(9)利用MATLAB 求得相關系數矩陣的前5 個特征根及其貢獻率如下。
可以看出前五個特征根的累計貢獻率就達到了91%,主成分分析效果很好。下面選取前五個主成分進行綜合評價。
由此可得五個主成分分別為

分別以五個主成分的貢獻率為權重,構建主成分綜合評價模型

將這13963 個樣本標準化后的變量值帶入公式(11),獲得了這13963 個人的信用評分,用其實際逾期還款次數檢驗模型的評分結果,準確率為83%,有過多次逾期還款的人基本上評分結果都為負。

表5 評分檢驗表
結合聚類分析得到的四個代表臨界值的樣本,代入上述主成分綜合評分模型中,計算得出AB 類臨界值為1.2736470238996,BC 類臨界值為-0.0818424587177281,CD 類臨界值為-1.00874805249367,DE 類臨界值為-1.06641614462261。
本文模型采用的是由主成分綜合評分模型,灰色關聯度和聚類分析是為了確定信用五級分類的臨界值。主成分綜合評分模型由五個主成分構成,通過公式(11)計算得到客戶的信用分,根據分值所處哪類信用區間,對其歸類,由此可決定其貸款是否優質,貸款風險如何,是否優先處理等一系列考慮。[10-13]主成分評分模型能客觀的反映出每位客戶的真實信用得分。銀行信貸業務依賴市場對人們的影響,若市場蕭條,個人收入不高,貸款的人數及條件自然會變化,依靠灰色關聯度結合Q 型聚類分析所劃分的評分等級,能實時反映出市場變化給客戶群體所帶來的影響,以此調整出更適合當前市場的評分等級劃分。模型由于主成分分析缺乏主觀性,可能對道德等因素造成逾期還款的影響難以正確估計,可結合一些螞蟻花唄或者京東白條之類的貸款記錄,對模型進行優化。
銀行現在受到金融證券化的沖擊,以前籌資只能找銀行貸款,現在企業可以在證券市場發行各種證券進行籌資,因此,銀行貸款中個人貸款占比逐漸上升,企業貸款數量減少,為了維持資金的流動性,對于那些貸款條件在信用分數及格線的客戶,銀行可能會猶豫是否放寬條件允許放貸。根據本文個人信用評分組合模型,不僅能更科學的預計客戶的逾期還款的風險,還能根據信貸群體的變化合理制定更符合當前市場的信用等級,從而使銀行安全且最大化的提高放貸金額,讓資產與負債維持平衡。本文模型在實時性和客觀性上有明顯優勢,模型相較于深度學習類模型更易于理解。本文的模型在銀行個人信用評分方面的應用優勢毋庸置疑,也為銀行業的新型個人信用評分模型的建立提供了新的思路。