陸一
摘 要:農村商業銀行控制運營成本、提升經濟效益的重要手段是信貸風險管理,但是銀行每天都需要處理大量的信貸業務。本文針對農村商業銀行信貸業務中風險較高等問題,設計了一種基于決策樹算法的信貸風險評估模型。該模型具有較高的準確率,為銀行信貸風險評估提供重要決策依據。
關鍵詞:決策樹 銀行信貸 風險評估
中圖分類號:F304.4 文獻標識碼:A 文章編號:1672-3791(2018)12(c)-0018-02
隨著近年來國家對中小金融企業發展的支持,農村商業銀行的信貸業務的種類也日益豐富,信貸業務更加復雜,信貸風險管理系統有了更高的要求,因此只有通過先進的管理工具和途徑、統一的信息化管理技術,這樣才能對信貸業務實行科學、規范化的管理,進一步實現對信貸資產的有效的風險控制和有效監管。
就浙江省來看,日前浙江省農村信用社下的各農村商業銀行(或正處于改革下的農村合作銀行和農村信用社)都是改革的攻堅階段,隨著經營規模的不斷擴大及其信貸業務種類的增加,信貸風險管理的難度也必然會加大,這更要依賴先進的管理工具、統一的信息化技術,這樣才能科學規范化地管理信貸業務的過程。為了最大化地實現信息的共享,加強農村商業銀行系統內的信息規范化和數據的管理,構建更為安全、有效、規范的信貸風險管理系統成為必然趨勢,這樣才能滿足新形勢下應對農村商業銀行經營的風險并且不斷擴大業務規模,才能可持續地發展農村商業銀行。
1 決策樹算法介紹
C4.5算法是決策樹生成的一種十分經典的算法,這個算法是對ID3算法的優化。針對ID3算法C4.5做的主要改進有以下幾點:(1)通過信息增益來決定屬性分裂的值。(2)能夠處理處理連續性還有離散型數據。(3)把決策樹構造完成后能夠進行剪枝,簡化決策樹。(4)能夠處理有缺失的樣本數據。
在C4.5算法中,只通過屬性的信息增長率選擇分裂屬性的。如公示(1)所示,判斷屬性的分裂值即split information:
2 信貸風險評估模型
2.1 決策屬性選擇
以桐鄉市農村信用合作社個人貸款客戶歷史數據中,取一小部分數據作為訓練集生成決策樹,并生成客戶信用等級評定模型。指標的合理選取對于模型的有效性有著的影響,為了指標的全面性以及準確性,個人貸款客戶信用評估指標體系共分為若干項,經過仔細的調查研究,可以分為年齡、貸款與收入的比值,學歷、還貸與收入的比值,是否有違約記錄等5個屬性值,具體如表1所示?,F隨機抽取兩萬名客戶的信息進行訓練以生成決策樹。
年齡屬性:是從數據庫中的記錄的數據獲取。
學歷屬性:也是和年齡屬性一樣,都是通過數據庫的原始數據獲取。
貸款金額比:貸款金額比是貸款總金額和年收入的比值,通過該屬性可以判斷該客戶貸款的金額是否超出能力范圍。其計算公式:X3=貸款總金額/年收入。
還款金額比:還款金額比是月還款金額與月收入的比值,這個屬性可以判斷客戶的還款能力。計算公式:X4=月還款金額/(年收入/12)。
是否有違約記錄:該屬性是判斷用戶是否有違約記錄,具有一票否決權,即表示有任何違約記錄,就拒絕貸款。
2.2 決策樹剪枝
由于決策樹的建立完全是依賴于訓練樣本,因此該決策樹對訓練樣本能夠產生完美的擬合效果。但這樣的決策樹對于測試樣本來說過于龐大而復雜,可能產生較高的分類錯誤率。這種現象就稱為過擬合。因此需要將復雜的決策樹進行簡化,即去掉一些節點解決過擬合問題,這個過程稱為剪枝。
剪枝方法分為預剪枝和后剪枝兩大類。預剪枝是在構建決策樹的過程中,提前終止決策樹的生長,從而避免過多的節點產生。預剪枝方法雖然簡單但實用性不強,因為很難精確的判斷何時終止樹的生長。后剪枝是在決策樹構建完成之后,對那些置信度不達標的節點子樹用葉子結點代替,該葉子結點的類標號用該節點子樹中頻率最高的類標記。對于一個葉子節點,這個節點覆蓋了N個樣本,其中有e個是錯誤的分類,那么整棵樹的錯誤判斷值為,其中0.5為懲罰因子,通過經驗判斷,懲罰因子一般設定為0.5.那么對于一整顆樹的誤判率就為:
式(4)中,l為所有節點的個數表示該節點中的所有樣本,表示節點錯誤的樣本。一旦求得的整個數的誤判錯誤率的均值加上標準差,小于節點的均值誤差,那么就可以將子樹替換葉子節點,即表示為剪枝。
3 規則描述
根據C4.5決策樹模型,對給定的5個屬性構建了一顆決策樹,其決策樹如圖1所示,為了更為清晰地了解決策模型,將決策樹轉變為下列規則。決策樹將信用等級分為A、B、C、D這4個等級,其中信用等級為A的表示還款能力強,貸款風險低。D則表示信用等級最低,風險最高。根據決策樹模型來看,年齡較小,學歷越高則風險越低。年齡較大,學歷越低,并且貸款金額和收入比越高風險越大。
4 結語
本文針對農村商業銀行信貸業務中風險較高等問題,設計了一種基于決策樹算法的信貸風險評估模型。通過決策樹模型發現,在農村商業銀行信貸業務中,年齡較小,學歷越高則風險越低。年齡較大,學歷越低,并且貸款金額和收入比越高風險越大。該模型對輔助信貸決策有著重要的作用。
參考文獻
[1] 侯斌甲.基于B/S架構的個人信貸系統的研究與實現[D].蘭州大學,2016.
[2] 張韶峰.大數據在信貸和保險領域的實踐[J].新經濟,2016(19):48-50.
[3] 張彥.河南農信社信貸管理系統的設計與實現[D].天津大學,2016.
[4] 曹可雲荻.基于B/S結構的商業銀行信貸管理系統的設計與實現[D].吉林大學,2016.
[5] 王宣強.基于REST的銀行信貸系統API體系研究[J].金融電子化,2016(3):79-80.
[6] 嚴曄瑋.建設銀行宜春分行小企業信貸管理系統的研究與分析[D].云南大學,2016.