


摘要:中小微企業是我國經濟發展的重要力量,但商業銀行對這類企業普遍存在“惜貸”行為。銀行通常依據企業交易票據信息等對其信貸風險做出評估,并依據相關因素來確定是否放貸及額度、利率等信貸策略。本文基于樣本企業數據,用有效發票開票頻率等指標作為反應供求穩定性等的因素,基于數據建立隨機森林分類模型,并將相關數據代入模型進行訓練,通過訓練得到樣本企業的信譽評級和是否違約,基于中的 Logistic 回歸的評分卡模型,得到各個企業的風險評估得分與違約率,最后固定貸款總額為一億時對額度策略與利率策略進行修正,得到該信貸總額下對 302 家企業的貸款額度和貸款年利率,并對信貸決策方案進行了修正。分析樣本數據中 2020 年的價稅合計數據,構造虛擬 GDP,通過分析 2020 年 1 月的虛擬 GDP,來自國家統計局的 2020 年第一季度、上半年的 GDP 數據,確定上下界[-10,10],從 10 個行業挑選出增長率在上下界以外的 6 個行業,利用熵權法確定各個行業的影響因子。把影響因子帶入所得的違約率、評分卡分數,貸款額度等計算出修正后的貸款策略。
關鍵詞:信貸風險;中小微企業;評分卡模型;logistics回歸
中小微企業是我國經濟發展的主心骨,創造了國內GDP的60%。但由于中小微企業規模相對較小,缺少抵押資產,不能有效滿足金融機構相關的貸款要求,因此銀行主要依據信貸政策、企業的交易票據信息和上下游企業的影響力向企業提供貸款,并對信譽高、信貸風險小的企業給予利率優惠。企業的信貸風險進行量化分析,并在年度信貸總額一定的情況下,制定銀行的信貸策略。
1.數據來源
數據來源于2020年全國大學生數學建模競賽C題。本文采用評分卡模型對小額貸款公司的客戶信用進行評價。首先,建立信用評價模型,給出客戶的評分和違約率,對好客戶和壞客戶進行篩選,然后采用額度策略和利率策略分別對每個企業計算貸款額度和貸款利率。
2.模型建立與求解
2.1評分卡模型分析
我們主要關注的是找到客戶中會違約的客戶,因為違約的客戶畢竟是少數類的,因此我們通過召回率和 ROC 曲線來判斷模型的好壞。
(1)ROC曲線:
所以我們可以從上圖中得到我們判斷對一個壞客戶的情況下只會判錯 0.08 個好客戶,說明我們的評分卡模型有著很好的召回率(從所有客戶中預測出本來是壞客戶的概率),能夠讓我們的銀行更好的在一開始就找到可能會違約的客戶。
(2)評分卡刻度:
可以看出在違約率在分值低的時候呈現出一種指數式的下降,然后逐漸趨近于 0,所以能夠看出分值低時客戶違約概率很高,分數高時客戶違約概率很低。因為會違約的客戶分值肯定會很低,不會違約的客戶分值肯定很高,因此計算出來的違約率相差會比較大,并且在分值低的時候跌柱線也明顯大與分值高的時候的跌柱線,因此評分卡模型能夠更好的將違約客戶和不會違約客戶分離開來。
(3)信貸風險評價策略
每個客戶來銀行貸款都需要填寫申請表,然后我們讓每個用戶填上我們需要的指標,然后將其帶入我們的評分卡模型就可以計算出每個客戶的得分和違約率也就能幫助銀行判斷客戶的好壞了。
2.2信貸策略模型
(1)信貸風險評價策略
每個客戶來銀行貸款都需要填寫申請表,然后我們讓每個用戶填上我們需要的指標,然后將其帶入我們的評分卡模型就可以計算出每個客戶的得分和違約率也就能幫助銀行判斷客戶的好壞了。
通過計算表達式我們能計算出間均值A0對應的常數K0,即相對最優的一個解,其中K0=55.6%,然后擬合出上圖的折線,最后得到額度策略表達式:
2.3突發情況影響下中小企業信貸風險分析
(1)數據分析
在國家統計局上尋找產業的 2020 年第一季度 GDP 增長率和上半年增長率,對農林牧漁業,制造業,建筑業等企業類型進行分析:
住宿和餐飲業受到 2020 年最開始新冠疫情的影響最大,而信息傳輸、軟件和信息技術服務業在新冠疫情的影響下反而有很大的一個提升,說明不同行業在新冠疫情的影響下會有不同的經濟增長反應。
數據預處理:首先針對附件 2 篩選出 2019 年 1 月及 2020 年 1 月的價稅總和,分別對進項、銷項將不同行業的價稅總和相加,再彼此相加。得到的數據記為 N,即表示該時間段內的虛擬 GDP(即只由該行業所有企業的進項價稅總和和銷項價稅總和表示)。同時,從國家統計局得到 2020 年第一季度、上半年各行業的 GDP 增長率。
注:①所研究的行業僅有:農林牧漁業;制造業;建筑業;交通運輸、倉儲和郵政業;住宿和餐飲業;金融業;房地產業;信息傳輸、軟件和信息技術服務業;租賃和商業服務業;其他服務業。②以下皆是基于 2020 年 1 月爆發的“新冠肺炎”疫情的研究。
(2)2020 年 1 月各行業相比去年同期的虛擬 GDP 的增長率
由數據結果分析可知:在“新冠肺炎”爆發的 2020 年 1 月,A(農、林、牧、漁業)的虛擬 GDP 拔高,其余行業的虛擬 GDP 為負值,其中,房地產業受影響最嚴重,虛擬 GDP下降率最高。
(3)2020 年第一季度、上半年各行業的 GDP 的增長率
由數據結果分析可知,H(住宿和餐飲業)對突發因素導致的市場波動最為敏感,其次是建筑行業,再來是信息傳輸、軟件和信息技術服務業(穩正增長)和金融業。
(4)綜合考慮 GDP 和虛擬 GDP
由數據分析結果可知,受新冠疫情影響嚴重的行業有:H(住宿和餐飲業)、E(建筑業)、I(信息傳輸、軟件和信息技術服務業)、G(交通運輸、倉儲和郵政業)、J(金融業)。
綜上所述,2020 年初在“新冠疫情”的影響下,受到影響較大的企業有:A(農、林、牧、漁業)、H(住宿和餐飲業)、E(建筑業)、I(信息傳輸、軟件和信息技術服務業)、G(交通運輸、倉儲和郵政業)、J(金融業)。
(5)熵權法確定影響因子
① 判斷輸入的矩陣中是否存在負數,如果有則要重新標準化到非負區間,這里有n =302 個要評價的對象,m =6 個評價指標(已經正向化)構成的正向化矩陣。對其標準化的矩陣記為z,判斷z矩陣中是否存在負數,如果存在,需要對x使用另一種標準化方法。計算每個指標的信息熵,并計算信息效用值,并歸一化得到每個指標的熵權對于第 j 個指標而言,有特殊的信息效用值公式,將信息效用值進行歸一化,我們就能得到每個指標的熵權:A影響因子為1.1,H影響因子為0.5,E影響因子為0.7,I影響因子為1.5,G影響因子為0.8,J影響因子為0.8。
(6)引入影響因子的策略修正
用求出來的影響因子乘以對應行業的企業中對貸款額度和貸款年利率進行數據修正就可以得到在各企業的信貸風險和可能的突發因素(例如:新冠病毒疫情)對各企業的影響。那么還是展示前 15 個企業的貸款額度和年度貸款利率和修正后的違約率和修正后的分數。當有外部因素影響企業的時候要乘以對應行業的影響因子才能計算出真正的違約率,分值,貸款額度,最大貸款年利率。
參考文獻:
[1]吳沈娟.供應鏈金融環境下中小企業信用風險評估——基于大數據的應用[J].時代金融,2020(20):93+95.
[2]段翀.基于PFM模型與傾向匹配得分法的中小企業信用風險評估[J].征信,2020,38(06):35-42.
[3]張天宇.基于KMV模型的上市中小企業信用風險評估研究[J].科技經濟導刊,2020,28(16):229.
[4]張雯. 基于logistic回歸的中小型企業信用評估[D].山東大學,2020.
[5]梁偉森,溫思美.涉農中小企業貸款違約風險評估研究——基于“新三板”農林牧漁類企業數據[J].農村經濟,2019(11):93-100.
[6]林海.“雙創”背景下科技型中小企業創新項目風險評估模型構建[J].科技管理研究,2019,39(21):83-90.
[7]余得生,李星.供應鏈金融模式下的中小企業信用風險評估——以電子制造業為例[J].征信,2019,37(10):72-77.
[8]蘭曉然.科技型中小企業信用風險評估——基于Adaptive Lasso-Logistic實證研究[J].華北金融,2018(08):69-75.
基金項目:本文系2021年安徽財經大學科研創新基金項目,項目編號:XSKY2156。
作者簡介:盧悅冉(2001—)女,漢族,安徽亳州人,安徽財經大學金融學院,2018級本科生,金融學專業。