張娜 郝子碩 方秀男



摘 要:銀行信貸業務是銀行通過發放銀行貸款收回本金和利息,來實現銀行的盈利,而且近年來越來越多的企業開始關注銀行信貸高額的利潤和它潛在的巨大發展空間。銀行也會根據各類型企業的發展規模及信譽記錄,評估風險因素來采取不同的信貸策略,確定是否給予放貸及額度、利率和期限。本文通過所搜集到的123家中小微企業有信貸記錄的關于信譽評級和是否違約數據信息,302家無信貸記錄企業的相關數據以及銀行貸款年利率和客戶流失率的關系2019年統計數據,合理選取指標,依據伯恩斯坦時間之窗理論,利用貝葉斯機器學習,先繪制出123家企業的時間之窗走勢圖,評估出其信貸風險,從而為銀行制定合理的信貸策略。在所求問題得出的結論和模型訓練的基礎上,利用貝葉斯機器無監督學習模型,得出平滑序列Rt,對302家企業的信息進行數據量化,算出方差及模擬退火后的方差,依據所求的方差和Rt將企業分成四類并分別求出其所占權重,為銀行制定信貸策略。本文會考慮新型冠狀病毒等突發因素對企業信貸問題產生的影響,檢驗貝葉斯模型的可靠性,進一步為銀行合理地提出信貸調整策略,實現銀行利潤最大化。
關鍵詞:伯恩斯坦時間之窗理論;貝葉斯機器學習;信貸策略
一、課題背景
某銀行對確定要放貸企業的貸款額度為萬元;年利率為4%~15%;貸款期限為1年本文需要根據所搜集到的數據信息,通過建立數學模型,為該銀行解決以下問題:
1.對123家企業的信貸風險進行量化分析,給出該銀行在年度信貸總額固定時對這些企業的信貸策略。
2.以上一個問題為基礎,對302家企業的信貸風險進行量化分析,并給出該銀行在年度信貸總額為1億元時對這些企業的信貸策略。
3.企業的生產經營和經濟效益可能會受到一些突發因素影響,而且突發因素往往對不同行業、不同類別的企業會有不同的影響。綜合考慮各企業的信貸風險和可能的突發因素(例如:新冠病毒疫情)對各企業的影響,給出該銀行在年度信貸總額為1億元時的信貸調整策略。
二、問題分析
針對上述待解決的三個問題,根據各企業的實際情況,合理選取企業信譽、違約記錄、企業實力等重要參考指標,基于伯恩斯坦時間之窗理論,對銀行信貸中常見的企業信貸風險問題,建立相對應的貝葉斯算法模型來進行合理的評估。依據評估結果,為銀行信貸業務制定全局最優的決策。
由于問題二缺少線性評估,可將機器監督學習優化為無監督學習,對302家企業的數據進行量化處理,求出方差及退火方差,從而將這些企業分成四類并可求出其所占權重,進而為銀行制定最優的資源分配方案。
問題三是在前兩問的基礎上再次加入一些影響銀行信貸業務的突發因素,比如新型冠狀病毒、自然災害、公共衛生安全等因素,本文需重新檢驗模型的可信度,來進行銀行信貸策略調整,從而保證銀行的利益最大化。
三、模型假設
1.對于客戶類型僅分為兩種類別,即違約或正常。
2.客戶的違約是相互獨立的。
3.假設一段時間內社會經濟形勢總體變化不大。
4.假設現有用戶交易數據真實,能真實反映用戶數據特征。
四、符號說明
五、模型建立與求解
針對問題一,基于最大后驗概率準則的樸素貝葉斯模型算法:
1.首先假設一個n維特征向量,并用這個n維特征向量來表示每個數據樣本,分別描述對n個屬性S1、S2…、Sn的n個度量。
2.假設有m個已知類,當存在一個未知的數據樣本X時(即沒有類標號),若運用樸素貝葉斯分類法,m個已知類將被分配給未知的數據樣本x,則分配原則
(3)依據經驗可知P(X|Ci)的計算非常大,為此,通常假設各屬性的取值互相獨立,這樣先驗概率可以從訓練數據集求得,有:
(4)如果Ai為離散型,則,其中ski是在類Ck屬性Ai具有值Xi的訓練樣本數,而是類Ck的訓練樣本Sk數。
(5)當且僅當時,樣本X被指派為類Ci。
基于最小風險準則的貝葉斯網絡算法:
對數據進行貝葉斯網絡的結構學習和參數學習,得到貝葉斯分類模型,再基于最小風險準則進行分類決策,對未知類別的樣本X計算:
在一個趨勢的運行過程中利用時間之窗理論,能夠對123家企業的數據信息進行量化分析,運用python軟件可繪制出了123家企業的時間之窗并觀察企業走勢形態。同時基于伯恩斯坦時間之窗理論,根據貝葉斯模型,得出123家企業的方差和Rt值。
增值稅是以商品在流轉過程中產生的增值額作為計稅依據而征收的一種流轉稅,其計算公式為增值稅=銷售額+銷項稅(或進項稅)。增值稅能夠反映企業的經營成效,一般來說企業銷售額越大,經營成果越好,應交的增值稅額就越大。選取附件中的增值稅指標,能夠做出移動5天窗口的平滑曲線,進而觀測123家企業近3年的企業實力趨勢的曲線變化。
綜合以上指標以及基于貝葉斯算法得出的Rt值可以把123家有信貸記錄的企業分成如下幾類:
第一類:企業實力強、信譽好、供求關系穩定、幾乎無違約情況,信貸風險小的企業,銀行可給予放貸,同時給予利率優惠。包括的企業有E1,E2,E6,E13,E15,E16,E18,E19,E22,E24,E27,E31,E48,E59,E64,E81,E84,E89,E91。
第二類:企業實力較強、信譽良好、供求關系較為穩定、違約情況少的企業,可給予放貸。包括的企業有E5,E10,E12,E23,E30,E32,E34,E37,E38,E45,E51,E57,E58,E61,E62,E63,E67,E70,E71,E76,E83,E85,E93,E106。
第三類:企業實力一般、信譽一般、違約情況較多的企業,銀行對于該類企業的放貸決策的制定要更加慎重。包括的企業有E3,E4,E11,E25,E40,E41,E44,E46,E47,E49,E50,E55,E68,E72,E73,E75,E77,E86,E90,E92,E94,E96,E105。
第四類:企業實力較弱、信譽較差、違約情況多的企業,銀行可考慮不予放貸。包括的企業有E36,E99,E100,E103,E107,E109,E111,E113,E114,E119,E120。
信貸策略:
基于以上四類企業,并結合相關信貸政策,本文考慮為銀行制定以下策略:
1.滲透性定價:對于企業經營狀態良好,負債情況穩定,征信記錄優良的企業采用滲透性定價,為企業放貸,并為其提供利率優惠,這樣銀行可以占據更為廣闊的市場,雖然利率會有一定的損失,但是由于獲得了充足的客戶資源,損失的利率會大大減小。
2.差異化定價:差異化定價的模式是十分適合剛剛上市的中小微企業,這種模式的具體做法是對于中小微企業降低一定的利率,從而銀行的知名度將會大大提高,這樣銀行獲得客戶資源的成本由于銀行知名度的提高將會降低,于是此種模式所帶來的損失將會由于成本的降低而被彌補。
3.普通定價:這種模式應該應用于生產和管理十分成熟的企業,銀行制定合理的信貸策略要考慮企業本身的風險因素。因為對于一些盈利率較高的公司來說從銀行獲得信貸要考慮許多因素,但是價格因素不是它們最主要考慮的因素。相應地,銀行也可用這部分利息收入來平衡其他產品收入的不足,相應降低利率,可很大程度上提高其市場知名度,一旦形成規模效應,可以再次降低銀行獲客成本,減少的銀行獲客成本用來補充差異化定價的損失。
針對問題二,基于最小風險準則進行分類決策,最小風險準則貝葉斯分類算法,并訓練分類模型,得出302家企業數據的平滑序列Rt、方差及退火方差,根據方差和Rt將這些企業分成四類,其所占權重?;诖怂念惼髽I所占份額,合理地根據百分比將1億元對企業進行配給信貸。
信貸配給策略:銀行向四類企業提供貸款的比率分別為:22%、31%、28%、19%。
針對問題三,通過對302家企業的數據進行預處理,可對其中的企業類型進行如下分類:加工制造業、物流運輸批發貿易、高科技(含軟件、互聯網)、電商、建筑業、其它。
2020年新冠肺炎疫情對各行各業的生產經營和經濟效益都造成了不同程度的影響,本文綜合考慮了所搜集數據中各企業的信貸風險和突發因素如新冠病毒疫情對各企業的影響,通過貝葉斯算法訓練數據得到了因突發新冠肺炎疫情對中小微企業市場造成的不利影響(%),可以通過EXCEL表格對這些數據進行可視化處理。
結合以上求解得到的結論,分析該銀行在年度信貸總額為1億元時的信貸調整策略為:
六、模型檢驗
為了減小模型的誤差,使用模擬退火算法來使方差加倍,然后通過多次貝葉斯算法訓練數據后使方差趨于很小,從而使模型更加精確。
我們應用貝葉斯算法對302家企業進行了預測,擬合出了關于主要國家的Rt時間估計分布圖,放大圖形觀察發現,大部分企業會出現個別異常的點,但是都能分布在置信區間內部,同時我們還計算出這些主要國家的樣本方差,運用模擬退火算法,將方差趨于更小,描繪出302家企業退火前后方差的對比圖,發現除了個別企業外,其余企業都接近期望值,說明大部分企業應用貝葉斯的方法對數據預測具有合理性。
七、模型改進
該模型在屬性個數比較多或者屬性之間相關性較大時,分類效果不好,在某些時候會由于假設的先驗模型等原因導致預測效果不佳。模型通過先驗和數據來決定后驗的概率從而決定分類,所以分類決策存在一定的錯誤率。貝葉斯模型為有效的監督機器學習模型,更好地考慮了突發因素對于各類中小微企業信貸問題造成的不同程度的影響。
參考文獻:
[1]韓平.國有商業銀行信貸風險生成機理與管理系統研究[R].西安:西安交通大學博士論文,2000.
[2]張友棠.財務預警系統管理研究.中國人民大學出版社2007年版.
[3]肖北溟.國有商業銀行信貸評級模型的構建及實證檢驗[J].金融論壇,2004,(4):16-21.