999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學(xué)習(xí)的信貸風(fēng)險量化與決策分析

2021-12-08 19:54:03王沼翔葛琳
軟件工程 2021年12期
關(guān)鍵詞:機器學(xué)習(xí)

王沼翔 葛琳

摘 ?要:中小微企業(yè)在發(fā)展過程中需要信貸融資,然而部分企業(yè)的不良貸款會對金融穩(wěn)定構(gòu)成威脅。針對此問題,可以通過對企業(yè)相關(guān)財務(wù)數(shù)據(jù)進行分析,從源頭上防范和降低信貸風(fēng)險。本文采用熵權(quán)法、數(shù)據(jù)統(tǒng)計分析法、K均值聚類和BP神經(jīng)網(wǎng)絡(luò)等機器學(xué)習(xí)算法來給出相應(yīng)的信貸策略,規(guī)避信貸風(fēng)險。實驗基于2020 年全國大學(xué)生數(shù)學(xué)建模競賽賽題發(fā)布的公開數(shù)據(jù)集,利用MATLAB R2018a和Python 3.9等工具進行代碼編寫。測試結(jié)果表明,本文方法可以有效地對中小微企業(yè)的信貸風(fēng)險進行評估并制定相應(yīng)的信貸策略。

關(guān)鍵詞:風(fēng)險評級模型;機器學(xué)習(xí);熵權(quán)法;BP神經(jīng)網(wǎng)絡(luò);K均值聚類

中圖分類號:TP391 ? ? 文獻標識碼:A

Abstract: Medium, small and micro enterprises need credit financing in the development process, but non-performing loans of some enterprises pose a threat to financial stability. Aiming at this problem, an analysis of relevant financial data of the enterprise prevents and reduces credit risks from the source. This paper proposes corresponding credit strategies to avoid credit risks by using machine learning algorithms such as entropy weight method, data statistical analysis method, K-means clustering and BP neural network. The experiment is based on the public data set released by the 2020 National College Students Mathematical Modeling Contest, using MATLAB R2018a, Python 3.9 and other tools for code writing. Test results show that the proposed strategies can effectively evaluate the credit risk of medium, small and micro enterprises and formulate corresponding credit strategies.

Keywords: risk rating model; machine learning; entropy weight method; BP neural network; K-means clustering

1 ? 引言(Introduction)

在市場經(jīng)濟運行中,中小微企業(yè)的經(jīng)營特點決定了其在融資過程中存在一定的風(fēng)險,銀行在向中小微企業(yè)提供貸款時,要充分考慮多方面因素并制定合適的信貸策略。面對海量的信貸數(shù)據(jù),如何提高模型與算法對信貸企業(yè)風(fēng)險評估的精確性,已經(jīng)逐漸成為銀行業(yè)亟待解決的關(guān)鍵問題。傳統(tǒng)信貸風(fēng)險管理模式主要依賴人工運用統(tǒng)計方法對企業(yè)借貸違約可能性的預(yù)測,以被評估者相關(guān)指標的歷史數(shù)據(jù)為依據(jù),對被評估者的還貸能力和違約行為進行預(yù)測和分析。隨著互聯(lián)網(wǎng)金融的興起,傳統(tǒng)的評估模型與預(yù)測算法已不能滿足評估信貸風(fēng)險的實際需要[1-4]。在大數(shù)據(jù)技術(shù)的作用下,銀行可以運用綜合分析有效防控信貸風(fēng)險和信息不對稱問題。借助機器學(xué)習(xí)和深度學(xué)習(xí),銀行可以分析大量的企業(yè)數(shù)據(jù),預(yù)測信貸風(fēng)險,提高風(fēng)險識別能力[5]。

本文采用熵權(quán)法、數(shù)據(jù)統(tǒng)計分析法和BP神經(jīng)網(wǎng)絡(luò),利用MATLAB R2018a和Python 3.9等工具對有信貸和無信貸記錄企業(yè)的相關(guān)數(shù)據(jù)集進行分析,給出相應(yīng)的信貸策略,規(guī)避信貸風(fēng)險[6-8]。對于有信貸記錄企業(yè),本文運用數(shù)據(jù)統(tǒng)計法分析中小微企業(yè)的信貸影響因素,采用熵權(quán)法計算每個影響因素的權(quán)值,并得出各企業(yè)綜合信貸風(fēng)險值,最后通過聚類分析,將各企業(yè)劃分類別,通過與信譽評級的組合來確定合適的信貸策略方案;對于無信貸記錄企業(yè),本文使用有監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)對信貸策略進行預(yù)測和分析,得到各個信譽等級數(shù)據(jù)。實驗結(jié)果表明,本文所建立的模型可以有效地對中小微企業(yè)的信貸風(fēng)險進行評估并制定有效的信貸策略。

2 ? 數(shù)據(jù)預(yù)處理(Data preprocessing)

本文以2020 年全國大學(xué)生數(shù)學(xué)建模競賽賽題發(fā)布的公開數(shù)據(jù)集為例進行分析,該數(shù)據(jù)集包含123 家有信貸記錄企業(yè)的21萬條進項發(fā)票信息、16萬條銷項發(fā)票信息,302 家無信貸記錄企業(yè)的39萬條進項發(fā)票信息、33萬條銷項發(fā)票信息以及銀行貸款年利率與客戶流失率關(guān)系統(tǒng)計數(shù)據(jù)。基于Python編程完成對數(shù)據(jù)集中數(shù)據(jù)的預(yù)處理,分別實現(xiàn)有信貸記錄企業(yè)和無信貸記錄企業(yè)的銷項、進項發(fā)票中的數(shù)據(jù)計算,通過對每個企業(yè)有效發(fā)票的金額、稅額、價稅的累加,得到各企業(yè)全部有效發(fā)票的總金額、總稅額和總價稅合計等數(shù)據(jù)信息。

3 ?有信貸記錄企業(yè)信貸分析與決策(Credit analysis and decision-making for companies with credit records)

對于有信貸記錄企業(yè),根據(jù)企業(yè)交易票據(jù)中的數(shù)據(jù),通過建立數(shù)學(xué)模型給出合適的信貸策略。首先,構(gòu)建人脈占有率、市場流通率、市場穩(wěn)定率、企業(yè)盈利率四個影響信貸風(fēng)險因素的評估因子;其次,基于K均值聚類算法、熵權(quán)法建立風(fēng)險評級模型,以風(fēng)險級別確定貸款額度;第三,分析客戶流失率、貸款利率以及企業(yè)評級的關(guān)系,以信譽評級確定貸款利率[2];最后,按照三類風(fēng)險評級、三類信譽評級組合成的九種企業(yè)定位確定不同額度、不同利率的信貸策略。整體流程圖如圖1所示,模型分析中所用的數(shù)學(xué)符號如表1所示。

3.1 ? 影響因子

對有信貸記錄企業(yè)的數(shù)據(jù)根據(jù)進項、銷項、有效發(fā)票和發(fā)票總數(shù)進行分析,綜合考慮企業(yè)和銀行各方面的因素,在企業(yè)實力、供求穩(wěn)定性等方面設(shè)置下列影響因子:

將企業(yè)聚合為三個類別,對三個類別進行綜合評分(LFD),其評分計算如公式(12)所示。將該三類企業(yè)重新進行分類并編號,類別由強到弱編為S1、S2、S3,根據(jù)聚類分析得出三個類別分別對應(yīng)的部分企業(yè)如表3所示。

利率和企業(yè)的信譽之間存在潛在關(guān)系,在A、B、C三種信譽等級的企業(yè)流失率與貸款利率呈正相關(guān)且在同等貸款利率水平下,A、B、C三種信譽評級的企業(yè)流失率依次降低。本文將年利率和貸款額度分別分為三組,如表4所示。

銀行根據(jù)企業(yè)的信貸風(fēng)險類別和其對應(yīng)的信譽評級將企業(yè)分為九級定位,對于不同信貸風(fēng)險級別的企業(yè),確定不同貸款額度;對于不同信譽級別的企業(yè),確定不同貸款利率[4]。信貸策略各級對應(yīng)表如表5所示。

本文所分析的數(shù)據(jù)集涉及302 家企業(yè)信息中無信譽評級等數(shù)據(jù),然而信譽評級在銀行信貸策略中具有重要的意義。首先,采用有監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),對所分析的數(shù)據(jù)集中123 家有信譽評級的企業(yè)信息提取的影響因子進行訓(xùn)練;其次,利用訓(xùn)練得到的BP神經(jīng)網(wǎng)絡(luò)對無信譽評級的企業(yè)進行信譽評級和分析;最后,驗證模型是否合理[6]。

4.1 ? BP神經(jīng)網(wǎng)絡(luò)模型

無信貸記錄企業(yè)的數(shù)據(jù)集中無信譽等級數(shù)據(jù),故而使用有監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)對信貸策略進行預(yù)測和分析,并得到各個信譽等級數(shù)據(jù)。BP神經(jīng)網(wǎng)絡(luò)模型中各符號的含義如下:

網(wǎng)絡(luò)輸入向量;網(wǎng)絡(luò)目標向量;中間層單元輸入向量、輸出向量;輸出層單元輸入向量、

輸出向量;輸出層到中間層的鏈接權(quán)值;中間層到輸出層的鏈接權(quán)值;中間層每一個神經(jīng)單元的輸出閾值(即偏置向量);輸出層每一個神經(jīng)單元的輸出閾值(即偏置向量);參數(shù)。

BP神經(jīng)網(wǎng)絡(luò)模型計算輸入輸出信息結(jié)果是否產(chǎn)生相互影響的權(quán)重,并進行綜合分析。構(gòu)建過程如下:

(1)初始化。對每一個神經(jīng)元的權(quán)值和、閾值和設(shè)置區(qū)間在(-1,1)內(nèi)的隨機數(shù)。

(2)在有信貸記錄企業(yè)數(shù)據(jù)集的123 家企業(yè)中選取一組學(xué)習(xí)樣本和目標樣本。

(3)計算中間層單元的輸出。

(9)隨機選取下個樣本代入神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,執(zhí)行步驟(3),直到網(wǎng)絡(luò)的訓(xùn)練全局誤差達到網(wǎng)絡(luò)收斂值,學(xué)習(xí)結(jié)束[7]。本文獲得的影響企業(yè)實力的因子為四個,輸入層神經(jīng)節(jié)點數(shù)目為4,而本文神經(jīng)網(wǎng)絡(luò)最終輸出的只有一個企業(yè)實力數(shù)據(jù),則輸出層節(jié)點個數(shù)為1。隱含層節(jié)點數(shù)目的取值如公式(22)所示。式中,為輸入層節(jié)點的數(shù)目,l為輸出層節(jié)點的數(shù)目,為隱含層節(jié)點的數(shù)目。由公式(22)可得隱含層節(jié)點數(shù)目為2。

4.2 ? 模型訓(xùn)練

采用獨立測試方法,將實驗數(shù)據(jù)分成兩部分,其一是訓(xùn)練數(shù)據(jù)。本文將有信貸記錄企業(yè)數(shù)據(jù)集中的123 家企業(yè)的樣本數(shù)據(jù)按照信譽評價分類,隨機抽取100 組數(shù)據(jù)作為實驗培訓(xùn)數(shù)據(jù),剩下的23 組樣本數(shù)據(jù)作為測試數(shù)據(jù),用于檢測BP神經(jīng)網(wǎng)絡(luò)。利用MATLAB將訓(xùn)練樣本數(shù)據(jù)代入程序,并對該神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,得到的訓(xùn)練結(jié)果如圖2和圖3所示。

通過上述訓(xùn)練,可以得到初步的訓(xùn)練結(jié)果,為了驗證BP神經(jīng)網(wǎng)絡(luò),將測試數(shù)據(jù)代入已經(jīng)訓(xùn)練好的網(wǎng)絡(luò)模型當(dāng)中進行測試。為得出模型測試準確度,我們構(gòu)建以下度量模型,測試結(jié)果好壞的誤差計算如公式(23)所示。式中,為模型誤差,為真實值,為評價值,為測試數(shù)據(jù)集個數(shù)。通過上述誤差公式計算得出BP神經(jīng)網(wǎng)絡(luò)的測試誤差為0.112。通過構(gòu)建并優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型,計算出無信貸記錄企業(yè)的四個指標因素值。

圖4中值為3對應(yīng)信譽等級為A,數(shù)量為76 個;值為2對應(yīng)信譽等級為B,數(shù)量為92 個;值為1對應(yīng)信譽等級為C,數(shù)量為86 個;值為0對應(yīng)信譽等級為D,數(shù)量為48 個。因為銀行對信譽評級為D的企業(yè)原則上不予放貸,故將BP神經(jīng)網(wǎng)絡(luò)的信譽等級匹配到無信貸記錄企業(yè)數(shù)據(jù)集的各個企業(yè)中,將信譽評價為D級的企業(yè)剔除。對無信貸記錄企業(yè)數(shù)據(jù)集處理后的各項數(shù)據(jù)利用公式(1)—(4)進行量化分析,計算出各個指標的值,并且利用熵權(quán)法求出四個影響因子的權(quán)重,則企業(yè)風(fēng)險評級模型如公式(24)所示:

4.3 ? 實驗與測試

根據(jù)無信貸記錄企業(yè)的數(shù)據(jù)計算出各個影響因子的權(quán)重,分析四個影響因子的數(shù)據(jù),進行聚類分析,將企業(yè)聚合為三個類別,則得出分級評分如表6所示。

由分級數(shù)據(jù)以及客戶流失率可得,當(dāng)年利率大于0.0745時,各個信譽等級企業(yè)的客戶流失率為0.5,潛在客戶大量流失,其收益也將大幅度下降,所以將客戶流失率控制在0.5之內(nèi),有利于銀行收益的可持續(xù)發(fā)展[8]。本文將客戶流失率小于0.5的年利率分為三組,S4、S5、S6部分對應(yīng)的企業(yè)信貸額度也分為三組。

根據(jù)前文數(shù)據(jù)分析,按照企業(yè)的風(fēng)險評級和實力類別制定九種信貸策略,從而確定不同企業(yè)的貸款額度、利率,如表7所示。

按照信貸策略分配金額,得出全體企業(yè)的貸款金額總額區(qū)間(萬元),銀行的收益總額區(qū)間(萬元)。

由于假設(shè)中規(guī)定是1 億元定額分配貸款金額,9,050 萬元按照表7的信貸策略對企業(yè)進行放貸。剩下950 萬元有兩種選擇策略:一是銀行利益最大化,將剩余額度優(yōu)先分配給貸款利率較高的信譽C級企業(yè);二是銀行發(fā)展持久化,將剩余額度優(yōu)先分配給信譽A級企業(yè),來降低此類高信譽級別企業(yè)的客戶流失率,為銀行積累固定客戶。

5 ? 結(jié)論(Conclusion)

大數(shù)據(jù)時代給各行各業(yè)提供了更多利用數(shù)據(jù)的機會,在信貸業(yè)務(wù)中存在諸多不確定因素,銀行應(yīng)及時綜合多方面因素,根據(jù)形勢調(diào)整信貸策略。本文針對銀行向中小微企業(yè)發(fā)放貸款問題,依據(jù)熵權(quán)法、K均值聚類和BP神經(jīng)網(wǎng)絡(luò)對信貸策略問題進行模型求解,以123 家有信貸記錄企業(yè)和302 家無信貸記錄企業(yè)的財務(wù)數(shù)據(jù)為樣本進行實證檢驗,從人脈占有率、市場流通率、市場穩(wěn)定率、企業(yè)盈利率四個影響因素對有信貸記錄企業(yè)和無信貸記錄企業(yè)的相關(guān)數(shù)據(jù)集進行分析,最終給出合適的信貸策略選擇方案。

信貸數(shù)據(jù)是信貸業(yè)務(wù)中的重要部分,為了實現(xiàn)精準分析數(shù)據(jù)的目標,在分析信貸風(fēng)險時,銀行需要對數(shù)據(jù)進行深入統(tǒng)計和挖掘,可通過對多種算法模型進行組合,綜合分析企業(yè)實力、供求關(guān)系等方面信息,建立信貸授權(quán)額度模型,優(yōu)化信貸資源整體配置效率,加強信貸風(fēng)控系統(tǒng)的控制和管理。模型中分析問題、解決問題的一些綜合性的方法,以及信貸風(fēng)險量化分析的一些思想,對于其他的數(shù)學(xué)問題仍可以使用,可推廣到各行業(yè)的實力評價與決策等應(yīng)用中。

參考文獻(References)

[1] 李美玲.H商業(yè)銀行信貸業(yè)務(wù)全面風(fēng)險管理體系研究[D].長春:吉林大學(xué),2019.

[2] 唐恬.商業(yè)銀行中小企業(yè)信貸風(fēng)險策略研究[J].經(jīng)營與管理,2021(04):154-158.

[3] 李越洋.基于熵權(quán)-TOPSIS的PPP項目融資風(fēng)險評價[J].價值工程,2019,38(05):69-72.

[4] 朱文雅.熵權(quán)法在銀行經(jīng)營績效評價中的應(yīng)用[J].中國鄉(xiāng)鎮(zhèn)企業(yè)會計,2019(02):150-151.

[5] OOSTERLEE C W, GRZELAK L A. Mathematical modeling and computation in finance with exercises and Python and MATLAB computer codes[M]. Singapore: World Scientific Publishing Company, 2019:3-15.

[6] 李鈺博,裴宇恒,高曉亮.中小微企業(yè)的信貸決策問題研究[J].營銷界,2020(29):163-165.

[7] 楊君岐,任瑞,闞立娜,等.基于BP神經(jīng)網(wǎng)絡(luò)模型的商業(yè)銀行風(fēng)險評估研究[J].會計之友,2021(05):113-119.

[8] XU M L, XIONG D P, YANG M Y. Risk recognition and risk classification diagnosis of bank outlets based on information entropy and BP neural network[J]. Journal of Intelligent and Fuzzy Systems, 2020, 38(2):1531-1538.

作者簡介:

王沼翔(1999-),男,本科生.研究領(lǐng)域:大數(shù)據(jù)分析.

葛 ?琳(1978-),女,博士,講師.研究領(lǐng)域:網(wǎng)絡(luò)信息安全,大數(shù)據(jù)分析,區(qū)塊鏈.

猜你喜歡
機器學(xué)習(xí)
基于詞典與機器學(xué)習(xí)的中文微博情感分析
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數(shù)據(jù)分析研究
基于Spark的大數(shù)據(jù)計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統(tǒng)
基于圖的半監(jiān)督學(xué)習(xí)方法綜述
機器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
極限學(xué)習(xí)機在圖像分割中的應(yīng)用
主站蜘蛛池模板: 99久视频| 伊人久久大线影院首页| 五月婷婷导航| 日本午夜视频在线观看| 国产AV毛片| 91精品人妻一区二区| 色视频国产| 凹凸精品免费精品视频| 91精品国产福利| 国产成人高清精品免费软件| 99视频在线免费| 精品精品国产高清A毛片| 国产在线观看高清不卡| 美女免费精品高清毛片在线视| 亚洲成人77777| 欧美特级AAAAAA视频免费观看| 亚洲 欧美 中文 AⅤ在线视频| 中文字幕无码中文字幕有码在线| 国产福利免费视频| 国产毛片不卡| 好久久免费视频高清| 中国美女**毛片录像在线| 无码精油按摩潮喷在线播放| 国产女主播一区| 亚洲人成网址| 久久毛片基地| 青青青国产精品国产精品美女| 综合社区亚洲熟妇p| 久久香蕉国产线看精品| 99精品国产高清一区二区| 五月天天天色| 91视频青青草| 国产精品99久久久久久董美香| 国产精品网址在线观看你懂的| 青青操视频在线| 亚洲日韩在线满18点击进入| 精品91视频| 91色爱欧美精品www| 国产精品久线在线观看| 国产成人1024精品下载| 久久婷婷色综合老司机| 福利姬国产精品一区在线| 色综合激情网| 在线精品自拍| 欧美亚洲第一页| 91黄视频在线观看| 国产99免费视频| 农村乱人伦一区二区| 国产毛片一区| 国产一在线观看| 免费国产福利| 99视频在线观看免费| 亚洲一区精品视频在线 | 亚洲天堂视频网站| 影音先锋亚洲无码| 国产成人永久免费视频| 成年女人a毛片免费视频| 亚洲欧美综合在线观看| 日韩毛片免费视频| 全色黄大色大片免费久久老太| 视频二区中文无码| 57pao国产成视频免费播放| 久久精品嫩草研究院| 国产精品妖精视频| 天天摸夜夜操| 特级毛片免费视频| 亚洲国产日韩一区| 91久久夜色精品| 国产91全国探花系列在线播放| 国产欧美高清| 欧美一级高清片久久99| 2022精品国偷自产免费观看| 欧美在线免费| 毛片一区二区在线看| 亚洲女同一区二区| 成人国产小视频| 国产网站免费观看| 日本手机在线视频| 久久国产精品嫖妓| 欧美亚洲中文精品三区| 久久久久久尹人网香蕉| 熟妇丰满人妻|