999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于加權硬投票融合模型的互聯網消費金融借款人違約風險預測

2022-05-30 06:33:05司筱涵,魏建國,魏英杰

摘要: 首先分析了互聯網消費金融違約風險的特征,運用信息經濟學研究互聯網消費金融借款人違約風險的形成機制,構建了借款人信用風險評價指標體系。然后構建集XGBoost、LightGBM和CatBoost的二分類加權硬投票融合模型,用于預測借款人違約風險。通過實證檢驗比較不同分類器訓練下的預測結果發現:融合模型的預測精準度優于單一模型XGBoost、LightGBM和CatBoost;基于特征重要性排序結果,發現影響貸款者違約的關鍵因素主要包括貸款利率、年收入、公共事業差評數記錄、循環信貸余額等。最后提出了加強借款人違約風險管理的建議。

關鍵詞: 互聯網消費金融; 二分類加權硬投票; 違約風險

中圖分類號: F832.39文獻標識碼: ADOI: 10.3963/j.issn.1671-6477.2022.03.003

近年來,我國互聯網消費金融快速發展,市場規模不斷擴大。Wind數據顯示,2019年互聯網消費金融市場交易規模達22800億元,互聯網消費金融從2013年的60億元增長到2019年的22800億元,年平均增長率達169.13%。盡管2020年受新冠疫情影響,互聯網消費金融增長速度有所減緩,但后疫情時代還將迎來快速增長。然而,由于我國互聯網消費金融發展尚處于探索階段,主要服務對象是低收入弱信用的長尾人群,加上我國征信體系尚不完善、平臺內部風險控制機制還不健全等,借款人違約現象頻發。中國銀監會和保監會的數據顯示,消費金融行業不良率逐年攀升,由2012年的0.56%上升至2018年的8%,7年間增長了1328.57%。

本文構建了消費金融借款人違約風險評估的二分類加權硬投票融合模型,對借款人違約率和違約因素作出預測,并采用Kaggle網站發布的某互聯網消費金融平臺交易數據作實證分析,以檢驗該模型的預測精度,以期為我國互聯網消費金融違約風險管理提供新方法。

一、 相關文獻綜述

目前學界在對借款人違約特征及影響因素的研究上,主要集中在內源性因素與外源性因素兩個方面。林慰曾等指出,互聯網消費金融發展失范的根源在于信用錯配,特別是平臺次級客戶高額授信會誘發違約行為[1]。岳森認為互聯網消費金融平臺無法準確審核借款人信息真實性,導致授信準確度難以保障,會增加違約風險[2]。張茂軍等認為,金融科技的發展增強了信息獲取能力,卻在信息處理能力上存在局限性,使之在決策時存在偏差,加劇了平臺的違約風險[3]。Chiang SL認為借款人抵押貸款的凸性對違約概率變化影響最大[4]。Lee等的實證研究表明,借款人樣本語音數據提取的參數可作為違約風險評級水平的決定因素[5]。Sangwan S提出借款人的家庭社會經濟地位特征將顯著影響違約行為發生的可能性[6]。

在對借款人違約的評價指標體系的研究方面,周永圣等選取借款人的基礎信息、行為和心理等三個方面因素構建了互聯網消費金融違約風險指標體系[7],王正位等提出了個人特征、信用變量、歷史表現、借款信息等四項一級指標,對網貸平臺違約風險進行評估[8],Carlos Eduardo Canfield等從信用評分和借貸者特征兩方面構建網貸平臺違約風險指標體系[9],Oded Netzer等分別從借款人的人種、性別、外貌等特征方面構建互聯網消費金融違約風險指標體系,實證結果表明,黑人的借款成本更高[10],Frydman H等在評價違約風險時,更注重借款人基本信息、借貸信息、還款能力三個層面[11]。

在對借款人違約的預測方法的研究方面,李汛等運用多個機器學習模型預測借款人的違約概率,其研究表明,機器學習預測借款人違約行為的準確率普遍高于傳統回歸模型[12],馬曉君等采用CatBoost算法構建P2P違約預測模型,并與LightGBM,XGBoost進行對比,發現CatBoost的性能總體上優于LightGBM,XGBoost[13],杜梅慧等采用兩步子抽樣方法抽取樣本,建立logistic回歸模型,提高了違約率預測精度[14],Cowden C等基于支持向量機算法建立違約風險預測模型,其模型具有良好的特征穩定性與分類準確性[15],KHAN等使用Fama-French五因子模型考察了新興市場背景下違約風險因子的有效性,與其他模型相比,可以提高選取特征變量的準確率[16]。

綜上可知,國內外學者對借款人違約的相關研究主要集中在對風險評估的指標選擇與算法測定上,對一般性消費金融違約風險的研究較多,且多是將傳統金融機構管理客戶違約風險的算法和模型應用到消費金融之中,對互聯網消費金融違約風險及其預測方法的研究不夠。本文通過確定借款人違約風險預測指標體系,構建改進的XGBoost-Light、GBM-CatBoost三階段融合模型,以用于預測借款人違約風險,為互聯網消費金融平臺的風險管理提供依據。

二、 理論分析與研究設計

(一) 互聯網消費金融違約風險及其特征

互聯網消費金融的違約風險,是指借款人不能履行借款合約的還款義務,使貸款平臺遭受損失的情況。其一方面表現為借款人收入不穩定時產生的被動違約行為,強調其非預謀性[17];其另一方面表現為借款人事先有違約動機,在有支付能力的前提下,不按期還款而產生的主動違約行為,強調其預謀性。

互聯網消費金融的違約風險有如下特征:一是客戶的特殊性?;ヂ摼W消費金融的客戶群體大多是被傳統金融排斥的長尾客戶,他們往往是低收入或無穩定收入、無資產抵押、無財務記錄、征信數據缺乏,部分借款人還存在非理性消費行為。二是消費行為的多樣性。目前消費貸場景主要集中在購物、租房、裝修、旅游等方面。一些電商平臺基于數據挖掘技術精確分析客戶行為特征,給客戶大量推送金融營銷廣告和具有吸引力的商品,在支付環節提供各種“分期、免息、免費”的金融產品,對消費者形成了極大的誘惑,導致一部分消費者出現“超前消費”“過度消費”的情況,并因此而背負沉重的債務包袱。三是貸款產品的特殊性。消費金融產品貸款額度小、期限短、放款快,為了彌補較高的違約風險,借款利率往往高于銀行一般性商業貸款。四是平臺管理不規范。一些游離在金融監管之外的中介機構通過互聯網渠道,以“低息、低費、快速、無抵押、無擔保、無須審查征信”等廣告宣傳誘導消費者貸款,使部分消費者陷入“貸款陷阱”。

(二) 互聯網消費金融形成違約風險的理論分析

互聯網消費金融平臺主要服務于低收入的弱信用群體,因而面臨比傳統金融風險更高的信用風險。由于借款人客群分散、線上融資,互聯網消費金融平臺難以全面獲知和辨別借款人的真實準確的信用信息。信用等級低的借款人會掩飾個人收入狀況,甚至提供虛假信息,以提高信用等級而獲得貸款,于是就會出現逆向選擇問題,從而增加違約風險。

借款人在獲得貸款后,可能違背貸款協議,出現了到期不能按時還款的現象,即發生了道德風險。出現道德風險的原因在于:首先,由于信息不對稱和借款人高度分散的特征,貸款平臺出于成本考慮,難以對借款人進行事后監督,借款人在獲得貸款后,可能會違反借、貸雙方對貸款用途的約定,將貸款用于高風險的投機活動,一旦投機活動受挫,違約風險就不可避免。其次,即使借款人將貸款用于約定的消費用途,借款人也可能由于意外事件出現而導致收入困難乃至難以還款,從而發生違約風險。

(三) 借款人違約風險指標體系的構建

根據互聯網消費金融平臺和借款人特征,參考國內外相關文獻所選取的指標,考慮到指標數據的可獲得性和量化性,基于定性和定量指標相結合的原則,本文構建借款人違約風險預測指標體系,以借款人解釋變量作為自變量,將所搜集到的借款人信息進行分類,其內容包含借款人基本信息、借貸信息、信用狀況、還款能力四個一級指標,以及19個二級指標,同時將借款人違約與否作為因變量,具體分組見表1。

1.借款人基本信息,包括年齡、性別、受教育程度等,它們在一定程度上反映了借款人的收入情況,特別是借款人的房產情況直接反映出其資產水平,是判斷借款人還款能力的重要指標。此外,借款人的婚姻狀況、工作職稱等指標與借款人發生逾期后所需承擔的違約成本相關。

2.借款人借貸信息,包括借款金額、借款周期、借款目的等,能夠幫助審核人員了解當前借款人的資金使用情況,從而有助于分析借款人正常還款的可能性,也便于了解貸款的內在風險。同時,審核人員可通過借款人貸款狀態判斷其信用品質,是影響貸款回收金額的重要因素。

3.借款人信用狀況,包括信用等級、未結信用額度、公共事業差評數等。借款人的信用歷史可以很直觀地體現出其償還借款的意愿。能主動且及時履約的借款人,一般都具有良好的信用,而曾經發生過借款逾期甚至經常發生逾期的借款人,則屬于高危借款人群。

4.借款人還款能力,包括未平倉交易數、負債率、賬戶余額等。這些指標反應借款人的資金流向和資產狀況,方便審核人員對借款人的資金進行監管,有助于判斷借款人能否按時足額還本付息,以防范違約行為的產生。

(四) 模型構建

GBDT模型是由多個決策樹共同構建的一種加性回歸模型①。與傳統的統計學模型相比,GBDT模型可以有效量化捕捉不同單位或數量級的自變量對因變量的影響程度,并通過對數據進行學習來調整自變量權重,進而提高模型的估計精度,因此,利用GBDT對互聯網消費金融違約行為進行建模是可行的。在研究互聯網消費金融的違約問題中,假設x和y分別表示借款人的解釋變量與借款人違約狀態,可將其算法列為T={(x1,y1),(x2,y2),…,(xn,yn)},xi∈Nm,yi∈(-1,1)。目前,GBDT有許多不同的改進模型,其中最具代表性的分別為XGBoost、LightGBM、CatBoost。

1.XGBoost模型。XGBoost與GBDT模型最大的區別在于對借款人解釋變量數據集進行訓練時所需的損失函數不同,XGBoost所運用的算法機制更易實現。GBDT的均方差損失函數如公式(1)所示:L(y,G(x))=[y-G(x)]2 (1)XGBoost相較于GBDT的改進在于對損失函數可運用二階泰勒公式求近似值,通過加入正則項Ω(gi)來控制模型的復雜程度,表達式如公式(2)所示:Ω(gi)=rD+12λ∑Jj=1ω2j(2)2.LightGBM模型。LightGBM分別從借款人解釋變量的維度與特征兩個方面對GBDT加以改進,其核心技術是實現精度與效率的平衡。GBDT通過使用葉子節點后的方差來衡量信息收益,可用公式(3)表示:VL/Q(e)=1nQ∑{xi∈Q,xiL≤d}ginLI/Q(e)2+∑{xi∈Q,xiL>d}ginLr/Q(e)2" (3)LightGBM則通過GOSS算法來減少梯度較小的樣本比例,僅采用梯度較大的樣本估計信息增益L(e),如公式(4)所示:L(e)=1n∑{xi∈A,xiL≤d}gi+1-ab∑{xi∈A,xiL≤d}gi2nLI(e)

+∑{xi∈A,xiL>d}gi+1-ab∑{xi∈A,xiL>d}gi2nLr(e)(4)3.CatBoost模型。CatBoost的基本原理是解決原始GBDT中所存在的各種數據偏移問題,能夠更好地處理類別特征。GBDT算法在處理借款人類別型變量,如性別、婚姻狀況等,常用其對應的數據集平均值來代替,并把它作為決策樹中節點分裂的標準。這種方法被稱為Greedy TBS,具體公式如下:im=∑nj=1[xj,m=xi,m]Gi∑nj=1[xj,m=xi,m] (5) Greedy TBS使得處理后的借款人二級指標中對比實際數據集包含更多信息,所以用實際數據集的平均值來替代解釋變量,在訓練集和測試集數據分布與結構不同的情況下容易出現條件偏移。

針對這種情況,CatBoost通過添加先驗分布項的方式改進Greedy TBS,減少了噪聲和低頻數據對于數據分布的影響,具體公式如下:im=∑K-1j=1[xσj,m=xσj,m]Gσj+ak∑K-1j=1[xσj,m=xσj,m]+a (6)4.XGBoost-LightGBM-CatBoost融合模型。本文所設計的XGBoost-LightGBM-CatBoost融合模型如圖1所示。在訓練階段采用5折交叉驗證方式尋找到模型的最優參數;在測試階段將特征變量作為XGBoost、LightGBM和CatBoost的輸入,并對三個分類器輸出的類別進行二分類加權硬投票法得出預測結果。

圖2所示的二分類加權硬投票,就是指根據XGBoost、LightGBM和CatBoost預測的準確率計算出其加權準確率,觀察三個分類器的預測結果并比照準確率高的分類器來確定最終的預測值。例如,XGBoost、LightGBM、CatBoost三個分類器預測的準確率分別為0.65、0.68、0.96;計算其加權的準確率為0.28、0.3、0.42。通過觀察發現,任意兩個分類器其加權準確率相加的值大于0.5。使用Sigmoid函數對其進行分類,當任意兩個分類器預測結果相同時,樣本標簽0或1將與結果保持一致。

三、 實證分析

(一) 數據來源與處理

1.描述性統計

本文數據來源于Kaggle網站上某消費金融平臺的交易數據,采集了個人信貸申請記錄252970條,特征數量61個。這里將每一筆數據中的目標變量“Target”取值為0與1,分別代表借款人正常還款與違約。其中,正常還款數據為207722條,違約數據為45248條,可得其違約率為17.9%。

貸款周期方面,分別為36個月與60個月,占比70.05%、29.95%,分別對應15.88%、20.93%的違約率,由此可見,貸款周期越長,違約發生的可能性就越大。工作年限方面,其數據主要集中在1到10年,各個工作年限的逾期率差異不大,5~7年相對較高,均在7%以上。

如圖3所示,平臺客戶的貸款利率在5%到37%之間;在10%到20%這一區間,各個利率對應的概率密度分布比較均勻,其他區間概率密度較低。從圖3中可看出,違約客戶分布更右偏,其對應的貸款利率水平相對更高。

如圖4所示,借款人的負債率在-3%到40.5%之間;對于違約客戶而言,-3%到20%對應的區間面積要略大于20%到40.5%,說明借款人負債率在-3%到20%之間產生違約行為的概率更高。對于正??蛻?,則情況正好相反,13%到40.5%的區間面積大于-2%到13%,說明當負債比高于13%時,其履約行為隨著負債比的增加而下降。

表2所示為貸款申請人的信用評級信息。其中信用評級A到G的占比分別為16.71%、30.07%、25.82%、16.02%、7.58%、3.03%、0.77%,對應的違約率分別為6.19%、12.51%、19.35%、25.89%、32.62%、38.30%、40.87%。這表明平臺的主要服務對象為信用評級在A-D區間內的人群,而且信用評級越高,貸款違約率越低。

資產狀況反映了借款人的償債能力,與違約率呈負相關關系。在申請貸款的客戶中,無房產客戶與其他客戶人數占樣本量萬分之三左右,但其違約率占比高達27%;擁有房產(包括抵押與自用)的借款人占比60%,其對應的違約率最低,僅占總人數13%,說明無固定資產的借款人違約率較高。在年收入方面,正常客戶年收入均值為74161元,違約客戶為65085元,違約客戶年收入整體偏低。在所有賬戶活期余額方面,正常客戶與違約客戶均值分別為143791元與114454元,說明違約客戶擁有更少的流動資金。

2.數據預處理

由于平臺給予的數據信息不完整,通常含有缺失值或格式不統一等問題,因此需要對數據進行預處理。具體分為缺失值處理、獨熱編碼以及類別平衡等。

(1)缺失值處理。由于XGBoost、LightGBM和CatBoost本身具有自動處理缺失值的能力,所以在數據預處理階段對數值型變量和連續型變量不處理缺失值;而對于類別型變量的缺失值使用“1”填充,同時對缺失值比例大于50%的變量予以刪除;數據集中異常值存量非常少,可以忽略不計,不做異常值處理。

(2)獨熱編碼(OneHotEncoder)獨熱編碼是將字符型的特征轉化為二進制向量,主要用于處理類別型變量(如收入來源是否核實),特征取值之間不存在任何關聯關系。使用獨熱編碼將類別型變量轉化為數值,如將“收入來源是否核實”中的“已核實”“未核實”分別轉換成“1”“2”。如表3所示,將整數值表示為二進制向量,除該整數被表示為“1”外,其余均為“0”。

(3)類別平衡?;ヂ摼W消費金融的信貸業務常常面臨類別不平衡問題。將樣本按7∶3的比例劃分訓練集和測試集,其正負樣本比約為4.6∶1,此時正樣本與負樣本差別過大,即使將所有負樣本的錯誤預判都歸類于正樣本,模型預測準確率也能達到93%,此時的模型不具有實際意義。本文采用代價敏感學習法②,通過設置權重來處理類別不平衡的問題。

3.特征選擇

(1)基于相關系數的特征選擇。相關系數屬于包裹式③特征選擇方法。本文采用相關系數法對特征進行篩選,剔除解釋變量系數小于0.001的特征,總共剔除4個特征(如表4所示),保留特征數57個。

(2)基于Catboost的特征篩選。Catboost是一種嵌入式④特征選擇方法。經過相關系數法篩選特征,剩余特征數57個,數量較多,易發生維數災難或產生過擬合現象。本文根據Catboost可返回抽樣學習的特點,對57個特征作進一步選擇,設定閾值為3%,最終保留46個特征。

(二) 分類效果的評價

為了辨別基于二分類加權硬投票的互聯網消費金融違約預測模型的分類效果是否比其他分類器更優,本文采用四種評價指標進行說明,分別是ROC曲線、AUC值、KS值與準確率,其評價指標均可通過混淆矩陣(如表5所示)計算得出。

ROC曲線稱為受試者工作特征曲線,通過模型得到不同閾值下的分類結果,其橫縱坐標分別用真正率TPR(True Positive)和假正率FPR(False Positive)表示。當TPR越高,FPR越低時,ROC曲線向左上角移動,模型的預測能力越強。AUC表示ROC曲線下方面積,AUC值越大意味著樣本預測排序質量越好。TPR=TP/(TR+FN)" (7)

FPR=FP/(FP+TN) (8)KS值表示TPR曲線與FPR曲線的最大間隔距離,反映了模型區分正負樣本的能力。KS在0到1的范圍內取值。一般而言,當KS值小于0.8時,值越大意味著模型區分正負樣本的能力越強。

準確率(Accuracy)表示被正確預測的正常還款借款人與違約借款人的樣本個數占總樣本的比率,其數值越高代表模型的預測效果越好。Accuracy=(TP+TN)/(TP+FP+TN+FN)(9)(三) 模型預測結果的對比分析

經過對樣本的數據預處理,特征篩選和基于貝葉斯調參的XGBoost-LightGBM-CatBoost模型訓練后,采用訓練好的最優參數XGBoost-LightGBM-CatBoost對測試集進行分類。同時,本文比較了單模型XGBoost、LightGBM、CatBoost在測試集上的分類效果,以上單模型均經過貝葉斯調參達到最優。為保證各單模型分類效果的穩定,所有數據均通過五折交叉驗證并取其平均值。數據實驗的操作環境為Python 3.7,依賴包為pandas、numpy、sklearn、seaborn、datetime、scipy、XGBoost、lightGBM、CatBoost。具體計算結果如表6所示。

圖5為處于最優參數時,測試集與訓練集上XGBoost-LightGBM-CatBoost模型的ROC曲線。

由表6可知,XGBoost-LightGBM-CatBoost融合模型在測試集上的準確率為0.826,AUC值為7.18,KS值為0.320,其指標值均優于其他三個單分類器,說明融合模型具有更好的預測性能。同時,由圖5可知,XGBoost-LightGBM-CatBoost模型其測試集的ROC曲線被訓練集包裹,測試集中AUC的值為0.72,訓練集中AUC的值為0.75,這表明XGBoost-LightGBM-CatBoost模型在貸款申請人的樣本數據中存在輕微過擬合學習問題,可忽略不計。

(四) 結果分析

本文從借款人的基本信息、信貸信息、歷史信用狀況、銀行賬戶信息四個維度出發,分析其所包含的二級指標來判斷違約的影響因素。同時,由表6可知Catboost模型對于大規模、多維度的數據處理比其他兩個分類器更具優勢,因此本文通過Catboost模型對借款人特征進行重要性排序,具體情況如表7所示。

表7列出了各解釋變量對模型的貢獻情況,將位于前十的各解釋變量貢獻度由高到低進行排列,分別為貸款利率、年收入、負債比、公共事業差評紀錄、信貸循環余額、賬戶余額、信用額度、未平倉交易數、循環信用額度占比、貸款金額。貸款利率的貢獻度最大,高達20.3%;年收入與負債比分別貢獻了14%、9%;其中前十個特征貢獻度高達70.7%。

在前十個特征中并未完全體現一級指標的重要性,不能對所歸類的四個維度進行很好的解釋,因此本文通過將一級指標項下的特征所得分進行加總求其算數平均值,獲得一級指標的重要性排序,具體情況如表8所示。

在本文歸類的四個一級指標中,借款人信貸信息占比最高,說明借款人的信貸信息對借款人違約與否影響最大;借款人的基本信息對借款人違約情況的影響最小。由表8可知,四個維度的影響程度由高到低排序為:借貸信息、信用狀況、還款能力、基本信息。

從影響違約因素的解釋變量中可以發現:(1)貸款利率的貢獻度高達20.3%,貸款金額重要性排序占比為3.5%,兩個指標都反映了借款人的信貸信息,其中貸款利率與貸款金額所對應的數值越高,意味著借款人每月需要償還的金額越多,財務壓力的增大將增加違約產生的可能性;(2)年收入、負債率、賬戶活期余額與未平倉交易數累計貢獻率為26.8%,這四類指標在一定程度上反映了借款人的財務狀況,通過對其進行監測來判斷借款人貸款到期時能否按時足額還本付息;(3)公共事業差評記錄、信貸循環余額、信用額度、循環信用額度占比累計貢獻率為20.1%,以上指標反映了第三方機構對借款人的信用評價,在一定程度上體現了借款人的履約意愿。除圖6中出現的十類指標外,其余指標貢獻度均低于3%,因此在對本文建立的借款人違約行為指標進行分析時,貸款利率與貸款金額應作為借款人借貸信息的主要參考指標;年收入、負債率、賬戶活期余額與未平倉交易數應作為借款人還款能力的主要參考指標;公共事業差評記錄、信貸循環余額、信用額度、循環信用額度應作為借款人信用狀況的主要參考指標。

四、 研究結論與建議

通過上述研究,本文得出如下結論:

其一,互聯網消費金融平臺與借款人之間存在高度的信息不對稱,容易出現借款人違約行為;對這個弱信用群體的違約率的預測不能采用傳統方法,要結合互聯網消費金融的特性開發新的違約風險預測方法。

其二,根據互聯網消費金融的運行特征和客戶特性,建立了客戶違約風險指標體系,包括借款人基本信息、借貸信息、信用狀況、還款能力四個一級指標,以及19個二級指標。

其三,XGBoost-LightGBM-CatBoost融合模型對于互聯網消費金融借款人的違約風險預測效果較單模型更好,其精確度更高。

其四,XGBoost-LightGBM-CatBoost融合模型的預測準確率為82.6%,即預測平臺違約率為17.4%,而根據Kaggle網站數據計算得出的實際違約率為17.9%,說明運用XGBoost-LightGBM-CatBoost融合模型構建互聯網消費金融借款人違約預測模型在分類精度、分類準確度上具有一定優勢,對實際結果的擬合效果較好。

其五,本文采用Kaggle數據,歸納了違約風險預測中需要關注的四類特征,通過Catboost模型進行特征篩選,選出權重值高的三類特征中貢獻度排名前十的二級指標,供平臺篩選貸款申請人時參考。

根據以上研究結論,本文就互聯網消費金融平臺加強違約風險管理提出以下建議:

第一,應加強借款人信用信息采集,提高信用評價效率。為避免客戶惡意違約行為,互聯網消費金融平臺可以設置客戶群體畫像,首先依據客戶基本信息進行初步分層與評級,對老人、未成年人、低學歷者普及消費金融及相關產品知識,說明其優點與潛在的風險;對風險偏好型客戶進行重點跟蹤監測,提示客戶該行為潛在的風險和負擔的后果;利用人工智能模型搜集客戶的消費習慣和社交區域,將客戶的借款意愿與還款意愿進行量化并及時反饋,平臺根據分析結果對信用數據良好的客戶給予消費優惠,對信用狀況差的客戶進行消費限制。

第二,應通過與消費場景第三方的結合,獲得更多的客戶信息。消費金融公司可以基于個人消費者的客戶信息作為聚合的消費場景,根據各類消費場景進行差異化定價,并對消費場景進行細分,深化消費場景建設,然后從中找到合適的消費場景切入消費金融業務中。同時,在已有的服務場景中,通過深度挖掘推出更多的子場景或延伸場景。

第三,應加強互聯網消費金融平臺風險控制能力建設。充分運用以大數據、云計算、人工智能和區塊鏈等為代表的金融科技手段,建立互聯網消費信貸貸前識別與反欺詐、貸中追蹤與預警、貸后智能催收的全信貸周期智能風控系統,以提升互聯網消費金融平臺的信用風險精細化管理水平。以數據共享為風控導向,以深度學習為代表的機器學習技術為驅動,創新互聯網消費金融業務和風控模式,設計高度適配的信用風險評估模型,增強對平臺信用風險的預見性,有效緩解平臺的逆向選擇和道德風險。

注釋:

①加性回歸模型是指通過采用加法模型(即基函數的線性組合),以及不斷減小訓練過程產生的殘差來達到將數據分類或者回歸的算法。

②代入敏感學習法是機器學習領域中的一種新方法,它主要考慮了在分類中,當不同的分類錯誤會導致不同的懲罰力度時如何訓練分類器。

③包裹式特征選擇方法是從原始特征集中不斷選擇特征子集、訓練模型,并通過學習器對特征子集進行評價,選出最終訓練子集。

④嵌入式特征選擇將特征選擇融合在模型訓練的過程中,依據模型表現分析特征重要性,在訓練過程中自動完成特征選擇。

[參考文獻]

[1] 林慰曾,施心德.互聯網消費金融:信用錯配、修復與完善[J].南方金融,2018(6):73-81.

[2]岳森.我國互聯網金融風險監管及治理體系建設研究[J].技術經濟與管理研究,2019(8):91-95.

[3]張茂軍,王儉,張尹,張鄴丹.金融科技、監管政策與P2P平臺風險:基于信用風險和流動性風險視角[J].金融與經濟,2021(8):38-45.

[4]Chiang SL,Tsai MS,Jiang S.The Influences of Foreclosure Factors on the Value,Yield,Duration and Convexity of a Mortgage[J].Real Estate Economics,2021,2(49):361-394.

[5]Lee,Sang Min.Determining Personal Credit Rating through Voice Analysis:Case of P2P loan borrowers[J].KSII Transactions on Internet and Information Systems,2021,15(10):3627-3641.

[6]Sangwan S,Nayak NC,Harshita,Sangwan V.Borrowers’ credit Risk Factors,Perception Towards Repayment Interventions and Moral Hazard in Loan Delinquency:An Investigation of Indian Microfinance Institutions[J].Applied Economics,2021,53(56):6554-6569.

[7]周永圣,孫苗苗,王晶.互聯網消費金融債權信用研究:基于螞蟻花唄業務模式的分析[J].價格理論與實踐,2019(3):126-129.

[8]王正位,周從意,廖理,張偉強.消費行為在個人信用風險識別中的信息含量研究[J].經濟研究,2020 (1):149-163.

[9]Carlos Eduardo Canfield.Determinants of Default in P2P Lending:the Mexican Case[J].Independent Journal of Management amp; Production,2018,9(1):1-24.

[10]Oded Netzer,Alain Lemaire,Michal Herzenstein.When Words Sweat:Identifying Signals for Loan Default in the Text of Loan Applications[J].Journal of Marketing Research,2019, 56(6):960-980.

[11]Frydman H,Matuszyk A,Li C,Zhu WC.A New Framework for Examining Credit worthiness of Borrowers:the Mover-Star Model with Covariate and Macroeconomic Effects[J].Quantitative Finance,2021,21(9):1491-1499.

[12]李汛,龍真,付懷宇,劉品璐.基于機器學習的P2P違約預測算法比較:以“人人貸”為例[J].統計與管理,2019(6):104-109.

[13]馬曉君,宋嫣琦,常百舒,袁銘憶,蘇衡.基于CatBoost算法的P2P違約預測模型應用研究[J].統計與信息論壇,2020 (7):9-17.

[14]杜梅慧,李莉莉,張璇.基于兩步子抽樣算法的P2P信用風險預測研究[J].系統科學與數學,2021 (2):566-576.

[15]Cowden C,Fabozzi FJ,Nazemi A.Default Prediction of Commercial Real Estate Properties Using Machine Learning Techniques[J].Journal of Portfolio Management,2019,45(7):55-67.

[16]KHAN Usama Ehsan,IQBAL Javed.The Relationship between Default Risk and Asset Pricing:Empirical Evidence from Pakistan[J].The Journal of Asian Finance,2021,8(3):717-729.

[17]封思賢,那晉領.P2P借款人的定價偏差與被動違約風險:基于“人人貸”數據的分析[J].金融研究,2020(03):134-151.

(責任編輯文格)

Default Risk Prediction of Internet Consumer Finance Based

on Weighted Hard Voting Fusion Model

SI Xiao-han, WEI Jian-guo, WEI Ying-jie

(School of Economics,Wuhan University of Technology,Wuhan 430070,Hubei,China)

Abstract:This paper first analyzes the characteristics ofInternet consumer finance default risk,studies the formation mechanism of Internet consumer finance borrower default risk by using information economics,and constructs the Borrower Credit Risk Evaluation Index System and two-class weighted hard voting fusion model.This model is composed of Xgboost,LightGBM and CatBoost to predict the default risk of borrowers.It is found that the fusion model is superior to the single model XGBoost,LightGBM and CatBoost in prediction accuracy,and that the key factors affecting the borrower’s default mainly include loan interest rate,annual income,bad rating record of public utilities,revolving credit balance and so on.Finally,the paper puts forward some suggestions on how to strengthen default risk management of internet consumer finance platform.

Key words:Internet consumer finance; binary weighted hard voting; the risk of default

主站蜘蛛池模板: 99久久精品免费视频| 免费高清自慰一区二区三区| 夜精品a一区二区三区| 亚洲成人精品在线| 亚洲一区二区三区国产精华液| 日韩无码视频播放| 国产欧美视频在线观看| 偷拍久久网| 在线中文字幕日韩| 精久久久久无码区中文字幕| 亚洲精品无码日韩国产不卡| 国产人成乱码视频免费观看| 无码免费的亚洲视频| 91精品国产自产在线观看| 91蝌蚪视频在线观看| 欧美成人影院亚洲综合图| 国产成人亚洲无吗淙合青草| 色综合久久综合网| 大陆精大陆国产国语精品1024| 日本精品αv中文字幕| 99视频免费观看| 欧美成人一区午夜福利在线| 国产浮力第一页永久地址| 亚洲国产系列| 国产毛片基地| 亚洲第一成年免费网站| 伊人激情久久综合中文字幕| 欧美性猛交一区二区三区| 美女被狂躁www在线观看| 一区二区三区国产| 色偷偷一区二区三区| 免费jjzz在在线播放国产| 色综合a怡红院怡红院首页| 欧美成人国产| 亚洲欧美综合另类图片小说区| 亚洲国产理论片在线播放| 青青草原国产| 国产在线小视频| 2021亚洲精品不卡a| 99视频只有精品| 国产欧美高清| 999国产精品永久免费视频精品久久| 色悠久久久久久久综合网伊人| 亚洲精品无码高潮喷水A| 免费在线a视频| 毛片网站在线看| 亚洲高清免费在线观看| 免费看黄片一区二区三区| 久久综合丝袜日本网| 国产成人精品第一区二区| 日韩精品成人网页视频在线| 久久国产精品夜色| 亚洲男人的天堂在线观看| 欧美色综合久久| 国产网站一区二区三区| 无码中文字幕乱码免费2| a级毛片免费在线观看| 中文一级毛片| 午夜视频日本| 欧美成人区| 538国产在线| 国产亚洲精久久久久久久91| 日本人又色又爽的视频| 污网站免费在线观看| 久久综合亚洲色一区二区三区 | 日韩精品高清自在线| 亚洲成a人片77777在线播放| 亚洲经典在线中文字幕| 一级福利视频| 青青草原国产一区二区| AV无码无在线观看免费| V一区无码内射国产| 亚洲熟女偷拍| 国产精品视频a| 视频二区欧美| 亚洲精品无码av中文字幕| 99尹人香蕉国产免费天天拍| 91精品人妻互换| 国产色伊人| 亚洲成网777777国产精品| 国产91精品最新在线播放| 国产91丝袜在线播放动漫 |