999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的信貸逾期檢測模型研究*

2021-07-10 02:20:44侯浩鑫趙志紅
科技與創新 2021年12期
關鍵詞:特征檢測模型

侯浩鑫,趙志紅

(北京理工大學珠海學院,廣東 珠海 519088)

1 引言

隨著互聯網金融行業的興起,銀行和貸款機構通過互聯網為有貸款需求的客戶提供線上金融服務。在帶來更好服務體驗的同時,也存在著諸多信用風險問題,急需建立信貸風險檢測模型提高風控水平。根據信貸客戶還款的具體情況,將客戶分為正常和逾期兩種類型。以三個月的時間作為觀察窗口,還款連續逾期三個月的,判定為逾期客戶;其余正常還款情況的,為正常客戶。通過采用機器學習和統計方法得出的信用檢測模型,能夠較為準確地預測個人未來的信用表現,估計每筆信貸是否逾期,方便銀行提前預知可能存在的風險。

現代治理理論與實踐表明,多元主體的有效協作配合,是推進國家治理現代化的有效路徑。在一定意義上可以說,社會組織發展與治理現代化之間的關系,是檢驗國家治理現代化深度、廣度、力度和效力的重要標志。

2 數據預處理

分析來自某貸款機構的歷史業務數據,包含貸款基本表、報告主表、貸款記錄、貸記卡記錄、信用提示、未銷戶貸記卡和未結清貸款信息匯總、逾期信息匯總、查詢記錄匯總、信貸審批查詢記錄明細、貸款特殊交易、透支記錄、詐騙記錄等12個數據集,涉及3萬名客戶和100多個特征,數據預處理較復雜,需盡量減少信息損失。

為了獲得更好的訓練數據特征,通過特征工程將原始數據轉換成模型訓練數據,使得機器學習模型逼近這個上限,提高模型性能。主要運用了特征構建和特征選擇。例如針對“數據集:信貸審批查詢記錄明細表”,利用日期函數計算查詢間隔月份數,通過總查詢次數除以查詢間隔月份數構建出新屬性“月查詢次數”。

通訊模塊電路中S1為撥碼開關,當碼位為00時為固定周期傳輸,即每隔2 min采集一次數據并傳輸。當碼位選擇01時為變周期數據傳輸。微控制器檢測當前周期環境數據后,與上一周期數據進行對比,如果差值小于設定閥值,則當前周期不發送數據。如果超過設定閥值,則將變化的參數發送到路由節點。上位機如果未收到本周期某一節點數據,則默認當前周期該節點環境參數未有大的改變,使用上一周期檢測值為本周期環境參數值,減少數據傳輸過程中的能耗。檢測器器變周期數據傳輸機制工作流程圖如圖5所示。

通過特征分箱離散化連續變量,同時將離散變量合并成少狀態。經特征分箱后的數據,具有更易于模型快速迭代和降低模型過擬合風險等優勢。

四種模型的AUC值均低于0.8,預測準確性不是很高,離想要檢測逾期客戶的目標還有一定差距。其中表現較好的模型為邏輯斯蒂和BP神經網絡,AUC值為0.71。

表1 特征選擇結果

基于“smbinning”包對各特征進行最優分段,通過分段結果對數據進行封閉性分箱和轉換,如特征“信用使用年限”的分段結果如表4所示。

表2 訓練集和測試集數據概況

3 初步建立逾期檢測模型

將“xgboost”函數的目標設為邏輯斯蒂模型,由于邏輯斯蒂為廣義線性模型,表達能力有限,而特征分箱后每個變量有了權重,即引入了非線性到模型中,顯著提升了模型的表達能力和擬合效果。

表3 四種模型結果對比

在彈體打擊巖石條件下,彈靶間形成應力波并向地下傳播,在沖擊波或接近于沖擊波的短應力波中,巖石介質壓縮行為是在受限條件下發生的[7],從物理力學本質上講,巖石介質的變形狀態可以用剛性壁圓筒中的單軸壓縮描述。設沿圓筒的軸向應力σr為垂直于彈靶接觸面的法向應力;沿圓筒的徑向應力σθ為平行于彈靶接觸面的切向應力。由于應變僅發生在軸向,因此,這時,體積應變ε約等于軸向應變εr,徑向應變εθ約為0。

隨著全球信息技術主導的技術革命不斷加快,人類社會正在逐漸步入信息社會。隨著信息化、大數據等技術不斷深入,在信息化時代背景和思維模式下,建立固定資產信息化管理平臺對高校固定資產進行管理,不斷提高固定資產管理效率,深入優化固定資產管理手段,是高校固定資產管理的發展目標和趨勢。

4 特征分箱

例如針對“數據集:貸款記錄”,由ID將貸款狀態拆分成“呆賬、結清和正常”三類屬性的數據。最終從100多個指標中初步構建了42個特征。接著,利用R語言“informationvalue”函數計算各定性指標的IV值,選擇有高預測性能的前兩個顯著特征“工資”和“教育”;再通過廣義交叉驗證法得到10個顯著性指標,主要包括信用狀況、償還歷史和逾期行為3個維度的指標,結合Boruta算法得出變量對逾期狀態影響的顯著性,根據變量間相關性圖和現實意義,篩選出“信用使用年限”和“貸款賬戶數”;最終,經過定性指標和定量指標的篩選,從42個初選特征中選擇了重要程度前14的特征。特征選擇結果如表1所示。

(3) 采用場變量法模擬漿液初凝及硬化過程:①漿液注漿階段,認為其有內壓,其彈性模量取1 MPa;②漿液硬化階段,經過10 h 漿液凝固后,其彈性模量取50 MPa[5]。

處理完缺失值后,采用無放回隨機抽樣方式,將總體以7∶3的比例拆分成訓練集和測試集,數據基本情況如表2所示。

表4 “信用使用年限”分段結果

5 逾期檢測模型探索和優化

5.1 基于XGBoost的集成學習模型

前面幾種機器學習模型的預測精度相對不高,嘗試基于XGBoost算法的集成學習模型以提高預測模型的精度。同時,將分別對原數據和特征分箱變換后的數據進行預測,以觀察特征分箱是否提升了模型的表達能力和擬合度。XGBoost模型結果如表5所示。

表5 XGBoost模型結果

通過R語言“xgboost”函數建立模型,經參數調試后對原數據進行預測,得到預測準確率為84.5%,召回率為37%,AUC值為0.72。

對特征分箱后數據進行預測,預測準確率為91.2%,召回率為52.7%,AUC值為0.82。

分別通過“gbm”函數建立決策樹逾期檢測模型(GBDT)、“glm”函數建立邏輯斯蒂回歸模型,并通過逐步回歸剔除非顯著變量、“nnet”包所得BP神經網絡模型、“randomForest”函數建立隨機森林逾期檢測模型,結果如表3所示。

5.2 基于CooK距離的多元模型

通過統計學方法分析得到離群點,觀察離群點與逾期客戶是否有顯著的關系。一般如果觀測樣本的Cook距離比平均距離大4倍,則該數據點被判定為離群點。通過Cook平均距離的4和24倍分別進行離群值檢測,其中顯著離群點和全部離群點如圖1所示。

圖1 異常值檢測

經匹配樣本號發現,基于Cook距離的多元模型檢測法所得出的離群點基本為逾期客戶,該模型表現出了較高的檢測準確率和召回率。當Cook距離為4倍時,99.3%的逾期客戶被檢測出來,而此時模型的準確率仍非常高,為96.7%。具體如表6所示。

表6 基于Cook距離的多元模型

6 結論

進行分析的目的是檢測出可能存在逾期行為的客戶,基于這個業務背景,主要從模型的準確率、召回率和AUC值來評價模型的優劣。

四種機器學習模型的AUC值均低于0.8,預測準確性不是很高。模型優化上,通過XGBoost集成學習模型對原數據和分箱后數據分別建立模型,AUC分別提高到0.72和0.82,說明集成學習模型和特征分箱均有優勢,且經特征分箱后的XGBoost模型預測準確率達到91.2%,召回率達到51.7%,模型有很好的預測效果。

模型探索上,由于逾期客戶均在數據的某些特征取值上較為極端,故通過統計學方法,基于Cook距離的多元模型檢測出來的離群點,與逾期客戶有著顯著的關系。當Cook距離為4倍時,99.3%的逾期客戶被檢測出來,而此時模型的準確率仍非常高,為96.7%,該模型表現出了非常高的分類效果。

猜你喜歡
特征檢測模型
一半模型
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
主站蜘蛛池模板: 97超碰精品成人国产| 国产亚洲欧美另类一区二区| 免费午夜无码18禁无码影院| 无码啪啪精品天堂浪潮av| 999精品在线视频| 鲁鲁鲁爽爽爽在线视频观看| 精品国产成人av免费| 美女高潮全身流白浆福利区| 国产三级韩国三级理| 国产区福利小视频在线观看尤物| 国产精品蜜芽在线观看| 国产欧美又粗又猛又爽老| 在线观看国产一区二区三区99| 国产剧情无码视频在线观看| 美女国产在线| 国产精品久久久久久久久久98| 亚洲午夜片| 国产人免费人成免费视频| 国产久草视频| 国产男女免费视频| 国产jizzjizz视频| 园内精品自拍视频在线播放| 激情五月婷婷综合网| 男女男精品视频| 极品国产在线| 四虎永久在线| av在线5g无码天天| 国产爽歪歪免费视频在线观看| 亚欧美国产综合| 国产第四页| 国产情精品嫩草影院88av| 亚洲欧洲AV一区二区三区| 特级毛片免费视频| 亚洲日本中文字幕乱码中文| 国产精品流白浆在线观看| 黄色片中文字幕| 亚洲三级色| 国产无码在线调教| 天天综合天天综合| 91啪在线| 亚洲欧美日韩高清综合678| 亚洲欧洲天堂色AV| 最新加勒比隔壁人妻| 亚洲国产成人精品一二区 | 久久久久久尹人网香蕉| 亚洲一区第一页| 92午夜福利影院一区二区三区| 欧美天堂在线| 亚洲国产欧美自拍| 欧美午夜视频| 亚洲国产精品国自产拍A| 激情爆乳一区二区| 国产精品女人呻吟在线观看| 亚洲日韩精品欧美中文字幕| 日韩AV无码免费一二三区| 91在线免费公开视频| 国产无码性爱一区二区三区| 伊人成人在线视频| 欧美综合中文字幕久久| 极品性荡少妇一区二区色欲 | 亚洲乱码在线播放| 九九热精品视频在线| 国产一区三区二区中文在线| 在线综合亚洲欧美网站| 91探花国产综合在线精品| 狼友视频一区二区三区| 久久中文字幕不卡一二区| 一区二区三区四区日韩| 香蕉综合在线视频91| 亚洲欧美日韩另类在线一| 欧美一区二区福利视频| 亚洲欧美在线综合图区| 亚洲精品国产成人7777| 亚洲视频免费在线| 欧美日韩精品一区二区在线线| 日本精品视频| 国产精品视频a| 精品国产电影久久九九| 久久综合一个色综合网| 91蜜芽尤物福利在线观看| 精品国产Av电影无码久久久| 亚洲中文字幕精品|