999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LightGBM算法的信用風(fēng)險(xiǎn)評(píng)估模型研究

2019-12-04 01:47:08王思宇陳建平
軟件導(dǎo)刊 2019年10期

王思宇 陳建平

摘要:對(duì)于銀行、P2P等金融機(jī)構(gòu)而言,如何在擴(kuò)大業(yè)務(wù)規(guī)模的同時(shí),有效控制并合理防范信用風(fēng)險(xiǎn)尤為重要。基于LightGBM算法,根據(jù)借款申請(qǐng)人提供的相關(guān)個(gè)人信息,建立分類預(yù)測(cè)模型,對(duì)借款人是否會(huì)逾期、是否該發(fā)放貸款進(jìn)行預(yù)測(cè)研究。實(shí)驗(yàn)結(jié)果表明,相較于普通決策樹算法,LightGBM預(yù)測(cè)精度提升了40.8%,且具有較好的魯棒性,可滿足信用評(píng)估要求。基于LightGBM的信用評(píng)估模型不僅擁有更快的訓(xùn)練速度和更高的訓(xùn)練效率,同時(shí)還占用更少的內(nèi)存,具有支持?jǐn)?shù)據(jù)并行處理能力。利用該模型可對(duì)用戶信用風(fēng)險(xiǎn)進(jìn)行較為準(zhǔn)確的預(yù)測(cè),對(duì)貸款機(jī)構(gòu)風(fēng)險(xiǎn)管理有重要參考價(jià)值。

關(guān)鍵詞:信用風(fēng)險(xiǎn);LightGBM;分類預(yù)測(cè)

DOI:10.11907/rjdk.191157開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

中圖分類號(hào):TP301文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2019)010-0019-04

0引言

近年來(lái),我國(guó)經(jīng)濟(jì)一直保持高速發(fā)展,居民的信貸意識(shí)日益提高,個(gè)人信貸業(yè)務(wù)也獲得蓬勃發(fā)展,在金融信貸機(jī)構(gòu)貸款業(yè)務(wù)中的占比持續(xù)增多。然而,品類繁多的信貸業(yè)務(wù)在為人們提供便利的同時(shí),其潛在風(fēng)險(xiǎn)也不容忽視。每年由于資金鏈斷裂、違約、騙貸等因素導(dǎo)致停業(yè)的金融信貸機(jī)構(gòu)就有上千家。由此可見,信用風(fēng)險(xiǎn)評(píng)估對(duì)金融信貸機(jī)構(gòu)的平穩(wěn)運(yùn)行具有重要意義。

隨著大數(shù)據(jù)時(shí)代的來(lái)臨,信用風(fēng)險(xiǎn)評(píng)估理論及方法不斷涌現(xiàn)。劉錚錚、康為勛運(yùn)用層次分析法對(duì)企業(yè)信用評(píng)級(jí)進(jìn)行研究;李昕、蔣志旺基于BP神經(jīng)網(wǎng)絡(luò)研究信用風(fēng)險(xiǎn)預(yù)測(cè)模型;孫同陽(yáng)、王雅靜則認(rèn)為利用決策樹方法進(jìn)行信用評(píng)估預(yù)測(cè)更為有效;Chen等通過樸素貝葉斯對(duì)申請(qǐng)人進(jìn)行信用評(píng)級(jí);Bellotti等提出借款人違約的離散時(shí)間生存模型,通過模擬極端經(jīng)濟(jì)條件,展示了如何使用該模型對(duì)申請(qǐng)人進(jìn)行測(cè)試。上述方法都是基于傳統(tǒng)評(píng)估指標(biāo),結(jié)合機(jī)器學(xué)習(xí)知識(shí)構(gòu)建的評(píng)估方法,仍存在一定的局限性,例如人工神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí),若訓(xùn)練次數(shù)不足則會(huì)過擬合,同時(shí)算法本身的收斂速度較慢,時(shí)常會(huì)陷入局部最優(yōu)解。因此,選擇一種精度高、運(yùn)算速度快、不易過擬合的算法做評(píng)估模型尤為必要。

LiChtGBM算法具有速度快、效率高、占用資源少、支持并行處理等優(yōu)點(diǎn)。本文選用基于LightGBM的梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)算法,以某金融信貸機(jī)構(gòu)經(jīng)過脫敏處理后的數(shù)據(jù)為基礎(chǔ),探索不同類別數(shù)據(jù)中的隱藏聯(lián)系,從而建立一個(gè)更為準(zhǔn)確的信用評(píng)估模型。如此既能減少人為因素導(dǎo)致的主觀性和盲目性,又能減輕因個(gè)別數(shù)據(jù)缺失對(duì)評(píng)估結(jié)果造成的影響,從而促進(jìn)個(gè)人信貸業(yè)務(wù)快速、安全發(fā)展。

1理論基礎(chǔ)

梯度提升決策樹(Gradient Boosting Decision 7ree,GB-DT)是一種迭代決策樹算法。該算法采用最速下降法,把損失函數(shù)的負(fù)梯度在當(dāng)前的值當(dāng)作殘差的近似值,然后利用殘差近似值擬合出一個(gè)回歸樹。該算法在決策過程中生成另外的決策樹,最后將所有樹的運(yùn)行結(jié)果進(jìn)行累加得出最終結(jié)果。

GBDT算法在訓(xùn)練時(shí),要對(duì)樣本進(jìn)行多次遍歷。若要減少訓(xùn)練耗時(shí),需將訓(xùn)練數(shù)據(jù)全部加載到內(nèi)存中,這樣每次輸入的樣本數(shù)量就會(huì)受到限制,不能超過內(nèi)存容量。如果將樣本載人外存儲(chǔ)器中,應(yīng)采用決策樹算法,在I/O頻繁時(shí),速度又會(huì)相應(yīng)降低。LightGBM則可以很好地改善上述情況。

1.1LightGBM

LiChtGBM(LiCbt Gradient Boosting Machine)是一個(gè)基于決策樹算法的提升框架,其優(yōu)點(diǎn)是訓(xùn)練速度快、準(zhǔn)確率高、內(nèi)存占用率低且支持并行計(jì)算,能夠處理規(guī)模龐大的數(shù)據(jù)集。

LiRhtGBM的特點(diǎn)之一是采用基于Histogram的決策樹算法,它首先將連續(xù)型的特征值離散成k個(gè)值,然后生成一個(gè)寬為k的直方圖。當(dāng)遍歷樣本時(shí),將經(jīng)過離散的值當(dāng)作索引。在經(jīng)過一次遍歷后,直方圖累積了需要的統(tǒng)計(jì)量,然后通過直方圖的離散值,遍歷尋找最優(yōu)分割點(diǎn)。采用這種方式既能顯著降低內(nèi)存占用,又可降低時(shí)間復(fù)雜度。

LightGBM的另一個(gè)特點(diǎn)是采用效率更高的葉子生長(zhǎng)策略,即帶深度限制的葉子生長(zhǎng)策略(Lear-wise)。該策略在分裂前會(huì)首先遍歷樹中全部葉子,接著找到分裂增益最大的葉子進(jìn)行再分裂,并重復(fù)這一操作。實(shí)驗(yàn)證明,同樣分裂次數(shù)下,Leaf-wise可以得到更高的精度,并在Leaf-wise中加入了防止過擬合的最大深度限制。Leaf-wise葉子生長(zhǎng)策略如圖1所示,其中白點(diǎn)和黑點(diǎn)分別代表分裂增益最大和非最大的葉子。

LightGBM的一大優(yōu)點(diǎn)是Histogram作差加速。一般而言,構(gòu)造一個(gè)葉子直方圖,父節(jié)點(diǎn)和兄弟節(jié)點(diǎn)直方圖的寬度都為K,因此作差過程只需計(jì)算K次,從而提高了運(yùn)行速度。

1.2改進(jìn)后的GBDT算法流程

2實(shí)證分析

本文基于某金融信貸機(jī)構(gòu)的數(shù)據(jù)集進(jìn)行實(shí)證研究,并與其它常見分類算法作對(duì)比分析。

2.1數(shù)據(jù)描述與預(yù)處理

該數(shù)據(jù)集共有約30萬(wàn)條個(gè)人信貸記錄,每一條信貸記錄都包含顧客個(gè)人情況屬性變量和顧客“好”、“壞”標(biāo)簽變量。“好”顧客的定義為按時(shí)還款,用標(biāo)簽0代替;“壞”顧客的定義則是沒有按時(shí)還款,用標(biāo)簽1代替。個(gè)人情況屬性變量包含了有關(guān)顧客社會(huì)人口、個(gè)人金融、債權(quán)人財(cái)產(chǎn)和貸款明細(xì)4個(gè)方面的共121項(xiàng)指標(biāo),其數(shù)據(jù)集格式如表1所示。

由表2可知,與邏輯回歸、決策樹、樸素貝葉斯、隨機(jī)森林、集成樹、XGBT等算法相比較,LightGBM的ROC_AUC得分最高,相較于普通決策樹算法提升了40.8%,準(zhǔn)確率也在70%以上,且具有較好的魯棒性,可滿足信用評(píng)估要求。

模型輸出結(jié)果如表3所示,信貸機(jī)構(gòu)可根據(jù)用戶得分,劃分不同的區(qū)間,并為每個(gè)區(qū)間制定相應(yīng)的評(píng)判等級(jí),例如“優(yōu)秀”、“良好”、“一般”、“較差”等。

3結(jié)語(yǔ)

本文利用互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行個(gè)人信用風(fēng)險(xiǎn)評(píng)估研究與實(shí)現(xiàn)。對(duì)比分析不同算法模型表現(xiàn),提出了基于LightGBM算法的信用風(fēng)險(xiǎn)評(píng)估模型。相較于其它主流算法模型,LightGBM算法擁有速度快、效率高、占用內(nèi)存少及并行計(jì)算等優(yōu)點(diǎn),而金融借貸平臺(tái)的數(shù)據(jù)集往往具有指標(biāo)多、噪聲復(fù)雜等特點(diǎn),使用基于LightGBM算法的評(píng)估模型,對(duì)實(shí)際應(yīng)用具有重要參考價(jià)值。

本文不足之處在于數(shù)據(jù)涵蓋范圍具有一定局限性,相較于類型繁多的信用數(shù)據(jù)集僅是冰山一角;并且,雖然基于LightGBM算法的信用風(fēng)險(xiǎn)評(píng)估模型在分類預(yù)測(cè)效果上有一定提升,但準(zhǔn)確率及精度還有進(jìn)一步提升的空間,可考慮將LightGBM與其它算法融合,使模型有更好的表現(xiàn)。

主站蜘蛛池模板: 免费不卡在线观看av| 国产精品女主播| 伊人久久久久久久| 成人综合久久综合| 免费国产不卡午夜福在线观看| 波多野结衣的av一区二区三区| AV色爱天堂网| 白浆免费视频国产精品视频 | 欧美一级在线播放| 狠狠躁天天躁夜夜躁婷婷| 国产综合亚洲欧洲区精品无码| 国产成人精品日本亚洲| 亚洲欧洲综合| 国产性猛交XXXX免费看| 欧美一级色视频| 婷婷午夜影院| AV在线天堂进入| 久久久久久尹人网香蕉 | 最新日韩AV网址在线观看| 成人福利在线视频免费观看| 国产精品永久不卡免费视频| 欧美日韩亚洲综合在线观看| 国产一级在线观看www色 | 国产综合精品一区二区| 精品久久久久成人码免费动漫| 国产精品无码AV中文| 99久久无色码中文字幕| 国产美女精品一区二区| 波多野结衣AV无码久久一区| 欧美无遮挡国产欧美另类| 99久久性生片| 在线国产毛片手机小视频| 久操线在视频在线观看| 日韩无码白| 国产经典在线观看一区| 欧美精品1区| 久久综合色天堂av| 伊人久久青草青青综合| 国产精品区视频中文字幕| 亚洲综合狠狠| 精品视频第一页| 一级毛片免费不卡在线 | 伊人五月丁香综合AⅤ| 欧美日韩精品综合在线一区| 精品国产aⅴ一区二区三区| 2021最新国产精品网站| 久热99这里只有精品视频6| 成人一级黄色毛片| 国产精品一线天| 免费播放毛片| 国产视频久久久久| 国产日韩精品欧美一区喷| 久久国产高潮流白浆免费观看| 亚洲欧美一级一级a| 免费全部高H视频无码无遮掩| 国产成人盗摄精品| 小说区 亚洲 自拍 另类| 亚洲国产成人在线| 在线看片中文字幕| 成人午夜福利视频| 2022国产91精品久久久久久| 国产精品美女网站| 亚洲精品国产成人7777| 最新午夜男女福利片视频| www.亚洲色图.com| 国产精品观看视频免费完整版| 成人福利在线免费观看| 强奷白丝美女在线观看| 欧美精品啪啪| a天堂视频| 2020国产精品视频| 2020国产在线视精品在| 爱爱影院18禁免费| 亚洲永久色| 欧美一级夜夜爽| 国产人成在线视频| 免费无码又爽又黄又刺激网站| 亚洲成人在线网| 国产一级裸网站| 伊人激情综合| 成人午夜视频免费看欧美| 亚洲人成亚洲精品|