999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關于金融機構個人貸款的需求預測

2020-09-10 10:37:28陳方圓
商業(yè)2.0-市場與監(jiān)管 2020年2期
關鍵詞:互聯(lián)網(wǎng)金融大數(shù)據(jù)

摘要:金融機構小額信用貸款產(chǎn)品是個人金融業(yè)務的一種,以其方便、快捷的特性深受用戶喜愛。該產(chǎn)品通過預審批機制為用戶提供特定額度的貸款服務,金融機構除了要評估用戶的風險之外,還需要預測用戶的借款需求,以此來準備合適的額度,降低資金占用成本,同時提升用戶使用體驗。本文借助于大數(shù)據(jù)的專業(yè)技術手段,通過引入一些數(shù)據(jù)挖掘算法,嘗試對用戶的信貸需求進行準確的預測,旨在用互聯(lián)網(wǎng)金融的思路為上述問題提供理性地判斷和一種科學解決方案。

關鍵詞:個人貸款;信用貸款;互聯(lián)網(wǎng)金融;大數(shù)據(jù);線性回歸;GBDT

1.研究背景

近年來,針對個人用戶的小額信用貸款已成為一項成熟的業(yè)務,目前發(fā)展勢頭良好。此類業(yè)務多通過手機客戶端來進行操作,一些金融機構,如銀行、互聯(lián)網(wǎng)金融機構利用個人用戶預留的基本信息和一些歷史信息等來對用戶的個人征信及貸款額度進行評估,自動生成貸款方案,多數(shù)情況下不需要人為介入。此項業(yè)務由于辦理快捷、流程簡單,深受廣大用戶特別是年輕用戶的青睞。其業(yè)務規(guī)模不斷擴大,同時競爭亦日益加深。

“某借”是某金融機構旗下的一款小額信用貸款產(chǎn)品,該產(chǎn)品使用起來簡單、快捷,申請人只需要經(jīng)過少量的操作即可進行在線貸款申請。在開展這類信貸業(yè)務的時候,除了要評估用戶的信貸風險之外,還需要預測用戶的借款需求。只有盡可能的給有借款需求的用戶分配合適的額度,才能最大限度的增加資金利用率,降低成本并增加收益。精準的對目標客戶進行匹配,預測用戶的信貸需求是此類產(chǎn)品運營的核心問題之一。

本文將通過對“某借”中用戶的基本信息和歷史操作等信息進行整合,運用線性回歸、決策樹、提升算法等數(shù)據(jù)挖掘方法,建立有效的模型,對未來一個月內(nèi)該平臺用戶的借款總金額進行預測,并將預測結(jié)果同真實值進行比較,確定模型的效果。

2.數(shù)據(jù)描述及特征建立

本文的目的是基于可獲取的客戶信息,如基本信息、歷史信息等,來對未來短時間內(nèi)不確定的需求進行預測。本文的數(shù)據(jù)從某金融平臺獲取,包含用戶的基本信息和部分其他信息。本文的目的是預測下個月每個用戶的借款總額,由于目標是數(shù)量型特征,使用均方誤差(MSE)作為模型效果的評估標準。通過對數(shù)據(jù)的整理,構建了如表1所示的特征。其中用戶ID和次月借款合計不參與模型構建,用戶ID僅用于標識客戶,次月借款合計用于評估模型效果。

3.利用線性回歸構建模型

在本文中,因變量為次月借款合計,由于因變量為數(shù)量型特征,可以考慮從較為簡單的回歸模型入手。線性回歸模型是一種基礎的統(tǒng)計模型,模型要求數(shù)據(jù)必須滿足基本假設,即因變量符合正態(tài)性、等方差性及獨立性。另外線性回歸模型受異常值和多重共線性影響較大,建模之前需要先去掉異常值點及多重共線性變量。

經(jīng)檢查,數(shù)據(jù)基本符合正態(tài)分布鐘形曲線的形狀,可使嘗試使用線性回歸模型進行分析。直接將特征數(shù)據(jù)帶入逐步線性回歸模型。第一次回歸后,去掉性別特征后AIC下降最多,因此去掉該特征繼續(xù)計算回歸系數(shù)。同理依次去掉歷史借款中值、年齡段2項特征,待AIC不再下降時,得到最終的回歸方程。

在結(jié)果中,回歸系數(shù)基本都通過了檢驗,總體p值接近于0,模型效果尚可。其中初始額度、歷史借款合計、歷史消費合計和頁面點擊次數(shù)對因變量是正相關的,其余特征都為負相關。對此的理解是直觀的,用戶的額度越高、歷史借款量越大、歷史消費越多、相關頁面瀏覽次數(shù)越多,可能發(fā)生的借款金額就會越大。

接下來對線性回歸模型的基本假設做一些分析,如圖1所示。數(shù)據(jù)中的異常點幾乎緊靠數(shù)據(jù)的主體部分,因此可以認為這些只是數(shù)據(jù)中的一些極端數(shù)值,并未達到異常的水平。可以看出模型的殘差有一個明顯的旋轉(zhuǎn),若無旋轉(zhuǎn),殘差是基本滿足正態(tài)性、同方差性和獨立性的。這主要是因為數(shù)據(jù)中借款合計為0的用戶比較多,約占總數(shù)據(jù)量的2/3,在建模時這部分數(shù)據(jù)對回歸直線有很明顯的下拉作用,導致回歸直線發(fā)生旋轉(zhuǎn),進而造成殘差旋轉(zhuǎn)。并且模型對這部分用戶的預測值基本上都大于0,因此殘差都為負數(shù),這就造成了其余殘差基本都大于0,形成了圖2中左邊兩幅圖細線條和粗線段帶分離的情況。

通過計算,得到線性回歸模型的MSE=3.343997。處理類似本文中帶偏折的數(shù)據(jù)時,采用分位數(shù)回歸一般可改善效果,但經(jīng)過建模得到分位數(shù)回歸模型的MSE=3.694761,效果不如線性回歸模型。這可能是因為借款總額為0的用戶占更大部分,在分位數(shù)回歸扭正殘差的同時,擴大了這部分用戶預測的殘差。面對如此復雜的數(shù)據(jù),線性回歸模型肯定達不到最好的效果,繼續(xù)嘗試改進模型。

4.利用GBDT建立模型

GBDT模型是此類問題的一個優(yōu)良的解決方案。GBDT模型有迭代次數(shù)和優(yōu)化步長兩個比較重要的參數(shù)。迭代次數(shù)表示模型繼續(xù)計算的最大次數(shù)M,優(yōu)化步長表示模型每次擬合時對殘差擬合的細度。一般情況下先設定一個比較大的迭代次數(shù)和比較小的優(yōu)化步長,通過觀察殘差的變化來選擇最合適的參數(shù)數(shù)值。

無論優(yōu)化步長取何值,殘差都是隨著迭代次數(shù)的增加先下降后上升的,存在最低點。隨著優(yōu)化步長的減少,殘差達到最低點需要的迭代次數(shù)越來越多,并且殘差能達到的最小值也在逐漸下降。隨著模型的迭代次數(shù)繼續(xù)增加及優(yōu)化步長繼續(xù)減少,殘差的最小值會不斷下降,但下降的幅度越來越少,并且計算代價呈平方關系上升。實踐中會選取殘差、迭代次數(shù)和優(yōu)化步長都在可接受范圍內(nèi)的數(shù)值建立模型,使得模型可在有限時間內(nèi)計算出結(jié)果,殘差也較為接近理論最小值。

設定迭代次數(shù)為3000,優(yōu)化步長為0.01建立GBDT模型。當?shù)螖?shù)達到2095次時,模型殘差達到最小。由于優(yōu)化步長已設置為較小的數(shù),且計算時間可以接受,本文就使用2095的迭代次數(shù)和0.01的優(yōu)化步長建立模型。生成模型后,帶入特征數(shù)據(jù)計算所有用戶次月借款合計預測值,與實際值進行比較,計算MSE=3.20099,效果較回歸模型有所提高。

5.總結(jié)

本文從小額信用貸款這樣一個具體的、實際的業(yè)務出發(fā),對產(chǎn)品運營中客戶需求這個核心問題進行研究,目的在于利用已有的基本信息和歷史信息,對用戶將來潛在的需求進行預測。本文根據(jù)數(shù)據(jù)的特征,首先采用了較為簡單的線性回歸模型,并通過GBDT模型進行優(yōu)化,使得預測效果得到提高,取得了良好的效果。

隨著金融市場化的不斷推進,依托大數(shù)據(jù)和互聯(lián)網(wǎng)金融的發(fā)展,傳統(tǒng)的人工作業(yè)模式越來越被市場所淘汰,取而代之的是更精準、更高效的客戶營銷機制。本文通過對一系列數(shù)據(jù)挖掘算法的引入,既考慮到大數(shù)據(jù)的應用,通過智能算法精準定制產(chǎn)品,提升用戶的使用體驗,同時也展現(xiàn)了理論模型在實際數(shù)據(jù)中的表現(xiàn)。更重要的是,本文為金融機構關心的增加資金利用率、降低成本并增加收益等問題,提供了一個解決問題的思路。

參考文獻:

[1]L.I.Breiman,J.H.Friedman,R.A.Olshen,and C.J. Stone. Classification and Regression Trees (CART). Encyclopedia of Ecology,40(3):582-588, 1984.

[2]Mayo Foundation Terry M.Therneau, Elizabeth J. Atkinson.An Introduction to Recursive Partitioning Using the RPART Routines. CRAN, 2018.

[3]Jerome H.Friedman. Greedy Function Approximation: A Gra- dient Boosting Machine. Annals of Statistics, 29(5):1189-1232,2001.

[4]Greg Ridgeway.Generalized Boosted Models:A guide to the gbm package.CRAN,2018.

[5]Tianqi Chen and Carlos Guestrin.XGBoost: A Scalable Tree Boosting System. pages 785-794,2016.

[6]Guolin Ke,Qi Meng,Thomas Finely, Taifeng Wang, Wei Chen, Weidong Ma,Qiwei Ye,and Tie-Yan Liu.LightGBM:A Highly Efficient Gradient Boosting Decision Tree.2017.

[7]張瀟,韋增欣,楊天山.GBDT組合模型在股票預測中的應用. 海南師范大學學報,(1),2018.

[8]馬曉君,沙靖嵐,牛雪琪.基于LightGBM 算法的 P2P 項目信用評級模型的設計及應用.數(shù)量經(jīng)濟技術經(jīng)濟研究,(5), 2018.

作者簡介:陳方圓(1989.6-),女,研究生,研究方向:金融學。

猜你喜歡
互聯(lián)網(wǎng)金融大數(shù)據(jù)
互聯(lián)網(wǎng)金融背景下農(nóng)村手機銀行發(fā)展現(xiàn)狀研究
中國市場(2016年33期)2016-10-18 12:58:55
淺析我國商業(yè)銀行應對互聯(lián)網(wǎng)金融沖擊的對策
商(2016年27期)2016-10-17 05:57:47
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
互聯(lián)網(wǎng)金融的風險分析與管理
互聯(lián)網(wǎng)金融理財產(chǎn)品分析
互聯(lián)網(wǎng)金融對傳統(tǒng)金融的影響
基于大數(shù)據(jù)背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 国产91无码福利在线| 无码网站免费观看| 久久夜色精品| 丝袜亚洲综合| 无码中字出轨中文人妻中文中| 亚洲精品欧美日本中文字幕| 青草国产在线视频| 久久国产高潮流白浆免费观看| 91福利免费视频| 色婷婷综合激情视频免费看| 国产免费一级精品视频| 欧美69视频在线| 人妻一区二区三区无码精品一区 | 国产成人狂喷潮在线观看2345| 色吊丝av中文字幕| av天堂最新版在线| 国产91精品调教在线播放| 婷婷色婷婷| 成人一级免费视频| 91青草视频| 2020国产精品视频| 欧美激情视频在线观看一区| 99久久精品国产精品亚洲| 欧美性猛交一区二区三区| 欧美www在线观看| 精品99在线观看| 亚洲综合久久成人AV| 精品国产一二三区| 久久精品国产电影| 喷潮白浆直流在线播放| 欧美一级黄片一区2区| 亚洲精品第一页不卡| 一级看片免费视频| 国产高潮流白浆视频| 国产欧美成人不卡视频| 色婷婷色丁香| 大陆精大陆国产国语精品1024| 精品一區二區久久久久久久網站| 尤物国产在线| 亚洲IV视频免费在线光看| 香蕉久久国产精品免| 亚洲乱码精品久久久久..| 亚洲天堂视频在线观看| 成人午夜视频在线| 亚洲欧美日韩综合二区三区| 超碰aⅴ人人做人人爽欧美| 亚洲精品黄| 中文成人在线视频| 波多野衣结在线精品二区| 999福利激情视频 | 一本色道久久88亚洲综合| 国产精品视频999| 亚洲色大成网站www国产| 国产区91| 欧美亚洲另类在线观看| 青青久久91| 欧美日韩国产综合视频在线观看| A级毛片高清免费视频就| 中文字幕一区二区人妻电影| 69免费在线视频| 国产精品页| 日韩精品一区二区深田咏美| 99热亚洲精品6码| a网站在线观看| 久久性妇女精品免费| 亚洲a级毛片| 潮喷在线无码白浆| 久久久波多野结衣av一区二区| 亚洲第一极品精品无码| 欧美色图久久| 日本成人在线不卡视频| 亚洲天堂.com| 青青操国产视频| 欧美日韩精品一区二区视频| 欧美成人精品一区二区| 久久国产精品夜色| 永久天堂网Av| 免费可以看的无遮挡av无码| 欧美日韩动态图| 欧美午夜网| 久久国产亚洲偷自| 伊人成人在线视频|