999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于集成學習的銀行信用卡逾期客戶識別

2019-05-24 05:46:16何黎松
大眾投資指南 2019年15期
關鍵詞:分類效果模型

何黎松

(西安歐亞學院金融學院,陜西 西安 710065)

引言

銀行客戶信用卡逾期客戶識別指的是根據銀行信用卡業務客戶的基本屬性、信用記錄,將逾期客戶和非逾期客戶識別出來。銀行信用卡逾期識別的研究文獻較少。周穎(2015)[1]討論了信用卡違約的責任問題,慧梅(2015)[2]對比信用卡使用狀況和逾期行為,葛緋(2015)[3]給出了控制信用卡風險的方法,這些研究都基本處于定性分析層面。后來逐漸有學者將數據挖掘算法迅速應用到這一商業問題的應用中,徐超(2016)[4]用神經網絡模型對信用卡逾期風險做出了研究識別;張秋菊(2018)[5]使用BP神經優化算法對信用卡還款風險做了評估研究,但是單個的分類模型往往準確度不高。

本文從集成學習方法入手,集成邏輯回歸、判別分析、決策樹和神經網絡模型,對某商業銀行的信用卡客戶逾期行為進行識別,以提高總體的預測精度。

一、數據準備

本文數據,來自某商業銀行脫敏后的2016年客戶信用信息作為數據。

分析變量共15個,其中將性別、年齡、婚姻狀況、學歷、職業、職務、司齡、個人住房貸款筆數、貸款筆數、貸記卡賬戶數、貸記卡授信總額、貸記卡單家最高授信額度、貸記卡單家最低授信額度、貸記卡已用額度共14個變量作為輸入變量進行分析,是否逾期作為目標變量進行分析。

二、理論基礎

(一)單個分類模型

1、邏輯回歸

邏輯回歸原理與多元回歸類似,只不過其因變量Y取值為二元的“0”和“1”,或者多元的取值;二分類得更為常用,也更容易解釋。通過對自變量和因變量建立回歸方程,借助方程預測,從而實現分類功能。實際中最為常用的就是二分類的logistic回歸。邏輯回歸在處理自變量為數值型時效果較好,自變量為分類變量時,效果有時不佳。

2、判別分析

判別分析是分類模型的一種,算法較為簡單:距離算法,函數轉化;距離算法近似于聚類,通過計算每類中心點和新元素的距離,以距離遠近判斷其歸屬類別;矩陣轉換和函數擬合近似于回歸,根據自變量和因變量建立判別函數,從而實現對新的變量的預測分類。

3、決策樹

決策樹是數據挖掘算法興起之后的分類模型,分類結果近似計算機的 if else 形式,通過算法,生成樹狀的分類節點。算法擬合是,每個分類對應著一個預測準確度,通過對準確度優化,找到最近的分類規則。決策樹算法不斷發展,常見的有決策樹,CHAID,QUESTION,C5.0等等。決策樹的結果解讀性高,在現代商業應用較多;但是在數據中存在干擾信息時,分類效果往往不好。

4、神經網絡

神經網絡是近年來比較熱門的分類模型,其思路是:在輸入變量X和輸出變量Y之間設定函數框架,框架中放有激活函數,這些激活函數包括:Sigmoid,tanh,ReLU等等。變量輸入進來,函數激活,獲得輸出,與實際輸出對比,根據差距(損失),機器自動返回去調節函數權重,如此反復迭代,最終獲得擬合度很好的、可用的函數框架。神經網絡因其層數不同、激活函數組培不同、試錯修正方式不同,有很多分類,且隨層數加深,函數豐富,而在逐漸發展,目前已有的模型包括簡單的徑向基函數、多層感知器,深層的DNN、LSTM、HMM等等,且在不斷復雜化。神經網絡具有非線性,局部自洽等特點,整體復雜而難以描述,在現代語音、圖像識別中使用廣泛。

(二)集成學習

集成學習的思想是:當一個分類模型效果不好時,可以使用多個分類模型分別用于分類,最后將多個結果結合在一起,以投票,少數服從多數的機制,集成獲得結果。有時候往往會取得比單個分類模型更好的效果。

三、建模實證

(一)單個分類模型的效果

分別用邏輯回歸、判別分析、決策樹、神經網絡對數據進行模型訓練,預測結果如表1。

表1 單個分類模型分類效果表

結果表明,對本文的銀行客戶風險識別問題,分類效果最好的是邏輯回歸,其次是神經網絡,決策樹,盤被分析結果最差。

(二)集成學習效果

將四個分類模型,三三組合,共四種,利用其預測結果,表決獲得最終預測結果,規則是:少數服從多數,當超過兩個預測為1時,結果為1;超過兩個預測為0時,結果為0。將綜合的預測結果和實際值比較,計算預測準確度,得到表2。

表2 集成學習準確度表

結果表明,集成學習的準確度,基本上都達到86%以上,最高的超過了90%,總的來看,預測效果明顯地獲得了提升。如果選擇神經網絡、判別分析、邏輯回歸集成三個模型作為最后的集成模型,模型效果為90.7%,比每個單個分類模型的準確度都高。

四、結論

本文以集成學習思想,集成邏輯回歸、判別分析、決策樹、神經網絡,對商業銀行信用卡逾期行為進行分類識別。結果表明,集成的分類模型,基本上都達到86%以上,最高的超過了90%,比單個的分類模型具有更好的分類識別效果。集成多個分類模型預測分類的思路,可用于商業應用中。

猜你喜歡
分類效果模型
一半模型
按摩效果確有理論依據
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
迅速制造慢門虛化效果
數據分析中的分類討論
抓住“瞬間性”效果
中華詩詞(2018年11期)2018-03-26 06:41:34
教你一招:數的分類
主站蜘蛛池模板: 精品视频在线观看你懂的一区| 国产大全韩国亚洲一区二区三区| 久久精品午夜视频| 亚洲欧洲自拍拍偷午夜色无码| 正在播放久久| 国内精品视频| 成人免费黄色小视频| 欧美成人a∨视频免费观看| 超清人妻系列无码专区| 欧美性天天| 欧美成人精品高清在线下载| 91丝袜乱伦| 久久人人妻人人爽人人卡片av| 中文字幕中文字字幕码一二区| 国产日本欧美亚洲精品视| 欧美a级完整在线观看| 欧美色综合网站| 亚洲国模精品一区| 国内精品小视频在线| 四虎永久免费地址在线网站| 一级片一区| 亚洲国产精品日韩专区AV| a亚洲视频| 好久久免费视频高清| 无码专区在线观看| 国产一在线观看| 在线播放精品一区二区啪视频| 日韩美一区二区| 日本不卡在线视频| 手机精品视频在线观看免费| 亚洲免费黄色网| 欧美另类精品一区二区三区| 国产精品永久在线| 亚洲av日韩av制服丝袜| 国产日韩精品欧美一区喷| 乱系列中文字幕在线视频 | 欧美97欧美综合色伦图| 99视频在线免费| 国产成人在线无码免费视频| 亚洲综合国产一区二区三区| 国产精品xxx| 国产午夜福利亚洲第一| 日本成人在线不卡视频| 亚洲最大在线观看| 国产亚洲欧美在线人成aaaa| 亚洲AV成人一区二区三区AV| 国产国语一级毛片在线视频| 欧美一级99在线观看国产| 欧美啪啪一区| 精品一区二区无码av| 成人精品区| 亚洲伦理一区二区| 2021精品国产自在现线看| 制服丝袜亚洲| 99热线精品大全在线观看| 国产成人成人一区二区| 国产精品久久国产精麻豆99网站| 黄色污网站在线观看| 欧美日本在线| 欧美成人精品在线| 精品91视频| 国产免费高清无需播放器| 欧美a√在线| 久久精品无码一区二区日韩免费| 亚洲AV无码一二区三区在线播放| 免费在线成人网| 亚洲成A人V欧美综合天堂| 波多野结衣在线一区二区| 日本一区中文字幕最新在线| 亚洲精品国偷自产在线91正片| 日本成人福利视频| 欧美97色| 亚洲午夜18| 成人国产精品2021| 欧洲欧美人成免费全部视频| 国产男女免费视频| 91亚洲视频下载| 日本AⅤ精品一区二区三区日| 性做久久久久久久免费看| 91无码网站| 五月丁香伊人啪啪手机免费观看| 波多野结衣久久高清免费|