999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機和決策樹CART的個人信用評估

2017-01-05 07:24:54魏冠男
成都工業學院學報 2016年4期
關鍵詞:分類模型

魏冠男

(安徽財經大學 管理科學與工程,安徽 蚌埠 233030)

基于支持向量機和決策樹CART的個人信用評估

魏冠男*

(安徽財經大學 管理科學與工程,安徽 蚌埠 233030)

為了更好地控制借款人的信用風險,利用支持向量機對個人信用進行預測與分析,在支持向量機對個人信用評估產生缺陷的基礎上提出基于代價敏感學的CART決策樹預測個人信用的方法。實證分析表明:該方法能夠較好地對借款人信用狀況進行預測,為互聯網金融機構進行相關風險管理提供理論依據。

支持向量機;個人信用;互聯網金融機構;CART決策樹;風險管理

隨著社會經濟的發展,互聯網金融對促進小微企業融資和擴大就業產生了積極影響。但由于目前國內征信體系不完善、違約成本低等原因極易出現借款人違約等信用風險。風險的出現無疑會給相關金融機構和投資人帶來巨大的損失,最終不利于互聯網金融的健康發展。因此,建立互聯網金融標準時應將信用管理作為一個關鍵指標。美國互聯網金融機構把FICO信用分[1]作為信用風險控制最重要的參考數據,而國內尚缺乏這樣的信用評分體系,不能精確估計消費信貸的風險。同時,由于互聯網金融與傳統商業銀行在客戶定位上的根本性差異,兩者的信用評價模式也就不同。傳統商業銀行客戶信用評價模式依賴于提供足夠的抵押物或有效擔保,或提供合適的財務報表等“硬信息”;互聯網金融小微客戶缺乏充足的抵押物,難以提供有效擔保,且財務報表往往不規范、不全或失真,因此,我國應在基于本國國情的基礎上結合客戶的特征進行風險管理。充分利用積累的信息和數據,采用合適的信用評估方法對不同類別的借款人進行有效的信用評估。目前國內學者已經提出關于個人信用評估的多種分類方法:如李太勇等[2]針對傳統信用評估方法分類精度低、特征可解釋性差等問題,提出了一種使用稀疏貝葉斯學習方法來進行個人信用評估的模型(SBLCredit)。張燕等[3]針對個人信用評估中未標號數據獲取容易而已標號數據獲取相對困難,以及普遍存在的數據不對稱問題,提出了基于改進圖半監督學習技術的個人信用評估模型。湯浩龍等[4]以個人貸款信用評估為切入點,將支持向量機(Support Vector Machines,SVM)方法應用到個人貸款信用評估模型中。本文在利用Clementine軟件基于支持向量機方法對個人信用評估進行評估的基礎上提出了不平衡類問題,并提出基于代價敏感學習的分類決策樹(Classification And Regression Tree,CART)的解決辦法。

1 基于支持向量機的個人信用評估

1.1 支持向量機分類原理

SVM是一種監督式學習的方法,基本思想是把輸入空間的樣本通過非線性變換映射到高維特征空間,然后在特征空間中求取把樣本線性分開的最優分類面[5],如圖1所示。

圖1 支持向量機的分類原理圖

圖1中,H代表分類線,H1和H2分別將樣本分開且離分類線最近且平行于分類線的直線,它們之間的距離稱為分類間隔(Margin)。最優分類線能將兩類樣本正確分開,并且使分類間隔最大。分類線的方程表示為x·w+b=0,對于給定線性可分的樣本集(xi,yi),i=1,2,…,n,xi∈Rd,y∈{-1,1}滿足

yi(w·xi+b)-1≥0(i=1,2,…,n),

(1)

得到分類間隔為2/││w││,當分類間隔最大時,即等價于││w││2最小,滿足條件式(1)并且使││w││2/2最小的分類面就叫做最優分類面,H1、H2上的訓練樣本叫做支持向量。

(2)

常用的核函數有線性核函數K(xi,x)=xixj;多項式核函數K(xi,xj)=[(xixj)+1]q;RBF核函數K(xi,xj)=exp(-(xi-xj)2/σ2);Sigmoid核函數K(xi,xj)=tanh(v(xixj)+c)。

1.2 個人信用評估的SVM模型建立

本文通過運用數據挖掘中的Clementine軟件來對樣本數據進行建模分析,具體過程如下:

1.2.1 商業理解

目前,住房按揭、消費信貸、汽車貸款、信用卡等信用消費已經逐步浮出水面,但是國內商業銀行對消費貸款的風險管理水平較低,管理手段與方法均較落后,本研究利用信貸評估實例數據進行實證分析,采用最合適的任務安排和挖掘算法,為商業銀行評估個人信用狀況,并進行相關風險管理提供了理論依據。

1.2.2 數據理解

數據理解的關鍵是數據源的選擇。本研究選用德國一銀行信貸評估實例數據進行實證分析,實例數據中主要有20個影響違約狀況的因素,第21個指標為該德國銀行根據前面20個屬性指標進行綜合判斷后對每個各戶給出的信用評估類別。該樣本數據中共包含1 000個客戶,被銀行批準獲得貸款的“好客戶”有700個,同時未獲得銀行貸款的“壞客戶”有300個。

1.2.3 數據準備

在構建模型時,數據的處理對模型的評估結果有很大的影響。為了使模型的評估結果更準確,需要對數據進行預處理。我們將其中關于各個屬性對應的狀態編碼數字化,首先根據每個屬性的不同的狀態按照0,1,2,…由小到大按順序進行編號,其次將所有的屬性及狀態標號匯總在同一張Excel表中用于導入到Clementine軟件中進行分析。

1.2.4 模型建立

選取 Clementine中的支持向量機節點建模,并分別用不同的核函數進行分類,具體的操作過程為:

Step1:將德國信用數據集Excel表導入其中作為源節點,將表節點附加到變量文件節點并執行流,將一個類型節點附加到源節點,將客戶類別的字段值類型設置為“標志”,方向設置為“輸出”,其他所有指標字段的方向設置為輸入。

Step2:SVM 節點提供多個可選的核函數用于執行處理過程。由于無法知道哪個函數對于任意給定的數據集性能最佳,依次選用RBF(徑向基函數)、poly(多項式函數)、Sigmoid函數和 line(線性函數)進行比較研究。

Step3:依次運行4個SVM節點可以生成4種核函數的分類模型,在最后一個模型后面附加一個分析節點并執行分析節點來對模型進行比較。

1.2.5 模型分析

將分析節點附加到最后一個模型節點上,然后使用分析節點的默認設置來執行。在完成模型實施階段之后,數據流設計中的數據流圖如圖2所示。

圖2 SVM模型實施階段數據流圖界面

支持向量機中不同核函數的運行結果如表1所示。

表1 模型預測數據分析表

表1給出了不同的核函數對于樣本數據分類為正確或不正確的準確性。通過運行分析節點,可以得到每個模型的預測效果,來自分析節點的輸出顯示 RBF 函數可以正確地預測 99%的觀測值,多項式函數可以正確預測每個觀測值中的診斷。而Sigmoid函數和線性函數則只能預測70%和63%的觀測值。這就意味著多項式函數相比其他3種核函數在預測個人信用方面要更加實用一些。

2 不平衡類問題

在分類過程中,屬于不同類的實例數量都不成比例,對于銀行來說,拒絕“好”客戶和接受“壞”客戶所造成的損失并不相等。接受“壞”客戶,銀行可能遭受較大的違約風險;而拒絕“好”客戶,損失的是貸款利息[6]。也就是說,接受“壞”客戶比拒絕“好”客戶的成本高。雖然欺詐的量級可能是百分之一,但其所帶來的損失必將是大于其收益的,因此,本文提出了基于代價敏感學習的個人信用預測方法。

2.1 CART決策樹簡介

CART決策樹模型使用二叉樹將預測空間遞歸地劃分為若干子集,而樹中的節點對應著劃分不同區域,劃分是由每個內部節點相關的分支規則來確定的,通過從樹根到節點移動,一個預測樣本被賦予一個唯一的葉節點,應變量在該節點上的條件分布也即被確定。CART算法包含3部分內容:分支變量即拆分點的選擇、樹的修剪和模型樹的評估[7-9]。

2.2 CART決策樹建模

Step1:采用的方法是將1 000個樣本數據按照2∶1的比例分為訓練樣本(667個,從第一個到第667個樣本)和測試樣本(333個,從第668個到第1 000個樣本)

Step2:將接受“壞”客戶損失與拒絕“好”客戶的損失比例分別設置為不同的比例時,對333個測試樣本進行測試。

Step3:按照支持向量機的建模過程得到CART決策樹的數據流如圖3所示。

圖3 CART模型實施階段數據流圖界面

2.3 不同誤分類損失比例的結果分析

根據上述實驗得到的結果如表2所示,其中a為接受“壞”客戶損失與拒絕“好”客戶的損失比例。

表2 CART模型預測結果表

從表2可以看出,隨著接受“壞”客戶損失與拒絕“好”客戶的損失比例的加大,把“好”的客戶誤判為“壞”客戶的可能性也加大,其預測結果的正確率會降低。

3 結論

信用評估準確率直優劣直接影響到互聯網金融機構的利益和投資者的資金安全,影響到整個行業的健康發展。專業的信用風險控制能夠將平臺的逾期和壞賬率控制到最低,可以保證金融機構長期運營的穩定和規范化發展。因此,無論是傳統的銀行借貸,還是互聯網金融借貸,都應該把控好借款人質量,維護投資人的利益。

[1] FICO信用評級介紹[EB/OL].(2014-06-18)[2016-04-10]. http://wenku.baidu.com/link?url=aZF2-QNJMMe1cetFot x0jvJeJigr9VTxVlG_qW3ga6Rag_cVmJiSQE18PfO6T9BVHG8Cx5El 3zp4t6EB2JzQjWFIgMlje_ddcqqB_ta70DS.

[2] 李太勇,王會軍,吳江,等.基于稀疏貝葉斯學習的個人信用評估[J].計算機應用,2013,33(11):3094-3096.

[3] 張燕,張晨光,張夏歡.基于改進圖半監督學習的個人信用評估方法[J].計算機科學與探索,2012,6(5):473-480.

[4] 湯浩龍,和炳全,周薇.基于SVM的銀行個人貸款信用評估模型研究[J].西部經濟管理論壇,2012,23(1):45-50,55.

[5] 葉俊勇,汪同慶,楊波,等.基于支持向量機的人臉檢測算法[J].計算機工程,2003,29(2):23-24.

[6] 宓文斌. 數據挖掘在銀行信貸業務中的應用[D].上海:上海交通大學,2012.

[7] 王鶴琴,朱萍,程代娣. 決策樹算法分析及其未成年人犯罪行為分析應用[J].合肥學院學報(自然科學版),2011,21(1):59-62.

[8] 高尚.支持向量機及個人信用評估[M].西安:西安電子科技大學出版社,2013:引用頁碼.

[9] TAN P N, STEINBACH M, KUMAR V.Introduction to data mining[M].Addison-Wesley Longman Publishing Co.Inc.2005.

Personal Credit Evaluation based on Support Vector Machines and Classification and Regression Tree

WEIGuannan*

(Anhui University of Finance and Economics, Institute of Management Science and Engineering, Bengbu,233030)

To predict and analysis individual credit by using support vector machine (SVM),the author puts forward a method of personal credit evaluation approach based on cost-sensitive CART, which provides a theoretical basis to commercial banks of the assessment for personal credit status about related risk management .

Support Vector Machine(SVM); personal credit; online financing;classification and regression tree; risk management

10.13542/j.cnki.51-1747/tn.2016.04.015

2016-06-27

魏冠男(1989— ),男(漢族),河南南陽人,在讀碩士研究生,研究方向:互聯網金融,通信作者郵箱:nan_shan@foxmail.com。

F830.49

A

2095-5383(2016)04-0060-03

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 日韩欧美视频第一区在线观看| 国产日韩丝袜一二三区| 99精品高清在线播放| 亚洲女同欧美在线| 99国产精品免费观看视频| 亚洲精品成人福利在线电影| 欧美啪啪网| 一级毛片免费不卡在线| 亚洲AV无码一区二区三区牲色| 五月激情综合网| 欧美日韩在线成人| 亚洲热线99精品视频| 国产白丝av| 婷婷丁香色| 又爽又大又黄a级毛片在线视频| 男人天堂亚洲天堂| 在线观看91香蕉国产免费| 无码日韩人妻精品久久蜜桃| 国产主播在线一区| 亚洲天堂高清| 韩日午夜在线资源一区二区| 免费av一区二区三区在线| 无码网站免费观看| 久久久久久久久久国产精品| 91精品国产综合久久香蕉922 | 四虎成人在线视频| 日本黄色不卡视频| 国产区福利小视频在线观看尤物| 亚洲精品制服丝袜二区| 又猛又黄又爽无遮挡的视频网站| 成年人国产网站| 国产精品成人AⅤ在线一二三四| 免费一级毛片完整版在线看| 国产99精品久久| 国产麻豆aⅴ精品无码| 欧美午夜视频在线| 亚洲一区二区三区在线视频| 40岁成熟女人牲交片免费| 亚洲视频a| 婷婷午夜影院| 国内精品伊人久久久久7777人| 视频一区亚洲| 久久婷婷五月综合97色| 成年女人18毛片毛片免费| 波多野结衣一级毛片| 久久精品人人做人人| 久久久久人妻一区精品| 久久精品中文字幕少妇| 免费观看成人久久网免费观看| 国产素人在线| 男女猛烈无遮挡午夜视频| 久久99国产乱子伦精品免| 2021国产乱人伦在线播放| 亚洲第一区精品日韩在线播放| 亚洲区欧美区| 久久综合国产乱子免费| 99成人在线观看| 综合天天色| 亚洲第一福利视频导航| 久久精品只有这里有| 国产一级妓女av网站| 亚洲精品成人福利在线电影| 国产精品久久久精品三级| 久久情精品国产品免费| 中文成人在线| 亚洲中文制服丝袜欧美精品| 精品免费在线视频| 国产精品区视频中文字幕| 在线观看视频一区二区| 国产成人免费高清AⅤ| 男人天堂亚洲天堂| 久久亚洲中文字幕精品一区 | 久久精品丝袜| 亚洲av片在线免费观看| 伊在人亚洲香蕉精品播放| 青青草原国产| 国产免费久久精品99re丫丫一| 亚洲AV无码乱码在线观看代蜜桃 | 白浆免费视频国产精品视频| 国产精品区网红主播在线观看| 国产视频入口| 国产一二视频|