999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于決策樹與Logistic回歸的P2P網貸平臺信用風險評價比較分析

2017-10-21 03:05:32余華銀雷雅慧
長春大學學報 2017年9期
關鍵詞:評價模型

余華銀,雷雅慧

(安徽財經大學 統計與數學學院,安徽 蚌埠 233000)

基于決策樹與Logistic回歸的P2P網貸平臺信用風險評價比較分析

余華銀,雷雅慧

(安徽財經大學 統計與數學學院,安徽 蚌埠 233000)

P2P網貸行業在中國發展迅速,其背后的風險不容忽視。文章旨在研究P2P網貸平臺存在的信用風險,參考銀行對中小企業的信用風險評價方法以及國內相關文獻的評價指標,構建了P2P網貸平臺信用風險評價指標體系。運用兩種決策樹模型和Logistic回歸對529家網貸平臺進行了實證分析,建立了網貸平臺的信用風險評價模型。結果表明,3種模型都具有較好的信用風險預測能力,其中決策樹的預測能力更優,具有更好的應用前景。

P2P網貸平臺;決策樹;Logistic;信用風險

長期以來,我國中小企業和個人貸款難度高、大眾小額理財的需求量大,在這種背景下,近年來P2P網貸的優勢日益突出,在國內得到了迅速發展。P2P網貸融入互聯網技術,給民間借貸帶來了新思維,受到了借貸雙方的普遍歡迎,成為互聯網金融領域的代表模式之一。然而,我國投資者普遍風險意識較弱、投資缺乏理性,很容易被網貸華麗的“包裝”所迷惑。近些年,P2P在國內日益蓬勃發展,看似欣欣向榮的表象下,其潛在的風險也日益顯現。2016年,全年出現因經營不善、攜款跑路、黑客攻擊等原因使網站無法正常運營而停業的平臺就有一千余家。可見,平臺的信用風險是投資者甄選平臺的重要依據,因此,選用恰當的方法對平臺進行信用風險評價是網貸領域研究的焦點。

國內外學者以網貸平臺真實數據為基礎,對信用風險領域展開了研究。孫同陽和謝朝陽從網貸個人信用風險角度,運用決策樹模型進行實證分析,發現網貸平臺對個人信用風險評級方面存在嚴重問題[1]。王丹和張洪潮參考了傳統金融機構對小微企業信用評價方法,運用AHP和模糊數學綜合評價法對網貸平臺進行了信用評級[2]。嚴復雷和李浩然利用Logit模型對87家網貸平臺進行回歸分析,得出了對網貸平臺信用風險有著重要影響的指標[3]。潘爽和魏建國運用信號傳遞模型探索了分散網貸平臺信用風險的有效方式[4]。董梁和胡明雅對新進的借款人進行研究,以借款人年齡、借款用途、收入等指標為依據,運用Logistic回歸模型建立了信用風險評價模型。實證分析結果表明,擴大評價指標類型和加大對平臺的審核力度是防范借款人信用風險的有效方法[5]。Laura等人對P2P借款者在貸款時的描述性語言展開了研究,并使用LIWC軟件對20萬余個借款請求進行了分析。借款請求中,借款者使用具體的描述性語言和定量的詞匯更容易借到貸款;而借款請求中使用個性化描述語言的借款者較難借到貸款。Chen和Han認為,中國和美國兩個國家信貸結果的影響因素存在差異,美國影響因素側重于“硬”信息,而“軟”信息在中國更為可靠。本文以P2P網貸平臺信用風險評價為出發點,比較不同的分類模型在信用風險評價應用中的優劣,以期為評價我國P2P網貸平臺信用風險提供理論支持。

1 理論基礎

1.1 決策樹模型

決策樹的外形呈樹狀結構,是利用樣本數據的屬性進行分類的方法。決策樹算法有眾多思想來源,其中,Quinlan于1986年率先發明了ID3算法,之后在ID3算法的基礎上分別于1984年和1993年衍生出C4.5算法和CART算法。文章選取C4.5算法和CART算法對樣本數據進行分類。

CART的基本算法如下:

(1)輸入訓練樣本集T,根據樣本節點對B=b的判斷為“yes”或“no”,將訓練樣本集分為T1和T2,運用Gini系數的定義式,計算B=b時的Gini系數。

(2)選取Gini系數最小的特征和其對應的分割點,分別作為最優特征和最優分割點。根據樣本數據集中的最優屬性特征與最優分割點,在現有的結點中生成兩個子節點,將訓練樣本數據集依照屬性特征分配到兩個新的子節點中。

C4.5的基本算法如下:

(1)輸入訓練樣本數據集T、閾值β和特征集B。若訓練樣本數據T中所有樣本都屬于同一個類別,則決策樹F生成為單個節點的決策樹,返回決策樹F。

(2)若B為空集,則F為單個節點的決策樹,返回F;若B為非空集,則計算特征集B中的特征對T的信息增益比gR(T,B),選擇gR(T,B)最大的特征Bg。

(3)若Bg的信息增益比比β小,那么F為單個節點的樹,把T中樣本數最多的類作為節點的類。否則,對與Bg的所有可能值bi,根據Bg=bi的原則將F分成若干個非空子集Ti,對Ti中樣本數最多的類做標記,生成子節點,構建決策樹F,返回F。

(4)遞歸調用(1)~(3)步驟,對于第i個節點,特征集為B-{Bg},訓練集為Ti,生成子樹Fi,返回Fi。

1.2 Logistic回歸模型

2 P2P網貸平臺信用風險評價實證分析

2.1 數據來源與處理

本文用于實證分析的數據來源于國泰安數據庫,選取2015年12月至2016年12月數據相對完整的529家網貸平臺數據。將獲得的樣本數據分為兩個類別,分別為高風險平臺和低風險平臺。將出現跑路、停業、提現困難等問題的平臺歸為一類,即高風險平臺;將截至2017年1月尚未出現問題的平臺歸為一類,即低風險平臺。若評價結果將高風險平臺歸為低風險平臺,則認為結果存在第一類錯誤;若評價結果將低風險平臺歸為高風險平臺,則認為結果存在第二類錯誤。樣本數據中有55家網貸平臺被定義為高風險平臺,474家網貸平臺被定義為低風險平臺。其中,高風險平臺僅占樣本總數的10%,存在嚴重的樣本不平衡的問題。因此,在將樣本數據代入模型運算前,使用SMOTE算法平衡樣本數據,經過平衡的樣本數據總數為886,高風險平臺與低風險平臺占總平臺數量的比例大致相同。

2.2 指標體系

現階段,網貸平臺的信用評價沒有統一的指標體系,相關文獻不全,評級難度較大。因此,筆者借鑒了銀行對中小企業的信用風險評價方法以及國內相關文獻的評價指標,基于前人的研究經驗,從經營能力、發展前景、平臺素質、盈利能力4個方面構建了P2P網貸平臺信用風險評級指標體系。

(1)經營能力指標。判斷平臺的各類資產是否能夠快速變現的能力,運營能力越好,平臺資金的流動性越強,風險越低。平臺若不能快速得到足夠的資金以支付投資者的本息,資金鏈一旦斷裂,會出現嚴重的“擠兌”現象。選擇未來60日待還金額(X1)、日均投資人數(X2)、日均借款人數(X3)對網貸平臺的經營能力進行衡量。

(2)發展前景指標。平臺的發展能力值得關注,該項指標越大,說明平臺的潛力越大,發展前景越廣,在未來的同類行業競爭中優勢會更多,相應的信用風險也更小。衡量平臺發展前景的指標有日均成交量(X4)、平均借款期限(X5)、平均利率(X6)。

(3)償債能力指標。平臺的償債能力是平臺信用的保障,平臺的償債能力通常是直接反映平臺資信的依據,償債能力也是平臺實力的體現。選擇注冊資金(X7)、保障方式(X8)、債權轉讓(X9)來衡量平臺的償債能力。

(4)盈利能力指標。該項指標主要衡量平臺的獲利情況,獲利能力是平臺信用的基礎。由于平臺具體的獲利數據很難獲得,可以用平臺近30日資金凈流入(X10)、累計待還金額(X11)、營業時間(X12)來衡量網貸平臺的盈利能力。

2.3 模型構建

將樣本數據經過預處理后,代入到3個模型中分別進行運算。同時,使用10折交叉驗證的方法,分別計算決策樹模型和logistic回歸在訓練集和測試集上的第一類錯誤率、第二類錯誤率和平均分類錯誤率。其中,生成的決策樹如圖1所示。

圖1 基于CART算法的決策樹模型

CP值為0.011的CART算法的決策樹如圖1所示,其中,X10屬性是決策樹的根節點,即近30日資金凈流入對平臺信用風險分類的貢獻程度是最大的。最終,基于CART算法的決策樹由6個最優屬性構成,對應6條分類規則,例如:①近30日資金凈流入大于等于110的平臺均為低風險平臺;②營業時間小于3的平臺均為高風險平臺;③平均借款期限大于3.1的平臺均為低風險平臺。其他結論以此類推。

2.4 結果分析

將經過處理的樣本數據代入3種模型進行運算,將運算結果整理匯總如表1所示。從實證結果來看,3種模型都具有較好的預測能力。比較而言,C4.5決策樹和CART決策樹總體分類的錯誤率較低,表明決策樹模型在P2P網貸平臺信用風險評價方面具有較好的應用前景。同時,從表1可看出,CART決策樹模型的準確率為80%,C4.5決策樹模型的準確率為77%,明顯優于logistic回歸的69%的準確率。

表1 運算結果匯總

根據評價結果, 對3種模型的魯棒性進行比較分析。在訓練樣本中CART模型的總誤判率最低,僅為10%;C4.5模型總誤判率為20%;Logistic的總誤判率最高,為29%。相比訓練樣本,3種模型在測試樣本的總誤判率都有不同程度的提高,提高比例最低的是Logistic回歸,提高了2%;其次是C4.5模型,提高了3%;最高的是CART模型,提高了10%。這說明Logistic回歸模型的魯棒性最強,CART模型和C4.5模型的魯棒性相對較弱,但保持了較低水平,能夠滿足實際運用的需求。最終,運用兩種決策樹模型和Logistic回歸對P2P網貸平臺信用風險進行了建模和預測,預測總體結果較好。并將兩種決策樹模型與Logistic回歸的評價結果進行比較,得出決策樹模型在P2P網貸平臺信用風險評價方面具有更好的應用前景。

3 政策建議

我國目前尚未形成完善的個人征信體系,網貸行業難以從線上直接獲得個人信用數據,僅依靠線下審核的方式,不僅成本高、周期長,而且能夠識別風險的概率也令人擔憂。因此,建議有關部門盡快建立完善的征信體系,對網貸平臺提供開放的信息服務,為網貸平臺的長遠發展創造條件。同時,提醒投資者高度警惕不法平臺的虛假宣傳,切勿盲目追逐高收益率,應綜合考量網貸平臺風險后謹慎投資。

[1] 孫同陽,謝朝陽.基于決策樹的P2P網貸信用風險評價[J]. 商業經濟研究,2015(2):81-82.

[2] 王丹,張洪潮.P2P網貸平臺信用風險評級模型構建[J]. 財會月刊,2016(9):76-80.

[3] 嚴復雷,李浩然.P2P網貸平臺信用風險影響因素分析[J]. 西南金融,2016(10):13-17.

[4] 潘爽,魏建國. P2P網貸平臺的信用風險及其分散機制設計:基于信號傳遞模型[J]. 財會月刊,2017(11):88-91.

[5] 董梁,胡明雅. 基于Logistic回歸模型的P2P網貸平臺新進借款人信用風險研究[J]. 江蘇科技大學學報(社會科學版),2016(3):102-108.

責任編輯:沈 玲

ComparativeAnalysisonCreditRiskEvaluationofP2PNetworkLoanPlatformBasedonDecisionTreeandLogisticRegression

YU Huayin, LEI Yahui

(Institute of Statistics and Applied Mathematics,Anhui Finance and Economics University, Bengbu 233000, China)

P2P network loan industry grows rapidly in China, and the credit risk problems of the platform are increasingly apparent. This paper aims to explore the credit risk problems of P2P network loan platform, and constructs an evaluation index system by drawing references from banks’ credit risk evaluation on small and middle-sized enterprises and evaluation indexes in domestic related literature. Empirical analysis on 529 network loan platforms is made by using the two decision tree models and Logistic regression and the credit risk model is established. The results show that the three models have strong ability to predict credit risks, and among which the effect of decision tree is superior, having better application prospect.

P2P network loan platform; decision tree; Logistic; credit risk

F830

A

1009-3907(2017)09-0013-04

2017-07-11

安徽省哲學社會科學規劃項目(AHSKY2015D53);安徽財經大學研究生科研創新基金項目(ACYC2016111)

余華銀(1962-),男,安徽全椒人,教授,主要從事金融與投資統計研究。

猜你喜歡
評價模型
一半模型
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
中藥治療室性早搏系統評價再評價
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
基于Moodle的學習評價
關于項目后評價中“專項”后評價的探討
保加利亞轉軌20年評價
主站蜘蛛池模板: 97视频免费在线观看| 亚洲丝袜中文字幕| 欧美日韩中文字幕在线| a在线亚洲男人的天堂试看| 区国产精品搜索视频| 亚洲色图在线观看| 久久香蕉国产线看精品| 天天躁狠狠躁| 99re视频在线| 欧美视频免费一区二区三区 | 精品久久蜜桃| 国产乱肥老妇精品视频| 国产超碰一区二区三区| yy6080理论大片一级久久| 男女精品视频| 午夜免费小视频| JIZZ亚洲国产| 漂亮人妻被中出中文字幕久久| 激情午夜婷婷| 青青青国产视频手机| 国产自在线播放| 亚洲最新在线| 国产在线观看精品| 99视频在线观看免费| 国产尤物视频网址导航| 国产在线欧美| 在线无码九区| 依依成人精品无v国产| 亚洲免费福利视频| 亚洲精品视频免费看| 一级全黄毛片| 2021天堂在线亚洲精品专区 | 亚洲AV色香蕉一区二区| 国产精品免费电影| 欧美成人手机在线视频| 久久久精品国产SM调教网站| 日本不卡视频在线| 一区二区三区成人| 国产精品天干天干在线观看| 视频二区欧美| 欧美激情福利| 亚洲美女操| 久久国产av麻豆| 中文字幕亚洲乱码熟女1区2区| 国内精自线i品一区202| 国产一线在线| 国产黄在线观看| 亚洲无线国产观看| 亚洲人免费视频| 狠狠做深爱婷婷久久一区| 国产成人永久免费视频| 亚洲码在线中文在线观看| 精品国产www| 91精品啪在线观看国产91九色| 亚洲国产欧美国产综合久久 | 亚洲天堂首页| 欧美日韩国产在线播放| 日韩一区精品视频一区二区| 国产免费久久精品99re不卡| 精品人妻系列无码专区久久| 国产屁屁影院| 日本免费新一区视频| 天堂av综合网| 国产成人啪视频一区二区三区| 免费人成在线观看成人片| 欧美精品1区| 国产99热| 国产十八禁在线观看免费| 激情午夜婷婷| 国产激情影院| 国产精品毛片一区视频播| 免费在线看黄网址| 亚洲嫩模喷白浆| 国产性生交xxxxx免费| 亚洲视频a| 精品无码专区亚洲| 精品国产美女福到在线不卡f| 91麻豆国产在线| 97人妻精品专区久久久久| 中文字幕精品一区二区三区视频| 丰满少妇αⅴ无码区| 91网在线|