999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

P2P校園貸款個人違約風險因素指標探析

2018-03-13 03:34:17博士生導師
財會月刊 2018年6期
關鍵詞:校園信息

,(博士生導師),

一、引言

在我國,隨著互聯網技術、通信信息技術的不斷創新以及與金融業的快速融合,互聯網金融中的重要組成部分——P2P網絡借貸得到了快速的發展。P2P(Peer to Peer Lending)是指借貸雙方不經過金融中介機構,直接在線交易的金融借貸服務模式。P2P在促進普惠金融發展、提升金融服務質量和效率、滿足多元化投融資需求等方面發揮了積極作用,展現出了其巨大的市場空間和發展潛力。2017年6月底,全國網貸平臺貸款余額為10449.65億元,歷史累計成交量達到了48245.23億元,可以看出,其已成為一個新興的萬億級市場。

值得注意的是,網貸當中的活躍群體——高校學生需要多元化的消費,但他們的經濟尚未完全獨立,因此成為網絡信貸市場上重要的借款人群。據“網貸之家”對高校學生網絡借貸數據統計,西部地區學生借款占比最大,達到總量的73.53%;借款需求度排前五位的依次為甘肅(11.2)、青海(9.95)、貴州(8.99)、內蒙古(6.66)、寧夏(6.37)。可見,校園網絡貸款作為國家助學貸款的補充,為低收入地區高校學生提供了有力的經濟支持,起到了一定的“幫弱扶弱”作用。

然而,學生貸款普遍存在違約幾率較高的問題。2006年全國學生資助管理中心公布的數據顯示,31所中央部署高校和118所地方高校中,助學貸款平均違約率為18.53%。2009年,助學貸款的不良率達30%,是普通貸款壞賬的15倍。校園網絡借款情況更加不容樂觀,總體逾期幾率和違約幾率分別達到36.74%、10.28%,其中用于創業的借款違約率最高,為11%。同時,除了少數惡性行為以外,“裸條”“暴力催收”等一系列負面事件的發生使校園貸款蒙上灰色。導致這些事件發生的根本原因是高校學生經濟尚未獨立,缺乏還款保障和自我保護意識。2017年5月27日,銀監會、教育部、人力資源社會保障部下發了《關于進一步加強校園貸規范管理工作的通知》,要求未經銀行業監管部門批準設立的機構禁止提供校園貸款服務,且現階段網貸機構一律暫停校園貸款業務,對于存量業務要制定整改計劃,明確退出時間表。

無論P2P校園網絡貸款這一在我國曾經服務過幾十萬在校學生的金融工具是否消失,也無論其會再以哪種新模式服務高校學生,都十分有必要對其進行重新審視。發現與高違約相關的重要個人風險因素,對構建校園網絡貸款的安全線、降低借款違約幾率、保護在校學生權益、培養大學生的信用意識以及加強P2P網貸平臺個人信用風險防范管理都具有重要的意義。

二、相關研究及啟示

與P2P網絡貸款相關的研究尚處于起步階段,而對大學生P2P網絡貸款行為的研究更為鮮見,但P2P網貸中關于個人信用的研究方法可以作為借鑒和參考。

目前國內外的研究多考察借款發起人的“軟信息”和“硬信息”對其違約風險和貸款獲得產生的影響?!败浶畔ⅰ笔遣荒苡脺蚀_的數值或者指標表示的信息,如社會資本、受歡迎程度;“硬信息”是指能用準確數值或者指標表示的信息(劉峙廷,2011),如年齡、性別、財務狀況等。

在評價個人信用的方法上,以統計學和運籌學方法為主,如判別分析法、Logistic回歸法、線性回歸法、ZEAT模型等。此外,信用評分的非參數統計方法也得到了很快的發展,如決策樹法、K-近鄰判別分析法等。20世紀80年代,基于人工智能的信用評價方法,如神經網絡、遺傳算法等,為解決評價中的復雜問題提供了新的思路。在評估方法方面,混合方法比單一方法顯示出更高的精度和更強的解釋力(Blanco,2013;Oreski,2014;Lopez、Jeronimo,2015)。在利用數據挖掘技術構建的評分模型中,Logistic回歸模型整體準確率比較高(Bekhet、Eletter,2014)。Lyer(2014)認為對于小規模借款人,非標準的財務信息數據篩選機制十分重要。

國內學者多基于“拍拍貸”數據,從評估方法上展開研究,如進化的神經網絡模型(喻敏、吳江,2011)、決策樹和神經網絡組合模型(楊勝剛等,2013)、非線性主成分法結合神經網絡及Logistic法(熊志斌,2013)、模糊近似支持向量機(姚瀟、余樂安,2012)。國內網絡貸款平臺對借款人的信息采集多偏向“硬信息”,這使得與“軟信息”相關的研究難以開展。

鑒于我國對于高校學生P2P網絡借貸個人信用風險因素研究尚處于空白階段,且國內P2P平臺缺少“軟信息”數據,本文采用美國網絡貸款平臺Lending Club公開脫敏數據,運用機器學習和數據挖掘方法,得到P2P校園貸款個人違約風險因素重要字段,并據此提出降低P2P校園網絡貸款個人違約風險、保護在校學生的措施。

三、數據分析

美國目前P2P網絡貸款總額已超百億美元,其中Lending Club網貸平臺交易規模占到美國交易總量的60%以上,含有豐富的借款人信息可供研究。本文根據“Student-College”“Student-Technical School”等字段,從LendingClub.com公開的231059條脫敏信息中,選出含有81個維度的共817條高校學生借款數據,采用R語言(x64 3.2.3)軟件并基于Adaboost算法進行數據挖掘分析。

數據分析主要步驟如下圖所示:①對數據進行清洗、填補、變量格式轉化、變量整合、系統化、標準化等初步處理,以獲得可供分析之用的合理數據。②對于維度大的數據,篩選信息增量大的維度,作為回歸分析的重要變量。③將樣本分為訓練數據集和檢測數據集兩部分。在訓練數據集上采用Adaboost迭代算法,基于數據特點構建Logistic回歸分類器,對分類器集訓后,基于擬合誤差,賦予各弱分類器不同權重,當誤差小于設定值時,停止訓練,構建強分類器,計算自變量系數。由于樣本維度大,本文選擇隨機迭代方法。④在檢測數據集上檢驗結果的準確性。

本文數據分析方法圖

(一)數據初步處理

數據初步處理主要包括數據取舍和重要缺失值填補。每條數據的81個維度中,主要舍棄兩類維度:一是14個缺失值超過400導致填補難度過大的維度;二是15個諸如編號一類的中性維度。對借款狀態、雇傭狀態等信息的賦值詳見表1。

表1 部分指標維度賦值

Total Credit Linespast 7 years、Inquiries Last 6 Months、Current Delinquencies、Delinquencies Last 7 Years、Public Records Last 10 Years五個字段缺失 4條數據,采用均值進行填補。剩余12個字段存在約120個缺失,利用其余37個無缺失字段對其進行線性擬合,補全缺失值。經以上處理后,得到維度為51的814條借款數據。

(二)模型與方法

本文基于Adaboost迭代算法數據挖掘方法對樣本賦予不同的權重后,采用Logistic回歸模型,以Loan Status(借款狀態)為目標變量,通過訓練得到各指標參數,利用隨機梯度算法進行樣本參數自適迭代估計,探究P2P校園貸款借款人違約的重要因素指標。

1.Adaboost迭代算法。Adaboost迭代算法是一種增強式學習算法,它能在普通算法產生的弱分類器的基礎上集成多個分類器,進而學習得到強分類器。此方法可以排除次要訓練數據特征,加強關鍵訓練數據權重。主要的迭代過程為:

取樣本集T={(x1,y1),…,(xN,yN)},其中xi為參數的屬性向量,yi為布爾值。初始化數據權值:D1=(w1,1,…,w1,i,…,w1,N)。

其中w1,i為第i個樣本第一次弱分類迭代權重。

假設弱分類器為其在原始樣本迭代學習下符號輸出:

據此進一步計算該分類誤差εm:

上述誤差率是樣本權重加權值,即樣本的平均誤差。

得到分類器hm(x)的誤差率,進一步可以衡量該分類器的權重am:

將該權重送交下一輪迭代,并重新分配樣本的權重:

其中:

當分類結果與實際結果一致時,e的指數部分為負;當分類結果與實際結果不同時,e的指數部分為正。通過權重更新,對于分類錯誤的點,將賦予更高的權重;對于分類正確的點,將降低其權重。這樣在下一輪迭代中,若之前誤判的點被分類正確,則將有可能被重新選擇。

重復式(1)~式(5),直至m=M,集成M個弱分類器構建最終強分類器H(X):

2.Logistic算法。鑒于目標變量為一個二分類變量取值,在Adaboots算法中采用Logistic回歸作為其中的分類器。Logistic模型是適合二分類問題結構的線性模型,其基本形式為:

其中,e為殘差項,且當自變量x=(x1,x2,…,xi)時,因變量y=1的概率為:E(y=1|x)=E(α+β1x1+…+βnxn)=P(y=1|x)。

3.隨機梯度算法。梯度算法在機器學習中常被用于參數的迭代估計,由于每次迭代都要遍歷m個樣本,固定梯度模型復雜度O(m)會隨樣本數和樣本維度大幅上升,減慢迭代速度。相較于固定梯度模型,Stochastic Gradient Descent(隨機梯度)在一定程度上降低了批梯度的遍歷量,復雜度從O(m)降為O(1),其算法表達式如下:

4.模型建立。

(1)根據信息增益值篩選重要維度指標。模型的一般特征工程包括缺失值處理、數據歸約、降維等步驟。由于Logistic分類時變量過多,容易造成“維度災難”、過度擬合、學習周期過長等問題,需要運用信息增益原理進行指標篩選。

表2 Credit Grade字段各等級屬性信息

樣本的信用等級從高到低用“0~8”表示,“Loan Status”中“1”代表該樣本處于違約狀態,“0”代表該樣本處于正常狀態。

計算該字段信息增益值:

用同樣的方法處理其余49個字段(分為離散型字段和連續型字段),可得到如表3和表4所示的信息增益。

表3 離散型字段信息增益

從表3可以看出,“最低社會信用評分”“是否朋友推薦”“是否獲得朋友投資”三個字段帶來的信息增益最高。表4中,由于離散化分區的大小對結果的影響較大,故其信息增益值Gain(x)與離散字段稍有不同,其中離散化后,“規則還款金額”“本金滯納損失”“規則本金還款滯納”“借款利率”四個字段帶來的增益效果均超過0.025,可將其作為自變量。

表4 連續型字段信息增益值

表5 中心化標準化后數據(部分)

(2)采用基于Logistic分類器的Adaboost迭代分類進行集訓。首先為樣本賦予初始權重:

再構建Logistic弱分類器:

通過梯度下降估計參數:

每次迭代估計利用式(11)分類錯誤率進行判斷選擇,為簡化表達式,令偏置項α=β0,j表示樣本編號,下標i表示樣本維度編號,j=1,2,…,N,i=0,1,2,…,K。

計算分類錯誤率:

更新樣本權重,重新訓練分類器:

重復式(8)~式(12)M次后,構建強學習模型:

將總樣本按照8∶2分為652個訓練樣本和162個檢測樣本后,按上述方法在訓練集上構建一個Logistic弱分類器,先給各樣本賦予初始權重:

再初始化Logistic模型自變量系數參數,經線性回歸得到偏置項和7個維度自變量系數估計值:

代入Logistic模型,進行第一次粗略判別,得到:

將訓練樣本相應變量代入式(14),得到的部分結果如表6所示。對結果取值0或者1,得到表7。

表6 初始迭代結果

表7 判別結果對照

隨機查找獲取判斷錯誤的點,如隨機獲取第144號樣本,查看原數據可知該點被誤判為1,則利用該點做第一次隨機梯度迭代,如隨機選擇梯度下降學習步長為0.2,則得到各自變量系數修正值:

繼續對結果(15)進行第二次判別,并計算第二次判別錯誤率,以錯誤率作為迭代循環結束條件。適當的條件閾值對迭代精度和節約迭代次數十分重要,通??梢栽?.3~0.6之間調整,本文取0.3。

再次通過式(14)可得到,在該參數下的判別錯誤的樣本個數為174,則判別錯誤率為:

其中w1,j為初始樣本權重,均為表示判斷錯誤的點。判別錯誤率低于0.3滿足條件跳出循環,可見由于隨機梯度的隨機性,在算法參數估計時將批梯度的復雜度O(N)降到O(1),極大地提高了大數據量處理的效率。

得到該Logistic弱分類器的判別錯誤率后,可進一步計算該分類器在Adaboost中的權重:

確定了第一個分類器權重a1后,利用a1更新樣本權重,首先計算歸一化因子Z1:

再利用歸一化因子Z1,確定樣本權重為:

重復式(14)~式(19),構建1000個Logistic弱分類器,得到各分類器的參數及權重,如表8所示。

表8 組合分類器概況(部分)

在加權Logistic回歸下,得到對應系數(β0,β1,β2,β3,β4,β5,β6,β7)=(-1.1479,-0.0857,-1.4949,-1.8405,-0.4174,0.0872,-0.0633,0.0019)。

(3)回歸準確性檢測。利用訓練數據集,得到該算法的預測情況,如表9所示??梢?,訓練數據集上的準確率為:(585-26)/652=93.71%。同樣地,利用檢測數據集得到該算法的預測情況,如表10所示??梢?,檢測數據集上的準確率為:(143+47)/162=90.74%。總體上,準確率較高,要達到更高的準確率,可調低式(16)的錯誤閾值,但要以迭代次數為代價。

表9 訓練數據預測結果

表10 檢測數據預測結果

(三)結果分析

通過美國網貸平臺高校學生借款數據可知,信息貢獻度最大的字段為“最低社會信用評分”“是否朋友推薦”“是否獲得朋友投資”“規則還款金額”“本金滯納損失”“規則本金還款滯納”“借款利率”,這些字段與借款人是否能履約還款有較高的關聯度。

四、啟示

校園貸款的對象主要是高校學生,從年齡上來講,高校學生已屬完全民事行為能力人,但一般不具備獨立的經濟能力,主要的消費經濟來源是家庭,同時也缺乏理財能力和風險意識,屬于成年人中的“弱勢群體”,在個人小額社會信貸活動中需要得到必要的保護。

1.構建家校聯合的學生網貸知情機制。網絡貸款是一種市場行為,本質上是貸款方為了獲得經濟利益進行的放貸。借款利率由交易雙方自行決定,具有市場化特點,波動性較大。過高的借款利率會給借款人帶來較大的還款壓力,容易造成借款不能及時歸還、“惡性催收”等不良后果。從保護學生角度出發,家長和學校要了解學生網絡貸款情況,對不合理的借款予以制止,支持和保護合理的借款需求。

2.網絡貸款平臺在對學生的貸款中要加強其社會支持確認。是否朋友推薦、是否獲得朋友借款是重要的信用因素,如果平臺無法了解借款人的還款能力,則可通過與借款人有過正面互動的社交伙伴獲得相關信息。因為得到朋友推薦、獲得朋友的借款,往往意味著對借款人還款能力和信用的肯定。這與Lin(2009)的“‘軟信息’在P2P網貸平臺十分重要,社交網絡資源有助于減少信息不對稱,降低借款違約概率”的研究結果一致。因此,加強借款人的平臺社會網絡認可能更好地保證借款人具備必要的還款能力,降低借款人的道德風險。

從我國情況看,拍拍貸、名校貸、我來貸、分期樂等貸款平臺要求學生注冊時填寫的信息中(見表11),身份特性指標欠缺,中性信息(無法通過該指標判斷用戶屬性,如手機、姓名、身份證號碼等)較多,但這對評估用戶信用屬性貢獻度較小。貸款平臺應在缺少借款人信用“硬指標”的情況下,采用“軟指標”(如社會網絡資源指標),以降低其違約風險。

3.把控借款用途和借款利率,建立借款風險檔案。網貸平臺要嚴格把控借款利率和借款用途兩道關,從借款利率和用途兩方面入手建立借款人的風險檔案。據統計,校園借款在創業、教育、購物方面的需求最大,借款人數分別占比31.13%、28.09%和27.09%,借款金額分別占比32.78%、27.95%、26.43%。風險最高的創業資金需求占據著重要的地位。

鑒于借款利率越高,違約概率越大,網貸平臺應對學生借款的利率予以限制,對特殊情況下的高利率借款及時進行記錄和監控。高利率借款反映出借款人對資金需求的迫切性,可能是非理性消費情況下的借款,有較高的潛在違約風險。因此,一旦借款人不能依約分期還款,就要及時了解情況,提醒干預,必要時聯系家長和學校,降低借款人違約風險。

4.盡快實現借款人社會信用信息共享。一方面,從“最低社會信用評分越高,違約概率越小”這一結果可知,過往的借貸信用積累對借款人違約風險有重要的參考作用。但目前全社會成員的借貸信用信息并沒有公開,不利于網貸平臺控制借款人違約風險。另一方面,目前我國高校學生信用狀況不容樂觀。從已公開的助學貸款信息來看,歷年借款違約率在10%以上,2002和2009年甚至達到30%以上,對學生進行信用教育迫在眉睫。實現社會信用信息共享,既對在校學生增強信用意識、培養理性消費和理財觀念有著重要作用,又有利于網貸平臺把控借款人信用狀況,降低高校學生借款違約幾率。

表11 我國校園貸平臺學生信息字段

五、不足與展望

本文基于美國Lengding Club網貸平臺數據,采用Adaboost算法對P2P校園貸款違約相關因素進行挖掘,而海量數據是數據挖掘的基礎,本文所采用的數據較為有限,加之未能采用我國校園貸款數據進行分析,得到的結果可能不夠全面。將來可進一步探討的問題還包括社會支持網絡在降低校園貸違約風險中的作用機制,在網貸活動中如何識別、評估借款人風險,以及如何建立家、校、社會聯合的風險管理機制等。無論校園貸是否還會回歸市場,也無論其是否會以一種新模式出現,數據時代為改進這一為在校學生提供大量金融服務的新工具創造了可能性。

Angilella S.,Mazzu S..The financing of innovative SMEs:A multicriteria credit rating model[J].European Journal of Operational Research,2015(3).

杜婷.基于粗糙集支持向量機的個人信用評估模型[J].統計與決策,2012(1).

李旭升,郭春香,郭耀煌.擴展的樹增強樸素貝葉斯網絡信用評估模型[J].系統工程理論與實踐,2008(6).

陳輝,任越.高校大學生信用缺失的成因及對策[J].黑龍江教育(高教研究與評估版),2009(10).

熊志斌.基于自適應遺傳模糊神經網絡的信用評估建模[J].系統仿真學報,2011(3).

熊志斌.基于非線性主成分分析的信用評估模型研究[J].數量經濟技術經濟研究,2013(10).

喻敏,吳江.基于多進化神經網絡的信用評估模型研究[J].計算機科學,2011(9).

楊勝剛,朱琦,成程.個人信用評估組合模型的構建——基于決策樹—神經網絡的研究[J].金融論壇,2013(2).

姚瀟,余樂安.模糊近似支持向量機模型及其在信用風險評估中的應用[J].系統工程理論與實踐,2012(3).

猜你喜歡
校園信息
Q爆校園
再見,我的校園
南方周末(2018-06-28)2018-06-28 08:11:04
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
校園的早晨
琴童(2017年3期)2017-04-05 14:49:04
春滿校園
開心校園
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
爆笑校園
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 99尹人香蕉国产免费天天拍| 精品人妻一区无码视频| 99re在线观看视频| 91视频精品| 国产99视频免费精品是看6| 九色国产在线| 毛片久久网站小视频| 欧美第二区| 亚洲啪啪网| 欧美亚洲欧美| 国产精女同一区二区三区久| 免费jjzz在在线播放国产| 热久久综合这里只有精品电影| 日韩美女福利视频| 国产a v无码专区亚洲av| 亚洲码在线中文在线观看| 成人夜夜嗨| 久久无码高潮喷水| 国产精品成人观看视频国产| 成年人久久黄色网站| 青青久久91| 亚洲一级色| 91毛片网| 久精品色妇丰满人妻| 日本www在线视频| 人妻无码中文字幕一区二区三区| 亚洲色图欧美激情| jizz在线观看| 国产精品亚洲一区二区在线观看| 91九色视频网| 日韩二区三区| 国产成人h在线观看网站站| 国产女人在线观看| 亚洲天堂在线免费| 亚洲a级在线观看| 日韩精品亚洲人旧成在线| 伊人久久久大香线蕉综合直播| 国产一区二区三区日韩精品| 青青草国产在线视频| 国产男女XX00免费观看| 无码精品国产dvd在线观看9久| 曰AV在线无码| 波多野结衣无码中文字幕在线观看一区二区 | 54pao国产成人免费视频| 伊人精品视频免费在线| 亚洲精品无码久久毛片波多野吉| 日韩大乳视频中文字幕| 久久精品亚洲专区| 在线观看无码a∨| 中文字幕 91| 亚洲女人在线| 国产内射一区亚洲| 国产亚洲欧美在线视频| 国产在线八区| 亚洲国产欧洲精品路线久久| 午夜日b视频| 五月婷婷导航| 日韩精品专区免费无码aⅴ| 欧美精品一区二区三区中文字幕| 欧美不卡在线视频| 欧美激情伊人| 国产白浆视频| 成人精品在线观看| 日韩午夜片| 亚洲人成高清| 理论片一区| 日本免费新一区视频| 青青草原国产免费av观看| 欧美自慰一级看片免费| 99国产在线视频| 国产亚洲精品资源在线26u| 久久婷婷五月综合色一区二区| 日本黄色a视频| 日韩国产高清无码| 色婷婷电影网| 一级毛片高清| 精品福利视频导航| 国产一级精品毛片基地| 亚洲AV无码不卡无码| 日本午夜在线视频| 亚洲AⅤ无码国产精品| 久久综合九色综合97婷婷|