個(gè)人網(wǎng)絡(luò)信貸平臺(tái)在為投融資者提供便捷的渠道與服務(wù),為個(gè)人投資者將閑置資金通過互聯(lián)網(wǎng)平臺(tái)借給資金短缺者提供了新的途徑。但是,近年來由于信貸平臺(tái)不規(guī)范、個(gè)人信用體系不健全等原因,網(wǎng)貸平臺(tái)市場出現(xiàn)了巨大的違約風(fēng)險(xiǎn)。本文采取定性與定量相結(jié)合的方法,從借款人信用信息入手,通過信息價(jià)值和共線性診斷篩選出適當(dāng)?shù)闹笜?biāo)變量,將原始數(shù)據(jù)以WOE替代代入Logistic回歸模型,根據(jù)回歸結(jié)果評(píng)判其信用風(fēng)險(xiǎn)的大小。通過構(gòu)建模型對(duì)個(gè)人網(wǎng)絡(luò)信貸平臺(tái)的借款者信用信息風(fēng)險(xiǎn)進(jìn)行量化評(píng)估,為網(wǎng)絡(luò)信貸平臺(tái)的參與者提供有效的信用風(fēng)險(xiǎn)評(píng)估方法。
在眾多的評(píng)級(jí)模型中,邏輯回歸使用率占絕對(duì)優(yōu)勢。然而,該模型在實(shí)際運(yùn)用中存在著諸多缺陷,由于真實(shí)數(shù)據(jù)的采集質(zhì)量比較差導(dǎo)致模型偏差較大,需要新的方法來解決。信息論中相對(duì)熵的運(yùn)用,使得違約樣本分布與正常樣本分布之間的距離的刻畫更為精確,恰好解決邏輯回歸運(yùn)用中的問題,即將證據(jù)權(quán)重(weight of evidence,簡稱WOE)和邏輯回歸結(jié)合起來。

WOE反映的是債務(wù)人正常還款概率與債務(wù)人違約概率自然對(duì)數(shù)之比,WOE的增加意味著違約風(fēng)險(xiǎn)的降低。


根據(jù)國內(nèi)著名個(gè)人網(wǎng)絡(luò)信貸平臺(tái)紅嶺創(chuàng)投網(wǎng)站公布的2012年—2016年的借款信息,其中違約借款信息選擇2012—2016年公布的信貸黑名單。將收集的樣本經(jīng)過重復(fù)剔除和完整性篩選后,保留1382筆貸款數(shù)據(jù)作為進(jìn)入模型回歸擬合的總樣本,其中1152筆貸款數(shù)據(jù)為訓(xùn)練樣本,348筆貸款數(shù)據(jù)作為測試樣本。
(1)首先計(jì)算IV值與WOE值,并對(duì)指標(biāo)進(jìn)行分組
本文抓取了借貸信息包括借款金額、年利率、借款期限、借款類型、還款方式、投標(biāo)筆數(shù)、會(huì)員等級(jí)、借入信用、借出信用、還款狀態(tài)以及各項(xiàng)資料的審核認(rèn)證等19個(gè)變量。由于指標(biāo)較多,以借款金額為例。采集1152條數(shù)據(jù),其中好客戶960個(gè),壞客戶192個(gè)。Good表示好客戶個(gè)數(shù),Bad表示壞客戶個(gè)數(shù),P1=Gi/G表示第i區(qū)間好客戶與總體好客戶的比重,P0=Bi/B表示第i區(qū)間壞客戶與總體壞客戶的比重。具體分組如下:

表1 借款金額4組
通過對(duì)比發(fā)現(xiàn),將借款金額分為4組時(shí),IV值最大,因此借款金額的合理分組為4組。
(2)通過IV值與共線性診斷剔除指標(biāo)變量
IV值即為信息價(jià)值,借鑒FICO等機(jī)構(gòu)的使用經(jīng)驗(yàn),取舍閥值設(shè)為0.03,當(dāng)IV值大于0.03且小于0.18時(shí),該指標(biāo)變量區(qū)分度有限,可排除該指標(biāo);當(dāng)IV值大于0.18時(shí),則認(rèn)為指標(biāo)變量是有區(qū)分度的。經(jīng)過數(shù)據(jù)處理以及可操作性計(jì)算,共有以下9種指標(biāo)變量被選出來,其總IV值如下表2所示。

表2 初選指標(biāo)變量及總IV值
將經(jīng)過IV值剔除的指標(biāo)變量進(jìn)行共線性診斷。經(jīng)過多重共線性回歸分析結(jié)果可知,這些指標(biāo)之間存在多重共線性。經(jīng)過逐步回歸法分析,年利率、借款金額、逾期未還筆數(shù)、準(zhǔn)時(shí)還款筆數(shù)、借款筆數(shù)以及是否有收入證明6個(gè)變量通過檢測。
(3)模型系數(shù)的綜合檢驗(yàn)
將各組的WOE值代替原值代入Logistic模型中,反復(fù)比較各模型之間的運(yùn)行結(jié)果,最終利用向前——LR的方法確定最終的模型版本,其結(jié)果顯示,參數(shù)整體是顯著不為0的,p值都低于0.05的顯著性水平,參數(shù)估計(jì)效果較好;而經(jīng)修正的R方等于0.875,數(shù)據(jù)較高,可以接受該模型擬合性;以0.05作為置信水平,6個(gè)指標(biāo)變量都通過了wald假設(shè)檢驗(yàn),被保留在模型之中。即該模型同時(shí)通過了參數(shù)整體檢驗(yàn)、擬合優(yōu)度的檢驗(yàn)和wald假設(shè)檢驗(yàn)。通過數(shù)據(jù)處理和模型檢驗(yàn)得到的回歸結(jié)果,6個(gè)變量對(duì)能否成功借款均有顯著的影響。得到的樣本模型為:

從上述模型中可以看出,借款準(zhǔn)時(shí)還款筆數(shù)對(duì)借款人的信用風(fēng)險(xiǎn)影響最大,借款金額、年利率、投標(biāo)筆數(shù)、逾期未還筆數(shù)以及是否有收入證明對(duì)借款人的信用風(fēng)險(xiǎn)影響較大。
(4)對(duì)訓(xùn)練樣本進(jìn)行檢驗(yàn)
本文確定最優(yōu)分割點(diǎn)的方法是通過ROC曲線偏離度最大的一點(diǎn)來確定的,即在此概率下,所抓取的好客戶的比例與壞客戶比例的差值達(dá)到最大,此時(shí)是最優(yōu)的切割點(diǎn)。
訓(xùn)練樣本ROC曲線下方的面積為0.948,擬合效果非常好,其顯著性較為明顯,通過檢驗(yàn),能夠顯著區(qū)分好壞客戶。
擬合過程太多,中間過程的靈敏度與特異度使用省略號(hào)省略,根據(jù)靈敏度與特異度的乘積最大的原則,計(jì)算得出0.872*(1-0.052)=0.82557,其對(duì)應(yīng)的概率值為0.802433,即為最佳分割點(diǎn)。因此,當(dāng)返回概率大于0.802433時(shí),客戶將被模型預(yù)測為好客戶,當(dāng)返回概率小于0.802433時(shí),則被預(yù)測為壞客戶。

圖1 訓(xùn)練樣本的ROC曲線
(5)對(duì)模型進(jìn)行檢驗(yàn)
由表3可知,該模型對(duì)訓(xùn)練樣本的總體預(yù)測準(zhǔn)確率達(dá)到86.45%,其中192個(gè)壞客戶中,只有8個(gè)壞客戶被誤判為好客戶,正確識(shí)別率達(dá)到95.83%;960個(gè)好客戶中,有162個(gè)好客戶被誤判為壞客戶,正確識(shí)別率為84.58%。

表3 訓(xùn)練樣本回帶檢驗(yàn)預(yù)測準(zhǔn)確性
(6)模型預(yù)測準(zhǔn)確度測試
為進(jìn)一步說明模型的區(qū)分能力,選取348個(gè)測試樣本,經(jīng)過上述數(shù)據(jù)處理過程,代入模型,得到的ROC曲線下方的面積為0.972,擬合效果較好,其顯著性也通過相關(guān)檢驗(yàn).
同時(shí),該模型對(duì)測試樣本的總體預(yù)測準(zhǔn)確率達(dá)到94.25%,如下表4所示。

表4 測試樣本回帶檢驗(yàn)預(yù)測準(zhǔn)確性
測試樣本的判斷結(jié)果與訓(xùn)練樣本的預(yù)測準(zhǔn)確率基本一致,預(yù)測準(zhǔn)確度高,模型穩(wěn)定,證據(jù)權(quán)重邏輯回歸模型具有推廣應(yīng)用的價(jià)值。
經(jīng)檢驗(yàn)?zāi)P陀泻芎玫念A(yù)測效果,同時(shí)得到以下一些結(jié)論:
(1)在所有影響較大的變量中,有借款金額、年利率、投標(biāo)筆數(shù)、否有收入證明以及準(zhǔn)時(shí)還款筆數(shù)都與借款成功率成正比,且準(zhǔn)時(shí)還款筆數(shù)對(duì)借款成功率的影響最大,僅逾期還款筆數(shù)呈負(fù)相關(guān)。
(2)由于其客觀不可獲得性而被剔除的部分變量,可能是借款成功率較有影響的因素,信貸平臺(tái)應(yīng)加強(qiáng)信用信息的審核與完善,模型預(yù)測應(yīng)進(jìn)行動(dòng)態(tài)更新,以提高其實(shí)用價(jià)值。
(3)對(duì)模型進(jìn)行測試需要更多的樣本數(shù)據(jù)支持,對(duì)模型也需要不斷測試和調(diào)整,在正確率有所保障的前提下再代入測試樣本做回帶檢驗(yàn),以達(dá)到更好的預(yù)測效果。
基于上述結(jié)論,本文針對(duì)性的對(duì)網(wǎng)貸平臺(tái)的發(fā)展提出下列相關(guān)建議。
(1)建設(shè)平臺(tái)信息核實(shí)制度
首先是網(wǎng)貸平臺(tái)對(duì)個(gè)人信用信息的真實(shí)性核實(shí)與驗(yàn)證,應(yīng)建立和完善個(gè)人網(wǎng)貸平臺(tái)的個(gè)人信息登記與管理制度。其次是審核借款者的信用信息,理性分析借款金額、年利率等因素,正確處理借款者的借款行為。最后是平臺(tái)應(yīng)建立信用信息動(dòng)態(tài)監(jiān)控機(jī)制,定期要求借款者更新相關(guān)信用信息,掌控違約風(fēng)險(xiǎn)。
(2)成立行業(yè)協(xié)會(huì)規(guī)范平臺(tái)運(yùn)營
成立個(gè)人網(wǎng)絡(luò)信貸行業(yè)協(xié)會(huì),制定相關(guān)行業(yè)準(zhǔn)則,并將制定好的行業(yè)準(zhǔn)則與有關(guān)金融機(jī)構(gòu)溝通,促使機(jī)構(gòu)立法保證行業(yè)監(jiān)管;個(gè)人網(wǎng)貸平臺(tái)管理機(jī)構(gòu)應(yīng)該建立信息共享平臺(tái),對(duì)外公布的數(shù)據(jù)應(yīng)統(tǒng)一全面,結(jié)構(gòu)體系完整。
(3)完善政府監(jiān)管體系
完善政府監(jiān)管體系應(yīng)當(dāng)從以下幾個(gè)方面入手:第一,政府推動(dòng)第三方機(jī)構(gòu)成立,對(duì)個(gè)人網(wǎng)貸平臺(tái)資金進(jìn)行托管與監(jiān)督,對(duì)個(gè)人網(wǎng)貸平臺(tái)的賬務(wù)及借款者資料進(jìn)行獨(dú)立審計(jì),保障平臺(tái)運(yùn)作流程的合法合理性。第二,完善社會(huì)征信系統(tǒng)。加快政府各部門信息化,采集完整的個(gè)人信息、住房公積金、社保等公共事業(yè)單位記錄,實(shí)現(xiàn)借款者信用信息聯(lián)網(wǎng)化,控制平臺(tái)信用風(fēng)險(xiǎn)。第三,目前個(gè)人網(wǎng)貸平臺(tái)尚未接入央行征信系統(tǒng),應(yīng)促使人民銀行、銀監(jiān)會(huì)、證監(jiān)會(huì)等部門建立個(gè)人評(píng)級(jí)體系,高等級(jí)平臺(tái)可優(yōu)先接入央行征信系統(tǒng)。第四,政府應(yīng)主導(dǎo)制定相關(guān)法律措施對(duì)違約行為進(jìn)行處罰并公示,解決個(gè)人網(wǎng)貸平臺(tái)借款者違約成本低的難題,降低違約率。
(南京航空航天大學(xué)經(jīng)濟(jì)與管理學(xué)院,江蘇 南京 210016)
[1] 張婧婕. P2P網(wǎng)貸成功率影響因素實(shí)證研究 [D].陜西師范大學(xué),2015.
[2] 李孟來. 我國個(gè)人信用評(píng)分模型的應(yīng)用探討 [J]. 金融管理與研究:杭州金融研修學(xué)院學(xué)報(bào),2009,2):52-4.
[3] 甘信軍,楊維強(qiáng). 證據(jù)權(quán)重方法與信用風(fēng)險(xiǎn)控制 [J]. 山東大學(xué)學(xué)報(bào)(理學(xué)版),2014,49(12):55-9.
[4] 史小康,何曉群. 有偏logistic回歸模型及其在個(gè)人信用評(píng)級(jí)中的應(yīng)用研究 [J]. 數(shù)理統(tǒng)計(jì)與管理,2015,34(6):1048-56.