劉揚+姬建華
摘 要 當前互聯網金融高速發展的背景下,在地區性貸款主體中,始終存在無法準確應用大數據提升自身經營發展的現象,制約著自身的業務規模和風控質量。大數據在傳統貸款中的應用,重點在于第三方反欺詐準入、信用風險規范、貸中預警管理等方面。除了構建傳統信貸模型,還要構建非金融數據的風控模型,多種強弱變量結合進行風險建模,降低變量缺失給模型帶來影響,同時最大程度解決傳統貸款存在的制約問題。
關鍵詞 傳統貸款風控;大數據風控
中圖分類號 G2 文獻標識碼 A 文章編號 1674-6708(2018)204-0119-02
1 傳統貸款風控模型缺點
1)傳統貸款風控模型基于人行征信數據建立,構建了客戶與金融機構間的借貸關系,包括信用額度、逾期記錄、還款記錄、使用額度比例、壞賬記錄、記錄時間等,其中最為重要的變量是各種還款逾期、不良及壞賬的數據。但是金融數據模型中僅有十幾項變量,任何變量的缺失,可能都會導致模型失效。
2)截至2015年4月底,人行征信系統已經收錄的自然人數達到8.64億,企業及其他組織數量達到2 068萬戶,其中有信貸記錄的自然人有3.61億人,有中征碼的企業及商戶組織有1 023萬戶,全國仍有近10億無借貸記錄的個人無法進行有效信用評估。
所以,需要通過大數據將消費、日常閱讀、娛樂、社交等相對較強或較弱的變量相結合,進行風險建模,延伸征信數據的廣度,以及降低部分變量的缺失或失真對模型的穩定性影響。
2 數據來源與存儲
2.1 大數據的來源
數據獲取的類別包含3類,分別是客戶黑名單數據、客戶行為數據、客戶基本社會特征數據。其中客戶黑名單數據包含了客戶的風險名單信息、多頭借貸信息、黑產信息、黑中介信息、第三方信用評分以及失信被執行和人行征信的數據,客戶行為數據通過分析客戶的運營商數據、社交數據及消費數據判斷客戶行為狀況,客戶基本社會特征數據將通過公開可查詢到的社保信息、公積金信息、公檢法公開數據等方面獲取。
其中在客戶黑名單數據獲取方面,結合企業自身切實的科技實力,采用對接第三方大數據風控平臺及申報對接人行征信系統的方式,快速、全面、集中的查詢客戶黑名單信息;在客戶行為數據方面,可通過運營商、電商數據爬取授權,分析客戶的還款能力與消費習慣,同時也以此確定客戶的生活圈、真實住址、緊急聯系人等數據;在客戶基本社會特征數據方面,采用對接已實現爬取不同地區政府公開數據的服務商,快捷滿足政府公開數據的收集。
在上述這些數據來源獲取和合作的同時,要注意只能通過合規的手段獲取數據,并與客戶之間建立清晰的權利義務說明,保護客戶隱私以及正確使用合作來源的數據。當線上數據獲取受限時,通過線下由客戶主動提供數據的方式仍是有效的一種,此時盡職調查、外訪核實、資料鑒真工作將是重點。
2.2 客戶唯一標識與標簽化存儲
在數據獲取之后,如何合理組織客戶數據與建立存儲模型是大數據存儲過程中的關鍵。該過程中,客戶唯一標識、數據整合規則是首先要確定的。一般以客戶的名稱、證件類型、證件號碼的組合為關鍵識別屬性,通過關鍵識別屬性的對比確定唯一客戶或者相似客戶,之后結合信息覆蓋與歸并的規則,將客戶信息更新與整合。除此之外,黑名單的建立與舊數據標識要同步進行,只有這樣才能在數據整合過程中保證客戶信息的時效與健全。
當客戶數據增長以千的單位時,對客戶的標簽化分類是精準管理客戶的必經階段。可以通過設置維度的不同分值,系統自動評判部分維度分值,如消費能力、收入、社交偏好、家庭結構等。最終會成總分值,比對模型分值的區間特點預測用戶的還款能力與消費需求。
3 實際應用
3.1 反欺詐準入
一旦審批通過惡意欺詐的借款,那么該筆借款的不良逾期風險極高,還款意愿也極低。通常情況下,因為違約成本的存在,以惡意欺詐為出發點的客戶,提交的資料不是與自己相關、真實的。并且現在貸款進件中的欺詐行為,往往是多人配合、有計劃進行。所以,通過大數據識別惡意欺詐客戶,是大數據建立風控模型的重中之重,也是進件準入標準的重要組成部分。
3.1.1 客戶唯一標識是反欺詐的前提
因為貸款違約成本的存在,客戶填寫自身的真實資料,再將欺詐作為目的的借款只占到極少數,畢竟國家在社會信用體系的建設越來越完善,自身的信用重要程度越來越高,沒有人會不關心自身的信用狀況。所以通過大數據識別出進件信息是借用、偽造他人的信息是先行條件,以此過濾掉絕大多數的欺詐申請。因為客戶唯一標識是反欺詐的前提。
3.1.2 客戶唯一標識在反欺詐中的運用
客戶唯一標識初級的組合是客戶名稱、證件類型、證件號碼的搭配,之后通過實名手機號、銀行卡號或人臉數據等其他唯一ID擴展客戶唯一標識,豐富客戶唯一識別的屬性,這樣將在識別客戶欺詐時增加唯一識別的成功率,及時發現及拒絕準入,設置風控的第一層防火墻。
另外,在客戶唯一識別后,客戶相關的動態信息將為準入提供判斷。比如一段時期內多次申請貸款,通過同一設備向多家貸款機構申請貸款,在一段時期內更換過多部手機或地址,貸款填寫個人的地址與實際地址間隔極遠等等這些情況,都將通過客戶相關聯的動態信息知悉,拒絕該客戶的進件,并加入系統黑名單中。
在業內的統計中,四要素、三要素屬實提供的客戶,欺詐的概率不到1/3。短期內多次申請超過5次的客戶,欺詐率將是正常群體的3.2倍之多。申請時填寫的地址與實際住址距離超過22公里以上的客戶,欺詐的概率是最高的。
3.2 信用風險防范規范
經過業內統計數據顯示,因為有欺詐行為的客戶都是相對固定的,所以,在欺詐客戶黑名單積累過程中,數量將越來越趨向于穩定,這部分人的欺詐成功率將降到最低。但是因為家庭變故、工作不穩定等個人情況的出現,原先沒有欺詐風險的客戶出現欺詐傾向,這部分的預防將需要時效性更強、行為數據更廣的數據來擴充客戶數據維度,完善更全面的風控模型系統。endprint
所以,風控模型要控制的階段不僅僅是貸前進件的階段,同時要在貸中與貸后兩個環節都要參與,并且提供更深層次的數據挖掘與動態分析,降低因信用風險造成的企業損失,鞏固企業穩定發展、盈利的目標。這也是信用風險防范規范要說明的核心內容。
3.2.1 行為數據的深層挖掘
進件時風控審批時,都要對客戶本身的信用風險做分析,就是對客戶的還款能力與還款意愿做評估。因為信用風險將會隨著時間的變化出現波動,所以貸后中要重點把控客戶信用風險的變化,最有效的手段就是對客戶行為數據的更深的挖掘與分析。一般的做法會通過分析客戶較全面的行為數據,從中挖掘歸納出主要的規律,以此判斷客戶近期的信用風險波動是否會達到這一規律,發生信用風險。
3.2.2 行為數據的動態監測
動態檢測客戶行為數據,可以通過以下幾方面進行,比如用戶的通話記錄、消費、收支變化、出行路線、社交動態等,保證分析數據的真實、客觀、全面,生成客戶信用風險波動報告。
業內分析數據表明,有以下特征的客戶違約出現信用風險的幾率低,包括出行方式選擇商務類座位,飛機、高鐵為主且次數一年超過4次以上,在居住地消費高,對財經信息關注高,使用固定手機號等特征。而有以下特征的客戶違約出現信用風險的幾率高,包括短期內頻繁信用卡取現,網絡游戲花費接近收入等特征。
總體來看,還款意愿較強的客戶大多受教育程度高、道德水平也較高,而消費水平與收入不匹配,且消費方向并非用于提升收入水平的客戶還款能力有風險。大數據在貸中管理階段的重要性已經超過了貸前進件審批,所以信用風險防范規范中重要的一部分在于利用大數據監控客戶信用風險變化。
3.3 貸中預警管理及催收處理
3.3.1 建立風險識別預警機制
利用大數據及時監測客戶信用風險的變化,監測收支變化、負債新增、社交狀態異常等維度變動,建立自動信用風險識別與預警機制,信用風險發生前完成預警,及早進行風險處理,減少人工參與,提高貸中管理效率。
3.3.2 建立客戶緊急聯系人庫
貸款業務中壞賬的出現通常是由于客戶的失聯導致的。在貸前進件時,對客戶緊急聯系人庫的建立應當已經開始進行。在這個過程中,大數據發揮的最大作用,是構成緊急聯系人交叉關聯網狀模型,對無法直接聯系到客戶通過多人的轉接建立再聯系,重新建立起與客戶的聯系,之后進行催還借款,降低失聯帶來的損失。而且,根據業內的數據統計,電話聯系借款人的觸達率遠高于其他通訊方式,仍然是最重要的催收手段。
3.3.3 不良債權的處理
催收效果不明顯或者沒有合適的催收機構,且企業有資產出表需求時,一般貸款機構會將這些不良債權進行轉賣或者證券化。此類做法的核心就是風險的定價模型,但當前行業標準中風險定價體系仍舊是一片空白,不能在這一點上企業的需求,在大數據風控的運用中,可以嘗試去進行原型的建立。
參考文獻
[1]中國人民銀行調查統計司 http://www.pbc.gov.cn/ diaochatongjisi/116219/index.html
[2]全國集中統一的企業和個人征信系統簡介http://www. pbccrc.org.cn/zxzx/zxzs/201506/d708068ce66c4cd6bbd 5c37884b93c05.shtml.endprint