999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基本征信數(shù)據(jù)挖掘分析

2015-08-10 17:07:01楊北京劉新海
現(xiàn)代管理科學(xué) 2015年8期
關(guān)鍵詞:數(shù)據(jù)挖掘

楊北京 劉新海

摘要:文章首先介紹數(shù)據(jù)挖掘的基本概念和處理步驟,然后討論征信系統(tǒng)和數(shù)據(jù)挖掘的關(guān)系,認(rèn)為征信機(jī)構(gòu)作為數(shù)據(jù)工廠,數(shù)據(jù)挖掘的各種方法都可以找到很好的應(yīng)用場(chǎng)景,通過(guò)廣泛和深入地開展征信數(shù)據(jù)挖掘,能夠更好地為量化信用風(fēng)險(xiǎn)管理服務(wù)。文章梳理出征信系統(tǒng)數(shù)據(jù)挖掘的基本框架,著重探討基本征信數(shù)據(jù)挖掘:一方面處理的是基于信貸行為的基本數(shù)據(jù);另一方面應(yīng)用的是基本的、傳統(tǒng)的數(shù)據(jù)挖掘方法。根據(jù)數(shù)據(jù)挖掘方法論的不同,文章介紹相應(yīng)的信用風(fēng)險(xiǎn)數(shù)據(jù)挖掘應(yīng)用,并結(jié)合國(guó)際征信機(jī)構(gòu)的先進(jìn)經(jīng)驗(yàn),給出具體應(yīng)用案例。文章最后指出在征信機(jī)構(gòu)全面開展數(shù)據(jù)挖掘的工作,不僅可以提高征信服務(wù)水平,還可為大數(shù)據(jù)時(shí)代的到來(lái)打下良好的基礎(chǔ)。

關(guān)鍵詞:數(shù)據(jù)挖掘;征信系統(tǒng);信貸行為;信用風(fēng)險(xiǎn)管理

一、 問(wèn)題的提出

數(shù)據(jù)挖掘(Data Mining,DM)又稱知識(shí)發(fā)現(xiàn)(Knowledge Discover in Database,KDD),是指從數(shù)據(jù)集合的海量數(shù)據(jù)中揭示出隱含的模式、發(fā)現(xiàn)先前未知的并有潛在價(jià)值的信息和知識(shí)的過(guò)程(Jiawei Han,MichelineKamber,Jian Pei;2012)。由于數(shù)據(jù)挖掘在應(yīng)用過(guò)程中可以幫助商業(yè)決策這調(diào)整市場(chǎng)策略,評(píng)估風(fēng)險(xiǎn),獲得洞察力并進(jìn)行正確決策,目前已經(jīng)是人工智能和數(shù)據(jù)庫(kù)領(lǐng)域研究的熱點(diǎn)問(wèn)題。隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)挖掘技術(shù)已成為許多互聯(lián)網(wǎng)和零售企業(yè)的重要支撐技術(shù)和核心競(jìng)爭(zhēng)力之一,并被廣泛地應(yīng)用到管理和社會(huì)學(xué)科等諸多領(lǐng)域。對(duì)作為天然就具有大數(shù)據(jù)和云計(jì)算特征的征信業(yè)而言,數(shù)據(jù)挖掘技術(shù)的地位和重要性不言而喻。目前國(guó)外征信機(jī)構(gòu)正在廣泛利用數(shù)據(jù)挖掘技術(shù),進(jìn)行信用風(fēng)險(xiǎn)管理方面的產(chǎn)品開發(fā),申請(qǐng)了許多關(guān)于數(shù)據(jù)挖掘的專利授權(quán),并開發(fā)出多種數(shù)據(jù)挖掘產(chǎn)品。數(shù)據(jù)挖掘技術(shù)已經(jīng)成為它們的核心競(jìng)爭(zhēng)力,例如益佰利(Experian)、艾克飛(Equifax)、環(huán)聯(lián)(Trans Union)和鄧白氏(Dun & Bradstreet,D&B)等。

結(jié)合信用風(fēng)險(xiǎn)管理的目標(biāo):對(duì)個(gè)人消費(fèi)者和企業(yè)的風(fēng)險(xiǎn)進(jìn)行評(píng)估,減少交易過(guò)程中的信息不對(duì)稱,本文將征信數(shù)據(jù)挖掘的基本步驟敘述如下:

步驟一:確定商業(yè)目標(biāo)。該步驟主要是確定數(shù)據(jù)挖掘所要解決的具體問(wèn)題,比如發(fā)現(xiàn)信用風(fēng)險(xiǎn)特征、欺詐風(fēng)險(xiǎn)特征、客戶流失特征等;確定征信數(shù)據(jù)挖掘問(wèn)題的覆蓋范圍,比如房貸產(chǎn)品、信用卡產(chǎn)品或汽車貸款產(chǎn)品等。商業(yè)目標(biāo)不僅指明了數(shù)據(jù)挖掘方向,也是衡量數(shù)據(jù)挖掘效果的關(guān)鍵要素。

步驟二:數(shù)據(jù)采集。首先確定數(shù)據(jù)挖掘所涉及的具體數(shù)據(jù)庫(kù)或者數(shù)據(jù)來(lái)源渠道,例如申請(qǐng)數(shù)據(jù)庫(kù)、客戶基本信息數(shù)據(jù)庫(kù)、交易數(shù)據(jù)庫(kù)、市場(chǎng)營(yíng)銷數(shù)據(jù)等,其次確定通過(guò)何種技術(shù)手段獲取這些有用的數(shù)據(jù)以及數(shù)據(jù)的有效期。

步驟三:數(shù)據(jù)清洗。消除噪聲和刪除不一致的數(shù)據(jù),進(jìn)行數(shù)據(jù)質(zhì)量檢查,確保數(shù)據(jù)可靠。數(shù)據(jù)質(zhì)量是數(shù)據(jù)挖掘的前提和生命。若數(shù)據(jù)質(zhì)量不高,即使數(shù)據(jù)挖掘的技術(shù)再先進(jìn),耗費(fèi)的功夫再大也無(wú)濟(jì)于事。

步驟四:數(shù)據(jù)整合和轉(zhuǎn)換。即將多種數(shù)據(jù)源整合在一起,把數(shù)據(jù)變換和統(tǒng)一成適合挖掘的形式,例如數(shù)據(jù)類型和數(shù)據(jù)格式的轉(zhuǎn)換,缺省值和極值的處理。

步驟五:數(shù)據(jù)挖掘。使用模式識(shí)別或機(jī)器學(xué)習(xí)的方法以及計(jì)算機(jī)信息處理手段,對(duì)大量數(shù)據(jù)進(jìn)行加工和分析,來(lái)提取數(shù)據(jù)模式或者是系統(tǒng)性的模型。數(shù)據(jù)挖掘既高度依賴先進(jìn)的統(tǒng)計(jì)方法和計(jì)算機(jī)技術(shù),也高度依賴數(shù)據(jù)分析人員的專業(yè)知識(shí)和經(jīng)驗(yàn)。這是數(shù)據(jù)挖掘的核心。

步驟六:性能評(píng)判。并不是所有挖掘出來(lái)的模式或者模型都是有效的,根據(jù)某種指標(biāo)度量(顯著性檢驗(yàn)、準(zhǔn)確性檢驗(yàn)或者某種測(cè)度),確定挖掘結(jié)果是合乎邏輯、合乎情理和合乎直覺(jué)的。

步驟七:將數(shù)據(jù)挖掘的結(jié)果用于決策分析。根據(jù)數(shù)據(jù)挖掘的結(jié)果做出相應(yīng)的決策建議,例如改進(jìn)風(fēng)險(xiǎn)管理策略、改進(jìn)市場(chǎng)營(yíng)銷策略、改進(jìn)客戶服務(wù)策略等,以提高經(jīng)營(yíng)管理的效益,實(shí)現(xiàn)數(shù)據(jù)挖掘的商業(yè)價(jià)值。

步驟八:數(shù)據(jù)挖掘結(jié)果應(yīng)用。挖掘所獲得知識(shí)(模式、模型、規(guī)律、策略等),最終需要付諸于應(yīng)用,以產(chǎn)生現(xiàn)實(shí)的經(jīng)濟(jì)效益。往往通過(guò)挖掘人員和IT技術(shù)人員合作,開發(fā)一些計(jì)算機(jī)應(yīng)用系統(tǒng)來(lái)實(shí)現(xiàn)。

步驟九:數(shù)據(jù)挖掘的跟蹤和提高。數(shù)據(jù)挖掘是一個(gè)不斷發(fā)現(xiàn)、不斷總結(jié)、不斷提高的過(guò)程。需要對(duì)數(shù)據(jù)挖掘的應(yīng)用進(jìn)行跟蹤和反饋,分析問(wèn)題,提煉經(jīng)驗(yàn),并且不斷地更新迭代。例如個(gè)人信用評(píng)分的模型每年都要重新挖掘和訓(xùn)練。

二、 數(shù)據(jù)挖掘技術(shù)在對(duì)外的風(fēng)險(xiǎn)管理服務(wù)中的應(yīng)用

1. 聚類分析在對(duì)外的風(fēng)險(xiǎn)管理服務(wù)中的應(yīng)用。聚類分析(Clustering Analysis),也稱為自動(dòng)分類,利用信用主體的信貸行為特征,根據(jù)(信貸行為、風(fēng)險(xiǎn)模式、信用主體基本信息)相似性的原則,自動(dòng)歸類,劃分信用主體群(也稱為類)。信用主體的類可以描述一種特定的信用風(fēng)險(xiǎn)模式。聚類分析是面向信用風(fēng)險(xiǎn)管理的數(shù)據(jù)挖掘的基本方法。

在征信服務(wù)中的應(yīng)用:

(1)信用主體細(xì)分,金融學(xué)的微觀基礎(chǔ)是行為科學(xué),無(wú)論公司行為或者是個(gè)人行為都具有一致性的特點(diǎn),所以風(fēng)險(xiǎn)管理一直做的工作,就是試圖通過(guò)對(duì)公司、個(gè)人行為的分析來(lái)預(yù)判公司、個(gè)人的違約前景,并為此開發(fā)出一系列的風(fēng)險(xiǎn)模型,輔助授信決策。相對(duì)于公司客戶,個(gè)人客戶的行為更具有一致性和可預(yù)測(cè)性。俗話說(shuō),江山易改,本性難移,指的就是性格傾向的穩(wěn)定性和連續(xù)性。要直接在性格傾向于行為模式之間建立對(duì)應(yīng)關(guān)系,并不是很容易的事情,替代的方法就是分群,物以類聚,人以群分,只要把每個(gè)人所屬的人群類別定位準(zhǔn)確,要預(yù)測(cè)其行為模式就比較容易。從統(tǒng)計(jì)分析看,特定人群的行為模式就有很高的同質(zhì)性,換言之,不同人群在行為模式上有著明顯的差別。根據(jù)不同的人群有著不同的風(fēng)險(xiǎn)模式,通過(guò)聚類分析,實(shí)現(xiàn)對(duì)不同的人群進(jìn)行不同的信用風(fēng)險(xiǎn)管理,可以結(jié)合風(fēng)險(xiǎn)規(guī)則,通過(guò)聚類分析,將個(gè)人信用主體分為老齡消費(fèi)群體、高凈值客戶群體、80/90后消費(fèi)群體和新興城鎮(zhèn)居民群體,然后進(jìn)行各自的風(fēng)險(xiǎn)模式分析。此外通過(guò)聚類分析,可以發(fā)現(xiàn)一些新的信用主體的行為模式,例如技術(shù)創(chuàng)新性企業(yè)會(huì)出現(xiàn)不同于一般企業(yè)的信貸行為,這就可能對(duì)應(yīng)著新的信用風(fēng)險(xiǎn)模式的出現(xiàn)。社會(huì)發(fā)展趨勢(shì)客戶細(xì)分客戶需求老齡消費(fèi)者群體新興城鎮(zhèn)居民群體80/90后消費(fèi)群體高凈值客戶群體低風(fēng)險(xiǎn)保本型的銀行產(chǎn)品對(duì)現(xiàn)有社保、醫(yī)保有效補(bǔ)充的社保產(chǎn)品醫(yī)療服務(wù)和生活服務(wù)更豐富的理財(cái)產(chǎn)品以咨詢?yōu)閷?dǎo)向個(gè)性化的服務(wù)家族財(cái)富管理追求個(gè)性化、新鮮的金融產(chǎn)品互動(dòng)式的7x24網(wǎng)銀服務(wù)移動(dòng)金融服務(wù)人口老齡化富裕階層擴(kuò)大80/90后消費(fèi)群體不斷壯大農(nóng)村城鎮(zhèn)化和城鄉(xiāng)一體化低費(fèi)用無(wú)抵押貸款,新型農(nóng)村信用貸款有農(nóng)村特色的理財(cái)產(chǎn)品和中間業(yè)務(wù)

(2)欺詐檢測(cè)。反欺詐是信用風(fēng)險(xiǎn)管理中的重要內(nèi)容,結(jié)合專家規(guī)則,聚類算法可以用于挖掘出異常欺詐行為。

征信機(jī)構(gòu)可以提供的反欺詐服務(wù)包括:

(1)文檔交叉核對(duì):通過(guò)交叉對(duì)比對(duì)客戶的歷史信貸資料來(lái)發(fā)現(xiàn)異常情況。(2)共享已確認(rèn)或疑似的欺詐行為:諸如英國(guó)的西法斯(CIFAS)等組織,在會(huì)員機(jī)構(gòu)之間共享確認(rèn)的或懷疑的欺詐記錄。(3)欺詐評(píng)分:征信機(jī)構(gòu)可以為特定的信貸機(jī)構(gòu)或所有信貸機(jī)構(gòu)開發(fā)欺詐評(píng)分產(chǎn)品。(4)欺詐監(jiān)測(cè)系統(tǒng):通過(guò)建立欺詐監(jiān)測(cè)系統(tǒng),設(shè)置欺詐監(jiān)測(cè)規(guī)則來(lái)發(fā)現(xiàn)申請(qǐng)欺詐行為,還可以通過(guò)還款行為進(jìn)行分析來(lái)發(fā)現(xiàn)銀行卡交易欺詐。

艾克飛公司也已開發(fā)出在線的數(shù)據(jù)挖掘產(chǎn)品防欺詐顧問(wèn)(Equifax Fraud Advisor),可以自動(dòng)地進(jìn)行欺詐檢測(cè),以減少手工操作帶來(lái)的風(fēng)險(xiǎn)。

2. 預(yù)測(cè)分析在對(duì)外的風(fēng)險(xiǎn)管理服務(wù)中的應(yīng)用。預(yù)測(cè)分析是指通過(guò)對(duì)已知的信用主體的數(shù)據(jù)(信貸行為和風(fēng)險(xiǎn)狀態(tài)/趨勢(shì)都已知),通過(guò)挖掘,構(gòu)建出預(yù)測(cè)模型,對(duì)未知的信用主體根據(jù)其信貸行為,預(yù)測(cè)出其風(fēng)險(xiǎn)狀態(tài)/趨勢(shì)。基于征信數(shù)據(jù)的預(yù)測(cè)分析是通過(guò)數(shù)據(jù)挖掘中的回歸模型來(lái)實(shí)現(xiàn)的,包括風(fēng)險(xiǎn)評(píng)估和風(fēng)險(xiǎn)預(yù)測(cè),兩者區(qū)別在于:風(fēng)險(xiǎn)評(píng)估對(duì)目前的風(fēng)險(xiǎn)狀況進(jìn)行量化描述;而風(fēng)險(xiǎn)預(yù)測(cè)是對(duì)未來(lái)的風(fēng)險(xiǎn)狀況進(jìn)行量化描述。

在征信服務(wù)中的應(yīng)用:

(1)信用評(píng)分。信用評(píng)分原始模型是根據(jù)已知的信用主體的信用歷史資料,進(jìn)行樣本學(xué)習(xí),得到了信用評(píng)分模型,根據(jù)信用評(píng)分模型,來(lái)決定客戶是否可以貸款或所可以持有的金額權(quán)限,甚至是貸款利息率,從而保證還款等業(yè)務(wù)的安全性。隨著風(fēng)險(xiǎn)管理和數(shù)據(jù)挖掘水平的提高,信用評(píng)分已經(jīng)成為一個(gè)比較寬泛的概念,具體類型可達(dá)100多種,例如申請(qǐng)?jiān)u分、欺詐評(píng)分、盈利評(píng)分、信貸審批評(píng)分、破產(chǎn)評(píng)分等。

局評(píng)分是基于征信機(jī)構(gòu)的數(shù)據(jù)開發(fā)而來(lái)的信用評(píng)分,它與放貸機(jī)構(gòu)自行開發(fā)的客戶化信用評(píng)分有所不同。它使用的是來(lái)自各放貸機(jī)構(gòu)上報(bào)的信息,基本涵蓋了借款人所有的信貸記錄,包括借款人的貸款余額總量、貸款總筆數(shù)和所以歷史違約記錄,以及一些公共信息源的數(shù)據(jù),這是單個(gè)放貸機(jī)構(gòu)無(wú)法擁有的。

(2)宏觀或中觀的信貸風(fēng)險(xiǎn)預(yù)測(cè)指數(shù)。基于征信系統(tǒng)的海量數(shù)據(jù)資源,可為宏觀層面的風(fēng)險(xiǎn)預(yù)測(cè)提供具有前瞻性和準(zhǔn)確性的數(shù)據(jù)信息。從國(guó)內(nèi)金融業(yè)的未來(lái)發(fā)展看,對(duì)中性的政策性信息的需求將越來(lái)越迫切。有外部監(jiān)管方面的原因,如資本監(jiān)管體制改革。也有來(lái)自銀行內(nèi)部管理的推動(dòng),比如對(duì)信貸市場(chǎng)整體走勢(shì)的信息需求,對(duì)涉及金融穩(wěn)定和系統(tǒng)性風(fēng)險(xiǎn)的信息需求等。另外從宏觀政策制定與實(shí)施的角度看,也需要了解和掌握中觀信息,所以存在很多的衍生需求。征信數(shù)據(jù)具有靈活豐富的數(shù)據(jù)維度(如行業(yè)、區(qū)域、規(guī)模;余額、新增、集中度;各類產(chǎn)品;期限、利率、五級(jí)分類等),可以制作出高信度的預(yù)警信息和有特色的信貸指數(shù)體系,生成行業(yè)、區(qū)域金融生態(tài)分析報(bào)告或相應(yīng)的產(chǎn)品。例如利用個(gè)人信用評(píng)分和經(jīng)濟(jì)形勢(shì)變化之間的關(guān)系,費(fèi)埃哲公司(FICO)開發(fā)了FICO Economic Impact Index,主要分析宏觀經(jīng)濟(jì)環(huán)境變化引起的賬戶風(fēng)險(xiǎn)和組合產(chǎn)品風(fēng)險(xiǎn)。借款人在消費(fèi)者的整個(gè)賬戶管理周期內(nèi)引入宏觀經(jīng)濟(jì)變化對(duì)其賬戶的風(fēng)險(xiǎn)分析,即FICO經(jīng)濟(jì)影響指數(shù),便于其做出更為有利的風(fēng)險(xiǎn)管理決策。

3. 分類分析在對(duì)外的風(fēng)險(xiǎn)管理服務(wù)中的應(yīng)用。分類(Classification)分析可以說(shuō)是數(shù)據(jù)挖掘技術(shù)中最常用,最成熟的一種方法。分類分析可以看作是預(yù)測(cè)分析的一種特殊情況。在已知一些信用主體的類別標(biāo)簽(這些類別的標(biāo)簽可以是風(fēng)險(xiǎn)預(yù)警的級(jí)別,也可以是信用的等級(jí))的情況下,對(duì)未知的信用主體的類別進(jìn)行識(shí)別。主要的原理是基于對(duì)已有標(biāo)簽的信用主體的類別和其行為特征之間通過(guò)數(shù)據(jù)挖掘建立映射模型,這種模型稱為分類模型,將未知信用主體的行為特征輸入到分類模型中,就可以得到該信用主體的類別。

在征信服務(wù)中的應(yīng)用:

(1)風(fēng)險(xiǎn)預(yù)警。風(fēng)險(xiǎn)主動(dòng)預(yù)警是目前商業(yè)銀行最迫切需要的信用信息服務(wù)之一。目前商業(yè)銀行的貸后管理和催收部門通過(guò)定期查詢部分借款人的信用報(bào)告來(lái)跟蹤借款人信用行為的變化情況,但就目前單筆信用報(bào)告的查詢模式而言,如果抽樣進(jìn)行查詢,則被查詢?nèi)说倪x取方法并無(wú)嚴(yán)格的科學(xué)依據(jù),無(wú)法保證覆蓋面;如果對(duì)本行的信貸客戶全部查詢,雖然可以保證覆蓋面,但系統(tǒng)資源和查詢費(fèi)用的巨大開銷將嚴(yán)重降低全局查詢的投入產(chǎn)出比。因此,在借款人出現(xiàn)高風(fēng)險(xiǎn)事件時(shí),如征信系統(tǒng)能主動(dòng)通知其它與其有業(yè)務(wù)來(lái)往的商業(yè)銀行,則可以高效地解決這一矛盾。例如可以根據(jù)信用主體的如下信貸記錄將預(yù)警可以分無(wú)預(yù)警、輕度預(yù)警、中度預(yù)警和重度預(yù)警四級(jí):(1)當(dāng)前預(yù)期狀態(tài);(2)征信評(píng)分;(3)是否有信用卡取現(xiàn)情況;(4)最近12個(gè)月信用卡/貸款審批/擔(dān)保資格查詢次數(shù);(5)是否欠稅記錄;(6)是否有行政處罰記錄;(7)是否有電信欠費(fèi)記錄。然后搜集樣本數(shù)據(jù),訓(xùn)練預(yù)警分類模型。最后實(shí)現(xiàn)對(duì)信用主體的自動(dòng)標(biāo)示預(yù)警分類。

(2)信用評(píng)級(jí)。可以根據(jù)信用主體的債務(wù)、還款情況、收入和工作情況對(duì)其信用程度進(jìn)行分類,為授信額度的確立以及其它風(fēng)險(xiǎn)管理措施提供依據(jù)。艾克飛公司開發(fā)出小企業(yè)風(fēng)險(xiǎn)級(jí)別預(yù)測(cè)(Small Business Risk Class),預(yù)測(cè)小企業(yè)的商業(yè)賬戶在未來(lái)12個(gè)月內(nèi)出現(xiàn)嚴(yán)重拖欠(90天以上)或破產(chǎn)的風(fēng)險(xiǎn)級(jí)別。賬戶風(fēng)險(xiǎn)分為1個(gè)級(jí)別~5個(gè)級(jí)別。該分析工具利用的信息包括商業(yè)支付信息、公共記錄以及來(lái)自SBFE的銀行信貸和金融租賃信息。

征信機(jī)構(gòu)可以為信貸機(jī)構(gòu)設(shè)計(jì)一系列評(píng)級(jí)模型,并協(xié)助放貸機(jī)構(gòu)制定客戶關(guān)系管理戰(zhàn)略。

(1)模型跟蹤和性能檢測(cè):信用評(píng)級(jí)一定程度上客觀、量化地展示了客戶的信用風(fēng)險(xiǎn),為保障評(píng)分模型有良好的預(yù)測(cè)能力,要不斷地進(jìn)行模型跟蹤調(diào)整,征信機(jī)構(gòu)可以提供一些工具用來(lái)監(jiān)控評(píng)分模型的性能變化,判斷在客戶群發(fā)生變化時(shí)評(píng)分模型是否仍有良好的好壞區(qū)分能力。

(2)催收評(píng)級(jí):對(duì)于有逾期記錄的客戶,通過(guò)催收評(píng)級(jí)進(jìn)一步區(qū)分惡意拖欠的可能性,幫助放貸機(jī)構(gòu)針對(duì)不同情況定制催收方案,而不是采取單一的催收措施(例如所以逾期30天的客戶都會(huì)收到相同的催收信函)。這種更有針對(duì)性的催收方案能幫助信貸機(jī)構(gòu)有效減少損失,提高催收效率。

4. 相關(guān)性規(guī)則分析在對(duì)外的風(fēng)險(xiǎn)管理服務(wù)中的應(yīng)用。

定義:相關(guān)性規(guī)則(Association rule)分析是數(shù)據(jù)挖掘中一種簡(jiǎn)單而又實(shí)用的技術(shù)。一個(gè)典型的例子就是“購(gòu)物籃”分析,即通過(guò)發(fā)現(xiàn)消費(fèi)者放入他們“購(gòu)物籃”中的商品之間的關(guān)聯(lián)(頻繁地共同發(fā)生),分析顧客的購(gòu)物習(xí)慣。在金融領(lǐng)域,相關(guān)性規(guī)則分析可以用來(lái)發(fā)現(xiàn)銀行客戶對(duì)所提供的金融服務(wù)于產(chǎn)品間的關(guān)聯(lián)性、不同信用產(chǎn)品價(jià)格之間的關(guān)聯(lián)性、不同市場(chǎng)變動(dòng)趨勢(shì)之間的關(guān)聯(lián)性。在信用風(fēng)險(xiǎn)管理中,相關(guān)性規(guī)則挖掘可以發(fā)現(xiàn)信貸數(shù)據(jù)庫(kù)中信貸行為和信用風(fēng)險(xiǎn)之間的關(guān)聯(lián)性規(guī)則,這些規(guī)則反映了信用主體的風(fēng)險(xiǎn)模式。

在征信服務(wù)中的應(yīng)用:可以通過(guò)相關(guān)性規(guī)則分析來(lái)發(fā)現(xiàn)一些風(fēng)險(xiǎn)關(guān)聯(lián)模式(或風(fēng)險(xiǎn)特征要素),包括,例如信用主體信貸違約和信用主體的哪些基本信息有關(guān),例如收入、職業(yè)、年齡、經(jīng)營(yíng)狀況和行業(yè)形勢(shì)等;自動(dòng)地發(fā)現(xiàn)這些風(fēng)險(xiǎn)因素的相關(guān)關(guān)系,這也是大數(shù)據(jù)時(shí)代中所強(qiáng)調(diào)的重視數(shù)據(jù)內(nèi)部蘊(yùn)含的相關(guān)關(guān)系的基本思想。從常識(shí)上來(lái)看,兩個(gè)因素可能毫不相關(guān),但是存在很強(qiáng)的關(guān)聯(lián)效應(yīng)。這就為信用評(píng)分或者其它風(fēng)險(xiǎn)量化分析選取主要的關(guān)聯(lián)因素(特征)提供依據(jù)。

三、 結(jié)語(yǔ)

征信機(jī)構(gòu)的核心資產(chǎn)是數(shù)據(jù),作為數(shù)據(jù)工廠,各種數(shù)據(jù)挖掘技術(shù)都可以得到很好地應(yīng)用。征信數(shù)據(jù)挖掘既可以面向不同的服務(wù)對(duì)象也可以應(yīng)用到不同的風(fēng)險(xiǎn)層面。本文重點(diǎn)研究的是基本征信數(shù)據(jù)挖掘:從數(shù)據(jù)角度來(lái)說(shuō),處理的信貸行為數(shù)據(jù)是最基本的征信數(shù)據(jù);從分析技術(shù)來(lái)說(shuō),所采用的數(shù)據(jù)挖掘方法不僅技術(shù)手段和應(yīng)用相對(duì)成熟而且國(guó)外知名征信機(jī)構(gòu)已有很多成功的應(yīng)用案例可以借鑒。通過(guò)對(duì)征信系統(tǒng)進(jìn)行廣泛和深入地?cái)?shù)據(jù)挖掘,不僅可以更好地進(jìn)行量化風(fēng)險(xiǎn)管理和征信系統(tǒng)維護(hù),還能為未來(lái)征信大數(shù)據(jù)時(shí)代的到來(lái)打下更好的基礎(chǔ)。

未來(lái),本研究將繼續(xù)深入地探討征信數(shù)據(jù)挖掘的相關(guān)問(wèn)題,例如如何深入開展基于聚類的客戶細(xì)分為信用風(fēng)險(xiǎn)服務(wù)。同時(shí)也關(guān)注一些熱點(diǎn)和前沿問(wèn)題,例如對(duì)基于關(guān)聯(lián)關(guān)系的征信數(shù)據(jù)挖掘,基于非結(jié)構(gòu)化數(shù)據(jù)的征信數(shù)據(jù)挖掘,以及大數(shù)據(jù)、互聯(lián)網(wǎng)金融、社交媒體、移動(dòng)終端對(duì)征信服務(wù)以及征信數(shù)據(jù)挖掘的影響用等熱點(diǎn)話題。

參考文獻(xiàn):

[1] Jiawei Han, MichelineKamber,Jian Pei.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2012.

[2] 陳建,信用評(píng)分模型技術(shù)與應(yīng)用[M].北京:中國(guó)財(cái)政經(jīng)濟(jì)出版社,2005.

[3] Bart Baesens、Tony van Gestel,Credit risk management:Basic Concepts,Oxford press,2009.

[4] 馬超群,蘭秋軍,陳為民.金融數(shù)據(jù)挖掘[M].北京:科學(xué)出版社,2008.

[5] Viktor Mayer-Sch?觟nberger、Kenneth Cukier.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2013.

[6] 中國(guó)銀行和征信中心聯(lián)合課題組研究報(bào)告.征信系統(tǒng)在個(gè)人業(yè)務(wù)信用風(fēng)險(xiǎn)管理中的應(yīng)用,2013.

基金項(xiàng)目:國(guó)家自然科學(xué)基金青年基金(項(xiàng)目號(hào):61105058);國(guó)家社會(huì)科學(xué)基金(項(xiàng)目號(hào):13CJY011)。

作者簡(jiǎn)介:楊北京(1980-),男,漢族,江蘇省宿遷市人,中國(guó)人民大學(xué)商學(xué)院博士生,研究方向?yàn)榛ヂ?lián)網(wǎng)金融與電子商務(wù),現(xiàn)就職于中國(guó)工商銀行總行;劉新海(1976-),男,漢族,河南省南陽(yáng)市人,中國(guó)人民銀行征信中心高級(jí)研究員,中國(guó)人民銀行金融研究所應(yīng)用經(jīng)濟(jì)學(xué)博士后,研究方向?yàn)榻鹑诖髷?shù)據(jù)和征信數(shù)據(jù)挖掘。

收稿日期:2015-06-10。

一、 問(wèn)題的提出

數(shù)據(jù)挖掘(Data Mining,DM)又稱知識(shí)發(fā)現(xiàn)(Knowledge Discover in Database,KDD),是指從數(shù)據(jù)集合的海量數(shù)據(jù)中揭示出隱含的模式、發(fā)現(xiàn)先前未知的并有潛在價(jià)值的信息和知識(shí)的過(guò)程(Jiawei Han,MichelineKamber,Jian Pei;2012)。由于數(shù)據(jù)挖掘在應(yīng)用過(guò)程中可以幫助商業(yè)決策這調(diào)整市場(chǎng)策略,評(píng)估風(fēng)險(xiǎn),獲得洞察力并進(jìn)行正確決策,目前已經(jīng)是人工智能和數(shù)據(jù)庫(kù)領(lǐng)域研究的熱點(diǎn)問(wèn)題。隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)挖掘技術(shù)已成為許多互聯(lián)網(wǎng)和零售企業(yè)的重要支撐技術(shù)和核心競(jìng)爭(zhēng)力之一,并被廣泛地應(yīng)用到管理和社會(huì)學(xué)科等諸多領(lǐng)域。對(duì)作為天然就具有大數(shù)據(jù)和云計(jì)算特征的征信業(yè)而言,數(shù)據(jù)挖掘技術(shù)的地位和重要性不言而喻。目前國(guó)外征信機(jī)構(gòu)正在廣泛利用數(shù)據(jù)挖掘技術(shù),進(jìn)行信用風(fēng)險(xiǎn)管理方面的產(chǎn)品開發(fā),申請(qǐng)了許多關(guān)于數(shù)據(jù)挖掘的專利授權(quán),并開發(fā)出多種數(shù)據(jù)挖掘產(chǎn)品。數(shù)據(jù)挖掘技術(shù)已經(jīng)成為它們的核心競(jìng)爭(zhēng)力,例如益佰利(Experian)、艾克飛(Equifax)、環(huán)聯(lián)(Trans Union)和鄧白氏(Dun & Bradstreet,D&B)等。

結(jié)合信用風(fēng)險(xiǎn)管理的目標(biāo):對(duì)個(gè)人消費(fèi)者和企業(yè)的風(fēng)險(xiǎn)進(jìn)行評(píng)估,減少交易過(guò)程中的信息不對(duì)稱,本文將征信數(shù)據(jù)挖掘的基本步驟敘述如下:

步驟一:確定商業(yè)目標(biāo)。該步驟主要是確定數(shù)據(jù)挖掘所要解決的具體問(wèn)題,比如發(fā)現(xiàn)信用風(fēng)險(xiǎn)特征、欺詐風(fēng)險(xiǎn)特征、客戶流失特征等;確定征信數(shù)據(jù)挖掘問(wèn)題的覆蓋范圍,比如房貸產(chǎn)品、信用卡產(chǎn)品或汽車貸款產(chǎn)品等。商業(yè)目標(biāo)不僅指明了數(shù)據(jù)挖掘方向,也是衡量數(shù)據(jù)挖掘效果的關(guān)鍵要素。

步驟二:數(shù)據(jù)采集。首先確定數(shù)據(jù)挖掘所涉及的具體數(shù)據(jù)庫(kù)或者數(shù)據(jù)來(lái)源渠道,例如申請(qǐng)數(shù)據(jù)庫(kù)、客戶基本信息數(shù)據(jù)庫(kù)、交易數(shù)據(jù)庫(kù)、市場(chǎng)營(yíng)銷數(shù)據(jù)等,其次確定通過(guò)何種技術(shù)手段獲取這些有用的數(shù)據(jù)以及數(shù)據(jù)的有效期。

步驟三:數(shù)據(jù)清洗。消除噪聲和刪除不一致的數(shù)據(jù),進(jìn)行數(shù)據(jù)質(zhì)量檢查,確保數(shù)據(jù)可靠。數(shù)據(jù)質(zhì)量是數(shù)據(jù)挖掘的前提和生命。若數(shù)據(jù)質(zhì)量不高,即使數(shù)據(jù)挖掘的技術(shù)再先進(jìn),耗費(fèi)的功夫再大也無(wú)濟(jì)于事。

步驟四:數(shù)據(jù)整合和轉(zhuǎn)換。即將多種數(shù)據(jù)源整合在一起,把數(shù)據(jù)變換和統(tǒng)一成適合挖掘的形式,例如數(shù)據(jù)類型和數(shù)據(jù)格式的轉(zhuǎn)換,缺省值和極值的處理。

步驟五:數(shù)據(jù)挖掘。使用模式識(shí)別或機(jī)器學(xué)習(xí)的方法以及計(jì)算機(jī)信息處理手段,對(duì)大量數(shù)據(jù)進(jìn)行加工和分析,來(lái)提取數(shù)據(jù)模式或者是系統(tǒng)性的模型。數(shù)據(jù)挖掘既高度依賴先進(jìn)的統(tǒng)計(jì)方法和計(jì)算機(jī)技術(shù),也高度依賴數(shù)據(jù)分析人員的專業(yè)知識(shí)和經(jīng)驗(yàn)。這是數(shù)據(jù)挖掘的核心。

步驟六:性能評(píng)判。并不是所有挖掘出來(lái)的模式或者模型都是有效的,根據(jù)某種指標(biāo)度量(顯著性檢驗(yàn)、準(zhǔn)確性檢驗(yàn)或者某種測(cè)度),確定挖掘結(jié)果是合乎邏輯、合乎情理和合乎直覺(jué)的。

步驟七:將數(shù)據(jù)挖掘的結(jié)果用于決策分析。根據(jù)數(shù)據(jù)挖掘的結(jié)果做出相應(yīng)的決策建議,例如改進(jìn)風(fēng)險(xiǎn)管理策略、改進(jìn)市場(chǎng)營(yíng)銷策略、改進(jìn)客戶服務(wù)策略等,以提高經(jīng)營(yíng)管理的效益,實(shí)現(xiàn)數(shù)據(jù)挖掘的商業(yè)價(jià)值。

步驟八:數(shù)據(jù)挖掘結(jié)果應(yīng)用。挖掘所獲得知識(shí)(模式、模型、規(guī)律、策略等),最終需要付諸于應(yīng)用,以產(chǎn)生現(xiàn)實(shí)的經(jīng)濟(jì)效益。往往通過(guò)挖掘人員和IT技術(shù)人員合作,開發(fā)一些計(jì)算機(jī)應(yīng)用系統(tǒng)來(lái)實(shí)現(xiàn)。

步驟九:數(shù)據(jù)挖掘的跟蹤和提高。數(shù)據(jù)挖掘是一個(gè)不斷發(fā)現(xiàn)、不斷總結(jié)、不斷提高的過(guò)程。需要對(duì)數(shù)據(jù)挖掘的應(yīng)用進(jìn)行跟蹤和反饋,分析問(wèn)題,提煉經(jīng)驗(yàn),并且不斷地更新迭代。例如個(gè)人信用評(píng)分的模型每年都要重新挖掘和訓(xùn)練。

二、 數(shù)據(jù)挖掘技術(shù)在對(duì)外的風(fēng)險(xiǎn)管理服務(wù)中的應(yīng)用

1. 聚類分析在對(duì)外的風(fēng)險(xiǎn)管理服務(wù)中的應(yīng)用。聚類分析(Clustering Analysis),也稱為自動(dòng)分類,利用信用主體的信貸行為特征,根據(jù)(信貸行為、風(fēng)險(xiǎn)模式、信用主體基本信息)相似性的原則,自動(dòng)歸類,劃分信用主體群(也稱為類)。信用主體的類可以描述一種特定的信用風(fēng)險(xiǎn)模式。聚類分析是面向信用風(fēng)險(xiǎn)管理的數(shù)據(jù)挖掘的基本方法。

在征信服務(wù)中的應(yīng)用:

(1)信用主體細(xì)分,金融學(xué)的微觀基礎(chǔ)是行為科學(xué),無(wú)論公司行為或者是個(gè)人行為都具有一致性的特點(diǎn),所以風(fēng)險(xiǎn)管理一直做的工作,就是試圖通過(guò)對(duì)公司、個(gè)人行為的分析來(lái)預(yù)判公司、個(gè)人的違約前景,并為此開發(fā)出一系列的風(fēng)險(xiǎn)模型,輔助授信決策。相對(duì)于公司客戶,個(gè)人客戶的行為更具有一致性和可預(yù)測(cè)性。俗話說(shuō),江山易改,本性難移,指的就是性格傾向的穩(wěn)定性和連續(xù)性。要直接在性格傾向于行為模式之間建立對(duì)應(yīng)關(guān)系,并不是很容易的事情,替代的方法就是分群,物以類聚,人以群分,只要把每個(gè)人所屬的人群類別定位準(zhǔn)確,要預(yù)測(cè)其行為模式就比較容易。從統(tǒng)計(jì)分析看,特定人群的行為模式就有很高的同質(zhì)性,換言之,不同人群在行為模式上有著明顯的差別。根據(jù)不同的人群有著不同的風(fēng)險(xiǎn)模式,通過(guò)聚類分析,實(shí)現(xiàn)對(duì)不同的人群進(jìn)行不同的信用風(fēng)險(xiǎn)管理,可以結(jié)合風(fēng)險(xiǎn)規(guī)則,通過(guò)聚類分析,將個(gè)人信用主體分為老齡消費(fèi)群體、高凈值客戶群體、80/90后消費(fèi)群體和新興城鎮(zhèn)居民群體,然后進(jìn)行各自的風(fēng)險(xiǎn)模式分析。此外通過(guò)聚類分析,可以發(fā)現(xiàn)一些新的信用主體的行為模式,例如技術(shù)創(chuàng)新性企業(yè)會(huì)出現(xiàn)不同于一般企業(yè)的信貸行為,這就可能對(duì)應(yīng)著新的信用風(fēng)險(xiǎn)模式的出現(xiàn)。社會(huì)發(fā)展趨勢(shì)客戶細(xì)分客戶需求老齡消費(fèi)者群體新興城鎮(zhèn)居民群體80/90后消費(fèi)群體高凈值客戶群體低風(fēng)險(xiǎn)保本型的銀行產(chǎn)品對(duì)現(xiàn)有社保、醫(yī)保有效補(bǔ)充的社保產(chǎn)品醫(yī)療服務(wù)和生活服務(wù)更豐富的理財(cái)產(chǎn)品以咨詢?yōu)閷?dǎo)向個(gè)性化的服務(wù)家族財(cái)富管理追求個(gè)性化、新鮮的金融產(chǎn)品互動(dòng)式的7x24網(wǎng)銀服務(wù)移動(dòng)金融服務(wù)人口老齡化富裕階層擴(kuò)大80/90后消費(fèi)群體不斷壯大農(nóng)村城鎮(zhèn)化和城鄉(xiāng)一體化低費(fèi)用無(wú)抵押貸款,新型農(nóng)村信用貸款有農(nóng)村特色的理財(cái)產(chǎn)品和中間業(yè)務(wù)

(2)欺詐檢測(cè)。反欺詐是信用風(fēng)險(xiǎn)管理中的重要內(nèi)容,結(jié)合專家規(guī)則,聚類算法可以用于挖掘出異常欺詐行為。

征信機(jī)構(gòu)可以提供的反欺詐服務(wù)包括:

(1)文檔交叉核對(duì):通過(guò)交叉對(duì)比對(duì)客戶的歷史信貸資料來(lái)發(fā)現(xiàn)異常情況。(2)共享已確認(rèn)或疑似的欺詐行為:諸如英國(guó)的西法斯(CIFAS)等組織,在會(huì)員機(jī)構(gòu)之間共享確認(rèn)的或懷疑的欺詐記錄。(3)欺詐評(píng)分:征信機(jī)構(gòu)可以為特定的信貸機(jī)構(gòu)或所有信貸機(jī)構(gòu)開發(fā)欺詐評(píng)分產(chǎn)品。(4)欺詐監(jiān)測(cè)系統(tǒng):通過(guò)建立欺詐監(jiān)測(cè)系統(tǒng),設(shè)置欺詐監(jiān)測(cè)規(guī)則來(lái)發(fā)現(xiàn)申請(qǐng)欺詐行為,還可以通過(guò)還款行為進(jìn)行分析來(lái)發(fā)現(xiàn)銀行卡交易欺詐。

艾克飛公司也已開發(fā)出在線的數(shù)據(jù)挖掘產(chǎn)品防欺詐顧問(wèn)(Equifax Fraud Advisor),可以自動(dòng)地進(jìn)行欺詐檢測(cè),以減少手工操作帶來(lái)的風(fēng)險(xiǎn)。

2. 預(yù)測(cè)分析在對(duì)外的風(fēng)險(xiǎn)管理服務(wù)中的應(yīng)用。預(yù)測(cè)分析是指通過(guò)對(duì)已知的信用主體的數(shù)據(jù)(信貸行為和風(fēng)險(xiǎn)狀態(tài)/趨勢(shì)都已知),通過(guò)挖掘,構(gòu)建出預(yù)測(cè)模型,對(duì)未知的信用主體根據(jù)其信貸行為,預(yù)測(cè)出其風(fēng)險(xiǎn)狀態(tài)/趨勢(shì)。基于征信數(shù)據(jù)的預(yù)測(cè)分析是通過(guò)數(shù)據(jù)挖掘中的回歸模型來(lái)實(shí)現(xiàn)的,包括風(fēng)險(xiǎn)評(píng)估和風(fēng)險(xiǎn)預(yù)測(cè),兩者區(qū)別在于:風(fēng)險(xiǎn)評(píng)估對(duì)目前的風(fēng)險(xiǎn)狀況進(jìn)行量化描述;而風(fēng)險(xiǎn)預(yù)測(cè)是對(duì)未來(lái)的風(fēng)險(xiǎn)狀況進(jìn)行量化描述。

在征信服務(wù)中的應(yīng)用:

(1)信用評(píng)分。信用評(píng)分原始模型是根據(jù)已知的信用主體的信用歷史資料,進(jìn)行樣本學(xué)習(xí),得到了信用評(píng)分模型,根據(jù)信用評(píng)分模型,來(lái)決定客戶是否可以貸款或所可以持有的金額權(quán)限,甚至是貸款利息率,從而保證還款等業(yè)務(wù)的安全性。隨著風(fēng)險(xiǎn)管理和數(shù)據(jù)挖掘水平的提高,信用評(píng)分已經(jīng)成為一個(gè)比較寬泛的概念,具體類型可達(dá)100多種,例如申請(qǐng)?jiān)u分、欺詐評(píng)分、盈利評(píng)分、信貸審批評(píng)分、破產(chǎn)評(píng)分等。

局評(píng)分是基于征信機(jī)構(gòu)的數(shù)據(jù)開發(fā)而來(lái)的信用評(píng)分,它與放貸機(jī)構(gòu)自行開發(fā)的客戶化信用評(píng)分有所不同。它使用的是來(lái)自各放貸機(jī)構(gòu)上報(bào)的信息,基本涵蓋了借款人所有的信貸記錄,包括借款人的貸款余額總量、貸款總筆數(shù)和所以歷史違約記錄,以及一些公共信息源的數(shù)據(jù),這是單個(gè)放貸機(jī)構(gòu)無(wú)法擁有的。

(2)宏觀或中觀的信貸風(fēng)險(xiǎn)預(yù)測(cè)指數(shù)。基于征信系統(tǒng)的海量數(shù)據(jù)資源,可為宏觀層面的風(fēng)險(xiǎn)預(yù)測(cè)提供具有前瞻性和準(zhǔn)確性的數(shù)據(jù)信息。從國(guó)內(nèi)金融業(yè)的未來(lái)發(fā)展看,對(duì)中性的政策性信息的需求將越來(lái)越迫切。有外部監(jiān)管方面的原因,如資本監(jiān)管體制改革。也有來(lái)自銀行內(nèi)部管理的推動(dòng),比如對(duì)信貸市場(chǎng)整體走勢(shì)的信息需求,對(duì)涉及金融穩(wěn)定和系統(tǒng)性風(fēng)險(xiǎn)的信息需求等。另外從宏觀政策制定與實(shí)施的角度看,也需要了解和掌握中觀信息,所以存在很多的衍生需求。征信數(shù)據(jù)具有靈活豐富的數(shù)據(jù)維度(如行業(yè)、區(qū)域、規(guī)模;余額、新增、集中度;各類產(chǎn)品;期限、利率、五級(jí)分類等),可以制作出高信度的預(yù)警信息和有特色的信貸指數(shù)體系,生成行業(yè)、區(qū)域金融生態(tài)分析報(bào)告或相應(yīng)的產(chǎn)品。例如利用個(gè)人信用評(píng)分和經(jīng)濟(jì)形勢(shì)變化之間的關(guān)系,費(fèi)埃哲公司(FICO)開發(fā)了FICO Economic Impact Index,主要分析宏觀經(jīng)濟(jì)環(huán)境變化引起的賬戶風(fēng)險(xiǎn)和組合產(chǎn)品風(fēng)險(xiǎn)。借款人在消費(fèi)者的整個(gè)賬戶管理周期內(nèi)引入宏觀經(jīng)濟(jì)變化對(duì)其賬戶的風(fēng)險(xiǎn)分析,即FICO經(jīng)濟(jì)影響指數(shù),便于其做出更為有利的風(fēng)險(xiǎn)管理決策。

3. 分類分析在對(duì)外的風(fēng)險(xiǎn)管理服務(wù)中的應(yīng)用。分類(Classification)分析可以說(shuō)是數(shù)據(jù)挖掘技術(shù)中最常用,最成熟的一種方法。分類分析可以看作是預(yù)測(cè)分析的一種特殊情況。在已知一些信用主體的類別標(biāo)簽(這些類別的標(biāo)簽可以是風(fēng)險(xiǎn)預(yù)警的級(jí)別,也可以是信用的等級(jí))的情況下,對(duì)未知的信用主體的類別進(jìn)行識(shí)別。主要的原理是基于對(duì)已有標(biāo)簽的信用主體的類別和其行為特征之間通過(guò)數(shù)據(jù)挖掘建立映射模型,這種模型稱為分類模型,將未知信用主體的行為特征輸入到分類模型中,就可以得到該信用主體的類別。

在征信服務(wù)中的應(yīng)用:

(1)風(fēng)險(xiǎn)預(yù)警。風(fēng)險(xiǎn)主動(dòng)預(yù)警是目前商業(yè)銀行最迫切需要的信用信息服務(wù)之一。目前商業(yè)銀行的貸后管理和催收部門通過(guò)定期查詢部分借款人的信用報(bào)告來(lái)跟蹤借款人信用行為的變化情況,但就目前單筆信用報(bào)告的查詢模式而言,如果抽樣進(jìn)行查詢,則被查詢?nèi)说倪x取方法并無(wú)嚴(yán)格的科學(xué)依據(jù),無(wú)法保證覆蓋面;如果對(duì)本行的信貸客戶全部查詢,雖然可以保證覆蓋面,但系統(tǒng)資源和查詢費(fèi)用的巨大開銷將嚴(yán)重降低全局查詢的投入產(chǎn)出比。因此,在借款人出現(xiàn)高風(fēng)險(xiǎn)事件時(shí),如征信系統(tǒng)能主動(dòng)通知其它與其有業(yè)務(wù)來(lái)往的商業(yè)銀行,則可以高效地解決這一矛盾。例如可以根據(jù)信用主體的如下信貸記錄將預(yù)警可以分無(wú)預(yù)警、輕度預(yù)警、中度預(yù)警和重度預(yù)警四級(jí):(1)當(dāng)前預(yù)期狀態(tài);(2)征信評(píng)分;(3)是否有信用卡取現(xiàn)情況;(4)最近12個(gè)月信用卡/貸款審批/擔(dān)保資格查詢次數(shù);(5)是否欠稅記錄;(6)是否有行政處罰記錄;(7)是否有電信欠費(fèi)記錄。然后搜集樣本數(shù)據(jù),訓(xùn)練預(yù)警分類模型。最后實(shí)現(xiàn)對(duì)信用主體的自動(dòng)標(biāo)示預(yù)警分類。

(2)信用評(píng)級(jí)。可以根據(jù)信用主體的債務(wù)、還款情況、收入和工作情況對(duì)其信用程度進(jìn)行分類,為授信額度的確立以及其它風(fēng)險(xiǎn)管理措施提供依據(jù)。艾克飛公司開發(fā)出小企業(yè)風(fēng)險(xiǎn)級(jí)別預(yù)測(cè)(Small Business Risk Class),預(yù)測(cè)小企業(yè)的商業(yè)賬戶在未來(lái)12個(gè)月內(nèi)出現(xiàn)嚴(yán)重拖欠(90天以上)或破產(chǎn)的風(fēng)險(xiǎn)級(jí)別。賬戶風(fēng)險(xiǎn)分為1個(gè)級(jí)別~5個(gè)級(jí)別。該分析工具利用的信息包括商業(yè)支付信息、公共記錄以及來(lái)自SBFE的銀行信貸和金融租賃信息。

征信機(jī)構(gòu)可以為信貸機(jī)構(gòu)設(shè)計(jì)一系列評(píng)級(jí)模型,并協(xié)助放貸機(jī)構(gòu)制定客戶關(guān)系管理戰(zhàn)略。

(1)模型跟蹤和性能檢測(cè):信用評(píng)級(jí)一定程度上客觀、量化地展示了客戶的信用風(fēng)險(xiǎn),為保障評(píng)分模型有良好的預(yù)測(cè)能力,要不斷地進(jìn)行模型跟蹤調(diào)整,征信機(jī)構(gòu)可以提供一些工具用來(lái)監(jiān)控評(píng)分模型的性能變化,判斷在客戶群發(fā)生變化時(shí)評(píng)分模型是否仍有良好的好壞區(qū)分能力。

(2)催收評(píng)級(jí):對(duì)于有逾期記錄的客戶,通過(guò)催收評(píng)級(jí)進(jìn)一步區(qū)分惡意拖欠的可能性,幫助放貸機(jī)構(gòu)針對(duì)不同情況定制催收方案,而不是采取單一的催收措施(例如所以逾期30天的客戶都會(huì)收到相同的催收信函)。這種更有針對(duì)性的催收方案能幫助信貸機(jī)構(gòu)有效減少損失,提高催收效率。

4. 相關(guān)性規(guī)則分析在對(duì)外的風(fēng)險(xiǎn)管理服務(wù)中的應(yīng)用。

定義:相關(guān)性規(guī)則(Association rule)分析是數(shù)據(jù)挖掘中一種簡(jiǎn)單而又實(shí)用的技術(shù)。一個(gè)典型的例子就是“購(gòu)物籃”分析,即通過(guò)發(fā)現(xiàn)消費(fèi)者放入他們“購(gòu)物籃”中的商品之間的關(guān)聯(lián)(頻繁地共同發(fā)生),分析顧客的購(gòu)物習(xí)慣。在金融領(lǐng)域,相關(guān)性規(guī)則分析可以用來(lái)發(fā)現(xiàn)銀行客戶對(duì)所提供的金融服務(wù)于產(chǎn)品間的關(guān)聯(lián)性、不同信用產(chǎn)品價(jià)格之間的關(guān)聯(lián)性、不同市場(chǎng)變動(dòng)趨勢(shì)之間的關(guān)聯(lián)性。在信用風(fēng)險(xiǎn)管理中,相關(guān)性規(guī)則挖掘可以發(fā)現(xiàn)信貸數(shù)據(jù)庫(kù)中信貸行為和信用風(fēng)險(xiǎn)之間的關(guān)聯(lián)性規(guī)則,這些規(guī)則反映了信用主體的風(fēng)險(xiǎn)模式。

在征信服務(wù)中的應(yīng)用:可以通過(guò)相關(guān)性規(guī)則分析來(lái)發(fā)現(xiàn)一些風(fēng)險(xiǎn)關(guān)聯(lián)模式(或風(fēng)險(xiǎn)特征要素),包括,例如信用主體信貸違約和信用主體的哪些基本信息有關(guān),例如收入、職業(yè)、年齡、經(jīng)營(yíng)狀況和行業(yè)形勢(shì)等;自動(dòng)地發(fā)現(xiàn)這些風(fēng)險(xiǎn)因素的相關(guān)關(guān)系,這也是大數(shù)據(jù)時(shí)代中所強(qiáng)調(diào)的重視數(shù)據(jù)內(nèi)部蘊(yùn)含的相關(guān)關(guān)系的基本思想。從常識(shí)上來(lái)看,兩個(gè)因素可能毫不相關(guān),但是存在很強(qiáng)的關(guān)聯(lián)效應(yīng)。這就為信用評(píng)分或者其它風(fēng)險(xiǎn)量化分析選取主要的關(guān)聯(lián)因素(特征)提供依據(jù)。

三、 結(jié)語(yǔ)

征信機(jī)構(gòu)的核心資產(chǎn)是數(shù)據(jù),作為數(shù)據(jù)工廠,各種數(shù)據(jù)挖掘技術(shù)都可以得到很好地應(yīng)用。征信數(shù)據(jù)挖掘既可以面向不同的服務(wù)對(duì)象也可以應(yīng)用到不同的風(fēng)險(xiǎn)層面。本文重點(diǎn)研究的是基本征信數(shù)據(jù)挖掘:從數(shù)據(jù)角度來(lái)說(shuō),處理的信貸行為數(shù)據(jù)是最基本的征信數(shù)據(jù);從分析技術(shù)來(lái)說(shuō),所采用的數(shù)據(jù)挖掘方法不僅技術(shù)手段和應(yīng)用相對(duì)成熟而且國(guó)外知名征信機(jī)構(gòu)已有很多成功的應(yīng)用案例可以借鑒。通過(guò)對(duì)征信系統(tǒng)進(jìn)行廣泛和深入地?cái)?shù)據(jù)挖掘,不僅可以更好地進(jìn)行量化風(fēng)險(xiǎn)管理和征信系統(tǒng)維護(hù),還能為未來(lái)征信大數(shù)據(jù)時(shí)代的到來(lái)打下更好的基礎(chǔ)。

未來(lái),本研究將繼續(xù)深入地探討征信數(shù)據(jù)挖掘的相關(guān)問(wèn)題,例如如何深入開展基于聚類的客戶細(xì)分為信用風(fēng)險(xiǎn)服務(wù)。同時(shí)也關(guān)注一些熱點(diǎn)和前沿問(wèn)題,例如對(duì)基于關(guān)聯(lián)關(guān)系的征信數(shù)據(jù)挖掘,基于非結(jié)構(gòu)化數(shù)據(jù)的征信數(shù)據(jù)挖掘,以及大數(shù)據(jù)、互聯(lián)網(wǎng)金融、社交媒體、移動(dòng)終端對(duì)征信服務(wù)以及征信數(shù)據(jù)挖掘的影響用等熱點(diǎn)話題。

參考文獻(xiàn):

[1] Jiawei Han, MichelineKamber,Jian Pei.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2012.

[2] 陳建,信用評(píng)分模型技術(shù)與應(yīng)用[M].北京:中國(guó)財(cái)政經(jīng)濟(jì)出版社,2005.

[3] Bart Baesens、Tony van Gestel,Credit risk management:Basic Concepts,Oxford press,2009.

[4] 馬超群,蘭秋軍,陳為民.金融數(shù)據(jù)挖掘[M].北京:科學(xué)出版社,2008.

[5] Viktor Mayer-Sch?觟nberger、Kenneth Cukier.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2013.

[6] 中國(guó)銀行和征信中心聯(lián)合課題組研究報(bào)告.征信系統(tǒng)在個(gè)人業(yè)務(wù)信用風(fēng)險(xiǎn)管理中的應(yīng)用,2013.

基金項(xiàng)目:國(guó)家自然科學(xué)基金青年基金(項(xiàng)目號(hào):61105058);國(guó)家社會(huì)科學(xué)基金(項(xiàng)目號(hào):13CJY011)。

作者簡(jiǎn)介:楊北京(1980-),男,漢族,江蘇省宿遷市人,中國(guó)人民大學(xué)商學(xué)院博士生,研究方向?yàn)榛ヂ?lián)網(wǎng)金融與電子商務(wù),現(xiàn)就職于中國(guó)工商銀行總行;劉新海(1976-),男,漢族,河南省南陽(yáng)市人,中國(guó)人民銀行征信中心高級(jí)研究員,中國(guó)人民銀行金融研究所應(yīng)用經(jīng)濟(jì)學(xué)博士后,研究方向?yàn)榻鹑诖髷?shù)據(jù)和征信數(shù)據(jù)挖掘。

收稿日期:2015-06-10。

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識(shí)別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
主站蜘蛛池模板: 91成人在线观看视频| 亚洲欧州色色免费AV| 国产精品毛片在线直播完整版| 国产精品大尺度尺度视频| 久久这里只有精品2| 在线播放国产99re| 99热国产这里只有精品9九| 91久久夜色精品| 免费a在线观看播放| 亚洲国产日韩在线成人蜜芽| 欧美三级日韩三级| 91免费精品国偷自产在线在线| 色老二精品视频在线观看| 波多野结衣视频一区二区| 国产成人综合网在线观看| 午夜啪啪福利| 91热爆在线| 国产免费精彩视频| 久久精品亚洲热综合一区二区| 高潮爽到爆的喷水女主播视频| 国产成人av一区二区三区| 久久中文字幕2021精品| 成人年鲁鲁在线观看视频| 色偷偷男人的天堂亚洲av| 亚洲欧美不卡中文字幕| 91综合色区亚洲熟妇p| 久久无码av一区二区三区| 欧美国产在线看| 免费观看精品视频999| 91九色视频网| 国产一区自拍视频| 国产中文一区二区苍井空| 中文无码精品A∨在线观看不卡 | 特级aaaaaaaaa毛片免费视频| 久久永久视频| 伊人久久青草青青综合| 国产剧情国内精品原创| 国产精品网拍在线| 国产福利拍拍拍| 欧美特黄一免在线观看| 国产成人精品午夜视频'| 亚洲综合专区| 中国丰满人妻无码束缚啪啪| 国产精品19p| 亚洲视频四区| 欧美成人精品在线| 免费AV在线播放观看18禁强制| 午夜欧美在线| 精品第一国产综合精品Aⅴ| 亚洲一级无毛片无码在线免费视频| 69国产精品视频免费| 国产第一页免费浮力影院| 九九热视频精品在线| 99热这里只有精品在线观看| 久热re国产手机在线观看| 91探花国产综合在线精品| 亚洲成肉网| 91精品综合| 欧美日韩在线观看一区二区三区| 一区二区三区国产精品视频| 亚洲天堂2014| 成人福利在线观看| 国产精品综合色区在线观看| 人妻丝袜无码视频| 久久99蜜桃精品久久久久小说| 中文字幕有乳无码| 全部免费毛片免费播放| 久久亚洲高清国产| 日a本亚洲中文在线观看| 99re66精品视频在线观看| 五月婷婷综合在线视频| 亚洲欧美日韩色图| 国产导航在线| 亚洲无码四虎黄色网站| 亚洲AV电影不卡在线观看| 尤物亚洲最大AV无码网站| 亚洲精品在线91| 五月婷婷综合色| 美女无遮挡被啪啪到高潮免费| 国产香蕉国产精品偷在线观看 | 少妇精品在线| 国产丝袜精品|