數據挖掘是指從大量不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、有用的信息和知識的過程。其表現形式為概念、規則、模式等形式。用統計分析和數據挖掘解決商務問題。現在困擾我國信用卡產業發展的主要問題是:怎樣尋找真正的信用卡客戶?怎樣讓客戶在交易時用卡?怎樣控制風險?對于以上疑難問題,數據挖掘技術是一個行之有效的工具。
數據挖掘的作用和分類
金融機構需要搜集和處理大量的數據,對這些數據進行分析,發現其數據模式及特征,然后可能發現某個客戶、消費群體或組織的金融和商業興趣。并且,根據新觀點,用戶的行為會隨時間而變化。分析客戶整個生命周期的費用和收入就可以看出誰是最具創利潛能的,并可觀察金融市場的變化趨勢。數據挖掘可以分兩大類:預測性數據挖掘和描述性數據挖掘。預測性數據挖掘是進行數據分析,建立一個或一組數據模型,并且根據模型產生關于數據的預測。所謂預測,是指該信息是未曾料到的,即數據挖掘是要發現那些不能靠直覺發現的信息知識,甚至是違背直覺的信息或知識。挖掘的信息越是出乎意料,就可能越有價值。描述性數據挖掘是以概要的方式對數據信息進行描述,提供數據的有意義的一般性質。包括異常檢測、聚集等多種數據挖掘方法。預測類數據挖掘及描述類數據挖掘所能解決的典型商業問題包括:數據庫營銷、客戶群體劃分、背景分析、交叉銷售,以及客戶流失性分析、客戶信用計分、欺詐發現等。
信用卡風險預測與控制中的應用
信用卡業務是一個高投入、高風險和高回報的行業,關鍵是要能夠有效的控制住高風險,降低企業的運營成本,那么在這個方向,數據挖掘應用的效果將是突出的,是銀行信用卡業務應用的一大趨勢。商業銀行為了保證最大的利潤和最小的風險,必須對賬戶進行科學的分析和歸類,以及時發現問題、化解風險。
使用銀行客戶信息系統中數據庫的數據,利用數據挖掘中的變化和偏差分析技術進行客戶信用風險分析和欺詐行為預測,可以分析這些風險為什么會發生?哪些因素會導致這些風險?這些風險主要來自于何處?如何預測到可能發生的風險?采取何種措施減少風險的發生?通過評價這些風險的嚴重性、發生的可能性及控制這些風險的成本,匯總對各種風險的評價結果,進而建立一套信用風險管理的戰略和監督體系,設計并完善信用風險管理能力,準確、及時地對各種信用風險進行監視、評價、預警和管理,進而采取有效的規避和監督措施,在信用風險發生之前對其進行預警和控制。
信用卡業務上經常發生詐騙行為,如信用卡詐騙、惡性透支等,這些給銀行和商業單位帶來了巨大的損失。對這類詐騙行為進行預測,哪怕正確率很低的預測,都會減少發生詐騙的機會,從而減少損失。進行詐騙辨別主要是通過總結正常行為和詐騙行為之間的關系,得到詐騙行為的一些特性,這樣當某項業務符合這些特征時,可以向決策人員提出警告。
數據挖掘技術可以自動預測趨勢和行為。數據挖掘技術可以自動在銀行的數據庫中尋找預測性信息,構造出風險預測模型,以幫助銀行事先發現具有潛在欺詐性的事務。對欺詐的偵測可以通過對數據進行聚類分析來進行。由于欺詐性付款通常都具有某些獨有的特征,如在短期內發生多次付款,而且較多出現在新辦理的信用卡上,因此通過對數據的聚類分析可以將數據劃分為較可能出現欺詐的組和不大可能出現欺詐的組。聚類分析的結論一旦得到驗證,就可以此為基礎構造出一個針對信用卡欺詐的分類挖掘模型。以往需要進行大量手工分析的問題,如今可以迅速直接由數據本身得出結論。
信用卡風險控制模型設計
通過建立預測性或描述性的模型,能夠有效完成信用卡風險管理的相關工作。信用卡風險控制模型包括動態信用額度調整模型(客戶當前信用等級評估)、信用評分模型(客戶初始信用等級評定)、欺詐監測模型(異常性客戶消費分析)等。
信用評分模型 信用評分模型是以現有客戶的基本信息、歷史交易數據的關聯表現,描述出現有客戶的信用等級分布特征。同時建立預測性的信用等級模型,對新申請的信用卡客戶通過填寫的基本信息進行打分,并確定新客戶的初始等級。
信用額度動態調整模型 信用額度動態調整模型主要是解決信用卡持卡人的信用額度調級以及還款拖延催收等問題。也就是當一個客戶還款出現了延滯,是否一定要對其進行催收,如果催收,催收的力度應該怎么控制;當一個客戶經常出現信用額度不夠用或只能使用信用額度的很小一部分的時候,銀行應該怎么調整信用額度。信用額度動態調整模型用客戶過去的行為數據和規律來判斷客戶未來信用好壞的概率。有了這個概率,就可以對信用好的客戶調高信用額,出現延滯的也可以不馬上催收,即使催收也只要提醒客戶就可以了。這樣不但可以保持與客戶之間的良好關系,還可以降低操作成本。
信用卡風險預警模型設計 信用風險預警模型也就是欺詐監測模型。由于信用卡交易不需密碼,致使信用卡交易發生欺詐的可能性比借記卡要大很多,欺詐損失占信用卡業務成本的相當一部分,因此國外銀行或信用卡公司普遍使用欺詐監測模型來監測每一筆交易,盡可能減少欺詐損失。欺詐模型的建立方法主要是基于概率分布的檢測方法:利用概率中的小概率事件被檢測到的可能性很小的原理,通過確定信用卡透支與還款次數的分布函數,求出其小概率事件的邊界值,通常設其概率值為0.05。
傳統的風險管理已無法有效控制跨區域、跨部門、跨行業的多種風險,利用科學的數據挖掘技術提高欺詐的防范,降低信用卡業務的風險尤為重要,對客戶進行科學評估造成風險的因素,有效規避信用卡的業務風險,建立完善的信用卡發卡及用卡的風險防范機制,對于銀行信用卡業務的蓬勃發展有著重要意義和價值。
(作者單位:內蒙古阿拉善職業技術學院)