【摘要】數據挖掘作為一項新的商業信息處理技術,在我國的商業銀行信用卡業務中有著很大的應用價值。本文從數據挖掘的含義出發,探討了數據挖掘分析方法及實施步驟,在此基礎上,對其在信用卡業務中的應用優勢進行了分析。
【關鍵詞】數據挖掘信用卡商業銀行
目前,我國信用卡業務發展面臨著一些難題,怎樣尋找真正的信用卡用戶,怎樣維持信用卡發行機構與信用卡用戶之間的關系,怎樣控制信用卡業務中的風險等,都困擾著我國信用卡發行機構與管理機構。對于這些問題的解決,以大量數據管理為基礎的數據挖掘技術是一個行之有效的工具。
一、數據挖掘的含義
數據挖掘是新興的一種決策技術,并且隨著信息技術不斷發展而逐漸完善。自1995年在加拿大蒙特利爾召開第一屆知識發現和數據挖掘學術會議以來,數據挖掘一詞在各行各業流行開來,其基本技術含義是從大量、不完全、有噪聲、模糊、隨機的數據中,提取隱含在其中的,事先不知的,但又具有潛在價值的信息和知識的過程。從這個定義,我們直觀地將數據挖掘過程比喻為在“數據礦山”中尋找蘊藏的“知識金塊”的過程。從商業價值角度,商業運行中存在著海量數據,如果僅憑簡單的傳統統計分析方法,是很難將大量數據中無用信息剔除掉的,數據挖掘作為一種新的商業信息處理技術,通過抽取、轉換和分析商業數據,揭示隱藏在其中未知的規律性,并對其進行模型化處理,從而為商業決策起到輔助作用,在一定程度上解決“數據大爆炸而知識極貧乏”的現象。
對商業銀行而言,這種“數據大爆炸”的現象表現地更為突出,商業銀行作為一類特殊企業,其每天的業務會產生大量數據,雖然目前各家商業銀行應用的數據庫系統能夠實現數據錄入、查詢、統計等工作,但卻無法發現這些數據背后存在著的隱藏關系,很難通過現有數據成功預測未來趨勢。另一方面,商業銀行是一個收益與風險并存的行業,在其經營與運作中就必然存在風險因素,數據挖掘這一技術除了可以發現隱藏在大量數據背后的規則外,還能有效減少銀行存在的風險,這些優勢在商業銀行信用卡業務中表現地更為淋漓盡致。
二、數據挖掘的實施步驟及分析方法
(一)數據挖掘一般可分為以下實施步驟
1.問題提出。問題提出是數據挖掘過程的首要步驟,只有明確了所要解決的問題,才能夠使后續的挖掘工作有針對性地開展。
2.數據源選擇。數據挖掘的實施對象是大規模的數據,因此,選擇數據源成為數據挖掘工作中的一個基礎步驟,數據既可以是現有業務處理系統中的數據,也可以是數據倉庫中的數據。
3.數據準備。在實施數據挖掘工作之前,對數據做好前期的準備工作是十分必要的一個步驟。在這一階段,主要完成對數據的獲取,清洗,轉換和裝載四個環節。
4.建立模型。這一階段是數據挖掘的主體階段。
5.驗證并修正模型。由于模型的結果有些是有實際意義的,而有一些則沒有實際意義,因此需要根據經驗,不斷地調整挖掘模型,重復進行挖掘工作,使挖掘的有效性得以實現。
6.預測并決策。數據挖掘作為一種技術層面上的決策技術,其最終目的是輔助決策,因此決策者根據挖掘結果,結合實際情況,做出正確的決策策略。上述這一過程要反復進行,在反復的過程中,不斷地趨近事物本質,不斷地優化問題的解決方案。
(二)信用卡業務應用中主要的數據挖掘分析方法
由于數據挖掘是知識發現的特定步驟,因此,按照知識發現的驅動因素將其進行分類,會使數據挖掘體系更加完善。其中的驅動因素分別是驗證驅動型與發現驅動型。在每種驅動類型下又包含著多種具體的挖掘分析方法。在信用卡業務中,目前主要使用的幾種分析方法是:
1.分類分析。這是通過分析具有類別的樣本的特點,得到決定樣本屬于各種類別的方法。
2.聚類分析。依據是生物學中的“物以類聚”原理。它將樣本數據聚集成不同的組,并分別加以描述,它與分類分析的不同之處在于,聚類劃分的類是未知的,而分類是已知數據對象的組數。比如,在信用卡持卡群體中,利用聚類技術,將客戶群體進行劃分。
3.關聯分析。這是一種發現數據間關聯模式的方法,如:菜籃分析,即通過了解消費者購物籃中所購物品相關性來輔助決策者制定相應營銷策略,調整物品的擺放次序,制定正確的促銷方案,以擴展客戶購買的產品范圍,吸引更多的客戶。
三、數據挖掘在商業銀行信用卡業務應用中的優勢
(一)發展成熟的基礎技術
數據挖掘技術在商業銀行信用卡業務中應用的基礎技術目前已經發展地較為成熟,大多數商業銀行信用卡部門已經掌握了搜索數據的途徑,加之高性能的計算機處理器配置,以及傳統的數理統計分析方法等,都可以讓數據挖掘技術有一個很牢靠的技術支撐。
(二)不斷完善的數據倉庫建設
數據倉庫是一個面向主題的,集成的,時變的,非易失的數據集合(W·H·Inmon,1996),它是數據挖掘的一個重要的預處理步驟,最早的數據挖掘基本上是以關系數據庫系統為挖掘平臺,而隨著數據倉庫的建設,數據挖掘開始以數據倉庫作為其挖掘平臺,數據倉庫是有效進行數據挖掘的基礎。
(三)區別于傳統數據分析方法的特點
大多數傳統數據分析方法都是以完善的數學理論作為基礎,使用這些方法對數據做出的分析與預測雖然說還比較令人滿意,但由于其強大的數學根基,因此對分析者的要求很高,然而數據挖掘卻有別于傳統分析方法,它在傳統方法的擴展基礎上,借助高性能的計算機為后盾,采用諸如決策樹這樣的方法,幾乎不用太多的手工勞動,就可以實現許多價值分析。
運用數據挖掘技術,加工處理信用卡消費群體的消費行為信息,對不同潛在價值的客戶進行區分,最大程度地提高業務利潤。如在市場細分模型中,銀行可根據客戶消費水平和基本特征對客戶群分類,如按照持卡人對銀行利潤貢獻價值大小分為“金牌客戶”,“銀牌客戶”,“銅牌客戶”;也可按照持卡消費時間長短分為“鐵桿客戶”,“會員客戶”,“普通客戶”。這樣,銀行就可以制定不同的客戶市場戰略,配置不同的服務產品,在一定程度上激勵低價值客戶向高價值客戶轉變的心理。通過市場細分挖掘出影響客戶消費行為的內在與外在因素,信用卡發卡機構的競爭實力會大大提升。再如客戶關聯服務模型,通過找到具有同一消費行為的客戶進行促銷,當其在用卡消費購買某一種高價值產品時,可在一定時間范圍內和特定場所,對其購買消費的另一種產品或服務在價格上給予一定數額優惠。這樣不僅滿足了客戶消費需求,而且還進一步增強了客戶對發卡行的滿意感和忠誠感,為維持穩固的客戶關系奠定了深層基礎。
總之,數據挖掘作為新興技術,在信用卡業務領域中發揮著重要作用,加之業務特有的流程復雜性,伴隨產生的數據類型會越來越多,因此,在信用卡業務發展中應積極進行數據挖掘的應用。
參考文獻
[1]R·格羅思(美).數據挖掘[M].陜西:西安交通大學出版社,2001.
[2]約翰(B(考埃特,愛德華(I(愛特曼,保羅(納拉亞南.演進著的信用風險管理[M].北京:機械工業出版社,2001.
[3]張嫻.數據挖掘技術及其在金融領域的應用[J].金融教學與研究,2003,(4).
[4]蔣纓.數據挖掘技術在商業銀行中的應用趨勢分析[J].甘肅社會科學,2003,(5).
作者簡介:李娟(1982-)女,陜西西安人,經濟學碩士,現供職于陜西省行政學院教務處。