孫慶莉 高海霞








摘 要:進入21世紀以來,隨著投資主體趨于多元化,金融服務體系日臻完善,各種復雜工藝技術日益成熟,世界范圍內的項目大型化、群體化、復雜化的趨勢愈加明顯。伴隨著經濟全球化的深入進行和金融行業的進一步開放,我國實體金融遇到了極大挑戰,以吸引新客戶、保留舊客戶、將已有客戶轉為忠實客戶,從而為企業創造更多收益為最終目標的客戶關系管理,成為了優質的選擇。但海量復雜的客戶數據使得傳統分析方法望而卻步,數據挖掘技術在銀行CRM系統的應用研究,是在銀行CRM系統中運用數據挖掘技術,對客戶的海量業務數據進行針對性的分析和挖掘,進而達到對客戶需求的精準掌握,對客戶需求分類、對客戶分類,為銀行的決策提供支持,從而為客戶提供更優質的服務,進而實現對單個用戶價值的提高,最后達到實現利潤超額的目的。
關鍵詞:銀行CRM;數據挖掘;分類算法;樹模型
中圖分類號:F832.2 文獻標識碼:A 文章編號:1005-6432(2022)10-0064-05
DOI:10.13939/j.cnki.zgsc.2022.10.064
1 數據挖掘與客戶關系管理的關系
1.1 客戶關系管理的內涵
客戶關系管理出現在20世紀80年代的美國,剛剛從資本主義經濟危機中復蘇的美國,“接觸管理”服務出現了,以收集客戶與各種公司交流的信息為手段,幫助企業掌握正確接觸客戶的時機,CRM的概念逐步形成。CRM 是通過圍繞客戶細分來組織企業、鼓勵滿足客戶需要的行為,實現客戶與供應商之間聯系,提高盈利、收入和客戶滿意的商業策略。CRM的主要關注點在客戶,其主要目的就是建立、發展和保持良好的客戶關系,以此來提高客戶的滿意度、忠誠度以及盈利性。
1.2 數據挖掘的內涵
數據挖掘,即從巨大的、不清晰的、隨機的、繁雜的、不完整的、有噪聲的數據中挖掘出隱含在其中的、潛在的、人們先前未知的具有使用價值的信息和知識的過程。在金融業中,數據挖掘被稱作新型處理信息技術,優點是可以對海量的數據進行抓取、預處理、初步分析和綜合處理,獲得有利于產品更新和策略決策的關鍵數據。用戶數據被錄入或收集后進入系統底層的數據倉庫,由于數據的來源不同或產生數據的活動不同,存放在不同的數據表中,例如客戶數據表集、產品數據表集、客戶互動數據表集等,經由不同層次的處理系統,經過采樣、調整、統計分析或進一步的模型分析后,生成目標結果,輸出既定格式,評價后進入下一輪數據采集。
1.3 數據挖掘與客戶關系管理的關系
數據挖掘是銀行客戶關系管理的技術后盾。現代社會,幾乎所有人都會和銀行打交道,所以在這個角度上看,銀行不需要擔心客戶的數量問題。但是怎樣從數量巨大的客戶群體中找到需要建立關系的優質客戶,是新階段銀行最關心的一點。從經驗分析來看,可以為銀行提供真實效益的優質客戶包括兩類,第一類是有歷史數據記錄的高質量客戶,此類型客戶經濟實力雄厚,或者是貸款大戶(信用良好)或者是存款大戶;第二類是沒有歷史記錄的潛在的高質量客戶,其具有經濟實力,只是未曾出現在本系統中,需要銀行的管理系統去發現并留存。通過數據挖掘和CRM去發現這些有潛力的高質量客戶,使之成為本銀行系統的客戶,建立良好的業務關系,吸引優質客戶并留存原有的高質量客戶。
明確了已有的優質客戶群體后,需要通過分析和挖掘找出優質客戶的特征,發現高質量客戶的關鍵因素,根據結果對客戶進行分類,再根據分類規則擬定出個性化的客戶關系管理策略。利用數據挖掘技術分析明確用戶的真實需求,是發現和保留高質量客戶的關鍵。
2 數據挖掘技術在銀行CRM項目管理中的應用
2.1 商業銀行CRM的客戶數據內容與類型
銀行客戶數據可以分為以下三個方面。
(1)靜態數據,客戶基本信息,例如個人基本信息、已購產品、銀行服務信息。
(2)動態數據,客戶交易信息,例如客戶資金的流動、資產的分布變動等。
(3)分析信息,客戶關聯信息,例如客戶行為、情況變動、心理因素等。
這是基于經驗對所有客戶數據進行的理想劃分,但是真正的情況是:銀行已有的數據常常是日常流水的原始數據,紛繁復雜、沒有分類,如基本信息(客戶姓名、年齡、性別、電話、身份證號、婚姻情況、住房情況、家庭人口數、住址、工作單位、地點、工資收入、所在職位、總體收入)、產品情況(類型、期限等)、業務情況(客戶代碼、擔保方式、信用等級、辦理地點、服務人員編號等)。
2.2 數據預處理
幾乎所有數據庫都具有共同的特點:數據不一致、含噪聲、不完整。這是因為實踐操作中存在設備故障、信號中斷、傳輸失誤、人為錄入錯誤等,此時直接使用數據,研究結果會出現很大的誤差,所以在操作真實數據前需要進行有效的預處理。
(1)新建表單。初始觀察的數據是采用單次記錄方式的數據,各種數據庫表單混合在一起,對數據的導出造成了極大的困擾,所以用SQL語句建新表單,導出專屬本次研究的數據。
(2)缺失值與異常值的處理。操作如下:刪除貸款金額為空的數據;剔除年齡異常小的數據。
(3)脫敏處理。將姓名更換為編號,將精確的貸款次數分級為1次、2~5次、5次以上,將具體的貸款期限概括為短期貸款(≤1年)、中長期貸款(1~5年)、長期貸款(5年以上),經過本次處理,共剩余1905條數據供研究。
2.3 銀行A已有客戶特征分析
首先從樣本角度對客戶情況進行總體層面的分析,期望可以借此對銀行A客戶的基本情況有更加全面的了解。
(1)年齡分布情況,如圖2所示。
(2)性別分布情況,如圖3所示。
(3)貸款次數與貸款期限情況,如圖4所示。
2.4 樹模型的建立
分析了客戶群體的基本情況之后,開始構建模型,將整理好的數據導入SPSS軟件,操作后輸出樹模型圖以及評估模型準確性的相關結果圖,并對結果進行整理和解讀,最后基于挖掘結果對銀行客戶類型進行分析。
(1)CART樹模型的構建。樹模型如圖5所示,為了評估模型的準確率及選擇變量的重要性,同時輸出分類四格表(表2)、自變量重要性表(表3)以及Risk統計量表(表4)。
從CART生長法給出的二叉樹模型可以看出,共有6層18個節點。節點0為本樹模型的根節點;節點1、2、4、5、7、8、13、14為中間節點,是本次分類的中間過程;葉子節點:3、6、9、10、11、12、15、16、17、18,每個葉子節點都有一條路徑到根節點,形成一條分類規則,每個葉子節點對應了一條分類規則,樹模型有10個葉子節點,對應著10條分類規則。
分類規則如表1所示。
(2)CART樹模型的評價。
從表2分類四格表可以看出,樹模型預測值與觀測值相同的總體百分比為89.6%,表4可以看出Risk統計量是0.117,說明錯估概率為11.7%,預測正確率約為88.3%,模型擬合的效果比較好。分類表與風險表預測結果有1%的誤差,但是均超過85%,結果較好。
(3)基于挖掘結果的銀行客戶類型分析。從樹模型可知總體情況為:在1905條用戶數據中,54.7%的用戶也就是1042位客戶沒有依照合同時間還款;863名客戶履行條約進行還款,占總數的 45.3%。而分類最主要因素是貸款類型,申請生產經營型貸款的客戶70%以上都進行了還款,消費類的客戶有67.8%沒有依照合約還款,銀行可依據此明顯屬性進行控制。
接下來從葉子節點入手,10個葉子節點里6個節點的結果是違背合約還款,只有4種情況的客戶會履行合約。根據樹模型結果將客戶分為以下七類:
第一類:葉子節點3,貸款類型為消費類型且金額小于等于59500元的客戶。小額貸款用于消費,所以對客戶來說比較容易還款,手中的流動資金較多時就可以申請還款。
第二類:葉子節點11、12,貸款類型為消費類型,金額大于59500元且小于等于100500元的客戶,此類客戶可能是本身條件不夠好,貸款還車貸或者購買超出能力范圍的商品,所以不能及時履行合約還款。
第三類:葉子節點15、16、18,貸款類型為消費類型,貸款金額超過10萬元且年紀小于40.5歲,這類客戶可能是職場人士,在房貸和養家糊口的壓力下,資金不夠于是向銀行貸款,又由于購物等原因,無法及時還款。
第四類:葉子節點17,消費型貸款超過15萬元,年齡大于40.5歲。這類人擺脫了房貸壓力,向銀行貸款可能是由于幫子女臨時籌措購買房子的首付,但由于經濟壓力小、有積蓄(具備較高的經濟實力)而且不喜歡逾期還款,所以可以及時地履行合同進行還款。
第五類:葉子節點9,申請生產經營型貸款且以別人的擔保為條件進行貸款的用戶,在貸款次數僅有一次的情況下,很多人都沒有即時還款的積極性,或者因為自己沒有能力抵押才選擇的貸款,所以到期可能也沒有能力即時還款。
第六類:葉子節點10,生產經營型貸款的客戶,在別人擔保的情況下已經有多次貸款的記錄,別人可以多次幫助其擔保,說明其有能力還款,事實也證明了其可以履約。
第七類:葉子節點6,此類客戶以資產抵押的方式進行生產經營類貸款,其中88.4%的人由于抵押了自己的某些資產,在對資產的重視下,可以通過經營收入歸還銀行貸款,也有11.6%的人由于經營不善或者其他因素無法按時還貸。
針對以上七類客戶的特點,銀行可以制定相應的策略,增加回收貸款的概率。
3 銀行CRM項目管理的策略
3.1 客戶分類與分級管理
亞特蘭大公司曾做過一次行業調查,結果說明銀行不同等級的客戶所帶來的收益有著相當大的區別,對于前20%的客戶,收益是成本的6倍甚至更多,但是對于末尾20%的客戶,收益是成本的1/3甚至更少。這為銀行的管理提供了一個很好的思路,就是對待客戶不要“公平”,因為他們創造的價值就不是“平均”的,要讓價值高的客戶得到價值高的服務,也要使不同類型客戶對銀行的服務都可以感到滿意,這就需要分類分級管理。根據樹模型給出的基礎分類,憑借經驗羅列了七類客戶類型,并相應地給出了服務和產品推薦策略。隨著銀行CRM系統的迭代和數據更充分的利用,可以為客戶行為做出更好的分析,提供更好的分類結果和更有效的策略建議,就可以為銀行帶來更高的效益。有了這種分類和分級的辦法,當銀行出現一個新用戶的時候,就可以打破往日模式單一的應對方式,以新用戶所屬類別的服務策略做出應對方案。
3.2 客戶維護及接觸式管理
當今時代,各行各業的競爭壓力日益增大,尤其服務業的競爭,在產品類愈來愈相似的情況下,僅憑借同質性的產品是無法吸引和占據市場的。市場營銷學曾經提出了客戶的接觸式管理,用在銀行這里就是指銀行為客戶提供服務和產品,客戶在體驗了產品和服務后將感受和建議反饋給銀行,使得銀行可以得到提高與發展,從而吸引更多的客戶和利潤。客戶維護方面,以往銀行會使用同樣的營銷策略,但因為客戶的需求不同,造成人力資源的浪費,結果很不理想。所以實現接觸式管理意味著要明白客戶需要什么,后期保持客戶忠誠度時也可以明白客戶的喜惡情況。
3.3 服務產品更新迭代
在提供了明確的客戶分類服務方案后,銀行也應該清楚,客戶的類型遠遠不止這幾類,產品的類型也有著更多的對應人群,而且金融類產品很容易被模仿,所以,銀行要及時地對產品進行更新、不斷迭代,明晰客戶的需求,適時地更新自己的產品和服務,以滿足客戶群體變化的需求,讓客戶感受到產品的吸引力。保證客戶的忠誠度,就是保證了銀行的收入。現階段,銀行擁有數據挖掘技術支持的CRM系統,可以從最煩瑣的業務流程數據中分解和分析出客戶偏好,作為銀行方面的管理層和產品制定人才可以有針對性地制定新的產品方案以迭代效果較差的營銷策略,保證各個產品的購買率,保證服務人員的努力沒有浪費,保證銷售人員的高效率。
3.4 保證數據質量
數據挖掘,就是對數據進行挖掘。數據的重要性毋庸置疑,不僅僅是數量的級別要夠,數量的質量也是重中之重。如果作為任務的根本——數據的真實性存疑,那么即使選取了最好的挖掘算法也不會得到理想的結果,所以需要對數據嚴格控制,尤其在銀行這種流程復雜、數據庫繁多的系統內部,需要更加用心地控制數據源的真實性,在所有環節都要用心,這樣才能為模型的建立提供優質的數據,進而收獲高質量的挖掘結果。
3.5 適當選擇算法
數據挖掘自出現以來得到多方重視,擁有著非常多的經典算法,所以算法的選擇需要嚴肅考慮,選擇和目標匹配的算法是實現目標的關鍵,明確目的,再了解數據的情況,兩者相結合再進行算法的確定,要十分嚴謹。在模型的建立階段,訓練集數據要不斷地調整,測試集與訓練集的比重也要不斷調試,要量化真實的數據就要不斷地探索。在得到結論前,要避免過度擬合的出現,在得到結論后,也不能過度依賴分組,在結果嚴重偏離實際時考慮數據原因,并用實踐去檢驗對錯,及時更新模型合理使用結論。
參考文獻:
[1]吉陽.數據挖掘在銀行客戶關系管理中的應用研究[D].石河子:石河子大學,2016.
[2]林珊.GY公司客戶關系管理計劃[D].廣州:華南理工大學,2010.
[3]周軍.SQ集郵公司客戶關系管理研究[D].西安:西安理工大學,2006.
[4]李麥麗.基于客戶滿意度視角的S公司客戶關系管理問題及對策研究[D].青島:青島科技大學,2016.