□ 陳亮 吳榮榮 劉銀行 黃凱莉
數字革命是新一輪科技革命的關鍵領域。數字技術快速發展,深刻改變著社會經濟形態及人們的生產生活方式。建設數字中國、數字鄉村是國家重大戰略。數字化正在對傳統經營管理模式和市場競爭態勢進行深刻重塑。從行業發展狀況看,數字化時代頭部現象愈發突出。抓住產業數字化、數字產業化賦予的機遇,是實現新一輪高質量發展的關鍵。金融與數字技術具有天然的融合性,金融行業有很多數據資產,隱藏著十分有價值的信息生產力。迫切需要發現海量數據中的關聯關系,預測金融業未來發展趨勢(楊婷婷,2021)。利用數據挖掘技術可以鎖定目標客群,從而進行精準營銷,降低經營成本,提升整體效益(牛亞琴、盧苗苗,2021)。
數據挖掘在金融行業中的應用很重要的一點是客戶關系管理,企業利用數據挖掘技術對客戶進行整合營銷(楊婷婷,2021)。數據挖掘能實現對銀行客戶的畫像和產品需求的精準分析,設計各種序列的個性化營銷方案,能夠在客戶識別、客戶篩選、內容推薦等營銷環節提供精準選擇,從而有效提高營銷成功率。根據麥肯錫全球研究所的數據,數據挖掘技術可以為銀行業創造超過2500億美元的價值(陳子陽,2021)。
數據挖掘的步驟可以分為定義問題、數據搜集、數據預處理、數據挖掘、模型評估和優化(楊婷婷,2021)。客戶提升模型常用的算法有Logistic回歸模型、決策樹模型、神經網絡模型、XGBoost模型等。其中,決策樹模型的算法是分類、預測等領域的典型算法,具有速度快、準確率高的特點,被廣泛應用(路健、王立坤、李曉玉,2020)。XGBoost模型的算法包含了對特征選擇部分的內容,使用其樹模型的特點給與不同特征以重要性打分,并進行特征重要性排序(陳子陽,2021)。通過數據驗證模型,輸出模型訓練結果,用驗證集數據驗證模型訓練結果的準確性(牛亞琴、盧苗苗,2021)。
基于以上研究,本文聚焦大數據在客戶篩選與精準營銷方面運用的實踐進行實證研究,選擇了個人潛力客戶資產提升大數據分析項目作為研究樣本,以A銀行AUM(個人金融資產)1-10萬元的個人客戶為研究對象,基于這些客戶的基本信息、資產、交易流水等數據建立個人潛力客戶資產提升預測模型,通過現有客戶名單預測在營銷活動中有較大概率被成功營銷,從而使得個人金融資產顯著提升的客戶(顯著提升是指個人金融資產提高20%以上),分析大數據在客戶精準篩選與營銷服務方面的應用方法,為提升客戶營銷與服務能力提供有價值的思路、路徑、方法與技術支持,全面提升客戶經營管理與營銷服務水平。
本項目(個人潛力客戶資產提升大數據分析項目)的研究思路是“參考過去、預測未來”,即使用過去已經發生的事情預測未來是否會發生某種情況,其本質在于,利用已有的數據建立模型,并使用模型確定潛力客戶清單,指導營銷人員實施客戶篩選和精準營銷。因項目研究重在探討原理、思路、方法、技術等規律,對數據的質量和數量要求較高,對數據的時間要求較低,故而在研究過程中選擇了經過沉淀的2019年-2020年確定性數據,便于分析和深入研究,獲得更加有價值的信息(如圖1)。

圖1 研究思路圖
項目主要分為建立模型(個人潛力客戶資產提升預測模型)階段和使用模型階段:
建立模型階段主要是結合前三個月(2019年3月末)的歷史狀態(多項特征)和三個月后(2019年6月末)的AUM提升狀況對模型進行訓練,得到個人潛力客戶資產提升預測模型(模型建立階段使用的數據都是歷史數據)。
使用模型階段是通過想要預測的未來時間點(2020年1月末),將其前三個月(2019年10月末)的時間點作為基準,根據基準時間點前三個月的歷史狀態作為預測模型的輸入,模型的產出是AUM在1-10萬元的客戶中,每個客戶的AUM提升20%以上的概率。
基于業務需求分析和有關專家經驗及A銀行現有成果,針對個人潛力客戶資產提升確定了模型輸入的數據范圍。模型輸入數據涵蓋客戶基本面貌、金融資產、資金往來等信息,主要來源于大數據平臺分行數據集市,涵蓋的數據表具體如表1:

表1 模型輸入數據涵蓋的數據表

8個人保險客戶級匯總表20交易渠道字典表9個人第三方存管客戶級匯總表21網銀交易明細表10個人國債客戶級余額匯總表22第三方支付綁卡清單11個人貸款客戶級匯總表23第三方支付交易明細匯總表12個人客戶風險事件歷史表
本文選定2019年1-3月為觀察期,在觀察期內對客戶的各項特征進行計算與評估,掌握客戶在此時間區間內存在的行為特征及變化規律;選定2019年4-6月為表現期(如圖2),即觀察期后的三個月的月末作為預測時點,觀察客戶在表現期其金融資產是否提升了20%以上。

圖2 觀察期表現期示意圖
定義模型的正樣本為觀察期后三個月月末時點(2019年6月30日)金融資產提升了20%以上的客戶;定義模型的負樣本為觀察期后三個月月末時點金融資產沒有提升20%以上的客戶。
本項目模型的訓練樣本為2019年3月31日年日均金融資產在1-10萬元的客戶,共計306萬戶,其中,正樣本50萬,負樣本256萬,正負樣本比例約為1:5,即客戶自然狀態下AUM提升20%以上的概率為16.07%。
根據上述23張數據表(表1),從中提取了440項特征作為原始特征集,包括客戶基礎特征,如客戶年齡、性別、是否開通網銀、是否開通掌銀等;還包括部分衍生特征,如當月現金交易總筆數、當季第三方支付交易總筆數、柜臺季交易次數等。
數據初步加工后進行數據預處理,主要包括數據清洗:對缺失值比例大于99%的特征以及日期特征進行刪除;缺失值處理:將特征的空值使用0進行填充;異常值處理:對年齡異常值使用年齡眾數填充;數據變換:對類別特征one-hot編碼,使用蓋帽法進行變量異常處理和歸一化,對金額類連續變量進行對數變換。經過數據預處理,最終保留了324個特征變量。
基于得到的324項特征變量,對306萬客戶正負樣本數據按7:3劃分為訓練集和測試集。嘗試使用邏輯回歸模型、決策樹模型、隨機森林以及XGBOOST等4種模型進行了個人潛力客戶資產提升預測分析(如圖3)。

圖3 模型的建立與評價圖
利用已知的3月31日、6月30日數據構造的訓練集(70%)分別對各個模型進行訓練,再利用測試集(30%)分別對獲得的各個模型進行測試,即可判斷各個模型的優劣。
本項目屬于分類問題,而分類問題的評價指標主要有準確率、召回率、精確率等,通過混淆矩陣可以直觀地體現,而混淆矩陣中又包括真正例(TP)、假正例(FP)、假負例(FN)和真負例(TN),如表2所示:

表2 混淆矩陣
①準確率。表示模型正確分類的樣本數占總樣本數的比例,即整體的預測準確程度,計算公式為:

②精確率(查準率)。是針對預測結果的指標,表示模型判別為正例的結果中真正例的比例,即正樣本結果的預測準確程度,計算公式為:

③召回率(查全率)。是針對真實情況的指標,表示所有真實正例中判別結果為正例的比例,即真實正例能夠被識別出來的百分比,計算公式為:

雖然準確率能夠判斷總的正確率,但在樣本不均衡的情況下,不能作為一個很好的衡量指標。召回率和精確率通常是負相關,即召回率越大,精確率越小。在本模型中,更傾向于發現更多有潛力的個人客戶,因此更重視召回率。然而,精確率過低,會導致營銷命中率下降,營銷成本上升。因此,在這一模型中,使用Fβ值來評定模型的優劣,Fβ是精確率和召回率的加權調和平均數。

當β=1時,認為召回率和精確率重要性相同;β>1時,Fβ偏向于召回率;β<1時,Fβ偏向于精確率。經綜合考慮,本模型選擇F2.0作為模型評價的綜合指標。
同時,使用ROC曲線和AUC值來進行輔助分析。該指標與真正率和假正率有關。
ROC曲線(如圖4)是指以FPR為橫坐標,TPR為縱坐標,TPR和FPR隨著分類閾值的變換而變換所得到的曲線,而曲線下方的面積為AUC值,ROC曲線越陡,AUC值越大,模型的性能就越好。

圖4 模型ROC曲線對比圖
本文所使用的四種模型算法效果對比情況具體如表3:

表3 4種模型算法對比情況表
由對比情況表可以看出,XGBOOST算法的Fβ值顯著高于其他算法,并且AUC值也大于其他算法,因此通過對比分析,最終選擇XGBOOST作為個人潛力客戶資產提升預測模型的算法。
對于使用的XGBOOST算法,以影響模型最重要的參數為起點,按照對模型影響的重要性程度遞減方向依次對各參數訓練,每次訓練將之前訓練得到的最優解作為輸入固定,滾動迭代。
經過多輪迭代訓練,XGBoost模型最終調參結果如表4:

表4 XGBoost模型最終調參結果表
通過調參過程,基于XGBOOST算法的個人潛力客戶資產提升預測模型各項特征重要性排序如圖5:

圖5 XGBOOST算法的模型各項特征重要性排序
由此可見,在眾多特征中,當季現金流出交易筆數、當季現金流入交易金額、當季第三方支付交易總金額等是對模型預測最重要的指標,對AUM在1-10萬元的個人客戶其AUM是否提升20%以上有著最大的影響力。最終模型調優使得個人潛力客戶資產提升模型的精確率約為73.49%,召回率約為57.86%,F2.0值約為60.43%。
將2019年10月31日的樣本(約306萬AUM在1-10萬元的個人客戶及其各項特征)輸入之前建立的個人潛力客戶資產提升預測模型,生成2020年1月31日該306萬客戶AUM是否提升20%以上的預測結果(客戶號和概率),其中概率是指該306萬客戶在2020年1月31日其AUM能夠提升20%以上的概率值。綜合網點營銷能力、人員配備等因素,對得到的客戶清單進行遴選,篩選確定概率值大于50%的客戶號,即可得到最終的潛力客戶清單,共計28.75萬。
歷史數據表明,2019年3月31日年日均金融資產在1-10萬元的客戶,在6月30日AUM提升20%以上的概率為16.07%,即A銀行個人客戶在自然狀態下AUM提升20%以上的概率為16.07%。本項目建立的個人潛力客戶資產提升模型,預測精確率可達73.49%,即篩選得到的28.75萬客戶中,AUM提升20%以上的客戶概率約為73.49%(如圖6)。

圖6 客戶AUM提升示意圖
對比自然狀態,使用本模型預測后產生的客戶清單的營銷成功率預計是隨機營銷客戶的4.57倍,即只對清單內客戶進行營銷的成功率明顯大于對全量客戶或隨機客戶進行營銷的成功率。
針對最后的潛力客戶清單,于2020年1月在A銀行選取了甲乙丙丁4家支行進行模型結果驗證,從潛力客戶清單中選取34328名客戶進行專項營銷。
其中,在2020年1月底有27638名客戶的AUM提升了20%及以上,提升比例達80.51%,即篩選的客戶清單中,經過營銷后,有超過八成客戶的AUM提升了20%及以上。

表5 4家支行模型驗證結果
而在2019年10月31日AUM在1-10萬元的個人客戶約有306萬。其中,除了進行專項營銷的3.43萬客戶外,隨機營銷的302.57萬客戶中,有158.15萬客戶在2020年1月底其AUM提升了20%及以上,提升比例僅為52.27%(如圖7)。

圖7 專項營銷客戶和隨機營銷客戶AUM提升對比圖
由此可見,專項營銷客戶相較于隨機營銷客戶的金融資產提升率增加了28.24%,即通過模型預測得出的客戶清單中,潛力客戶的比例更高。本項目能夠有效地為業務部門縮小營銷范圍,有利于銀行針對潛力客戶清單進行精準營銷。不同于傳統的“廣撒網”模式,大數據精準營銷能夠讓銀行的營銷投放得到最大程度的反饋,真正做到有的放矢,減少營銷費用,節約營銷成本。
利用A銀行數據分析挖掘平臺對個人潛力客戶資產提升項目進行全流程的實施,能夠較好地完成本項目且取得較為理想的效果,專項營銷個人潛在貴賓客戶金融資產顯著提升的客戶營銷成功率為80.51%,相較于隨機營銷客戶的金融資產顯著提升的比率增加了28.24%。這說明運用大數據技術進行客戶精準篩選與營銷具有良好的效果,能夠更好地進行客戶精準畫像、開展精準營銷,從而提高營銷效率,降低盲目營銷,減少工作量,為客戶營銷與維護提供有效支撐和強有力的賦能。
同時,在工作中也發現一些需要解決的問題。一是數字化轉型的意識仍需提升。部分管理和營銷人員對大數據等數字化轉型的認識仍不充分,有的認識還比較膚淺,以為上了幾個系統、用了幾個工具就是數字化轉型了,對于數據的挖掘與應用、治理與保護等深層次認識還不足。二是對數據分析成果使用不到位。數據分析成果的使用才是數字化轉型的目的。現實中由于科技人員與業務人員有一定的溝通障礙,科技人員對業務需求的理解不夠充分,數據分析與輸出質量還有待提升,而業務人員對大數據分析理解不到位,不了解如何對潛力客戶進行營銷,應該推薦什么產品,導致分析成果利用率不高。三是科技與業務聯動融合有待加強。目前,科技部門仍是用大數據分析需求工作的主力軍。相對于業務部門,科技部門因距離市場和業務較遠,對業務經營和市場的了解有限,缺乏將業務需求轉化為數據挖掘需求的能力。業務部門對科技工作又缺乏了解,業務需求轉化為科技語言存在一定的困難。科技與業務的聯動融合需要進一步加大,發揮科技部門和業務部門在大數據分析方面的相互協同與互促互進的作用。
鑒于數字革命持續深入發展,大數據在客戶營銷管理等領域的應用越來越廣泛,具有巨大的應用價值和深遠的應用前景。筆者對相關工作提出以下幾點建議:
一是進一步提高思想認識,全面推進數字化轉型。數字化轉型是一場深刻的全方位的革命,從思維方式到生產運營,從生產方式到生產要素,從組織管理模式到市場營銷方式,全領域全過程全方位深刻重塑商業銀行業務經營與管理模式。要進一步樹立“業務數字化、數字業務化”理念,抓住企業級數據平臺建設和數字技術的深度應用,貫通內外部、上下層、不同領域、不同條線、不同業務、不同系統的數據資源,將內外部數據聚合在信息共享平臺,通過數據的搜集、整合、分析、轉化和共享,打破“數據孤島”,推進數據標簽化建設,形成數據資源庫,推動由經驗決策轉向“數據+算法”決策,由事后營銷轉向前瞻性營銷,由匹配服務轉向定制服務,釋放數據的生產驅動力,通過數據與技術、運營和管理的高效聯動,為數字化轉型提供生態環境、轉型方向、路徑選擇和價值創造。數字技術不僅包括大數據、云計算、物聯網、區塊鏈和人工智能等技術及其軟件,還包括運行這些技術所需的計算機、移動設備等硬件設施,通過標準化、服務化、快捷化的高效反應體系,建設運維數字化系統,開發升級數字技術和軟硬件設備,適應多變的發展環境,支持全面的數字化轉型。同時,要建立健全數據治理機制,探索數據獲取、分類加工、分層應用、精準治理、全面風控的全領域、全流程數據治理體系,出臺數據治理方案,提升數據治理制度化水平,有效統籌發展與安全。
二是進一步完善數據應用體系,將大數據應用推向更深更廣。要進一步優化模型算法,精準篩選和營銷潛力客戶。嘗試引入新算法,數據的收集不僅源于銀行內部,而且來自客戶日常生產生活,要不斷豐富內外部數據來源,進一步對模型進行優化。拓展模型算法深度,從市場和客戶需求的角度出發,積極探索數據算法中更適用于客戶分析的模型方式,以便改良模型構建系統,不斷提供信度和效度。實時更新模型數據,通過數據流識別重要客戶的蹤跡,實現隨時發現隨時營銷,從而更準確地篩選和營銷潛力客戶,提升智慧化預測與精準營銷服務能力。要進一步強化協同,業技部門聯動使用大數據分析成果。基礎數據的“厚度”決定了“大數據+AI”能力的起點,而數據賦能的“強度”決定了其能達到的最高點。強化部門聯動,提升業務人員特別是一線營銷人員運用大數據分析成果的意愿和能力。細分預測成果,為潛力客戶劃分推薦產品的類別,便于業務部門開展營銷工作。強化考核激勵,完善科技人員和業務人員成果運用的考核機制,加入衡量營銷精準性的指標,激發相關人員業技融合發展的積極性。要進一步拓展應用,推動大數據技術的運用范圍更廣更深。大數據技術應用是商業銀行數字化轉型的關鍵抓手,應積極探索大數據在客戶管理、精準營銷、風險防控以及決策分析等領域的應用,提升核心競爭力。在客戶管理與營銷服務領域,可以利用大數據技術開展客戶價值分析、預測分析等工作,對客戶進行精準畫像,對目標客戶群體進行細分,從而將客戶潛在需求的產品,以合適的營銷渠道和促銷策略推送給客戶。在風險防控領域,以數據分析為基礎,開發大數據風險監控模型,可建立全方位全流程的風險管理預警體系,能夠及時獲取有效的風險預警信息,進而實施有針對性防控措施。在決策分析領域,結合先進的金融數據模型,對數據進行整合、轉換、分析和挖掘,以儀表盤、餅圖等直觀方式為管理層和各業務部門提供更客觀、科學的輔助決策信息。
三是進一步提升員工數字化素養,推動數據應用創造價值。要從全行人力資源形勢和競爭態勢統籌謀劃,以全面數字化轉型為引領,制定員工數字轉型的培養規劃,從制度層面進行引導和推動縣域員工數字化轉型。按照不同類型的多維綜合考慮,從意識、知識儲備、業務技能、工具運用等多方面,制定短、中、長期培養計劃,匹配相應的培訓內容,分階段定期進行培訓和測試過關,循序漸進、持之以恒地推進員工數字化轉型。要圍繞最需要最緊缺的客戶經理、理財經理、產品經理、數據分析師“四支隊伍”著力,培養其數字化營銷服務意識、數字化工具運用能力、線上線下營銷服務與雙向引流能力、數據分析技能等核心能力,助力業務拓展與客戶服務水平提升。以打造“業技融合”的復合型人才為目標,為青年員工提供全周期、全方位的綜合化培養,鍛造一批政治合格、思維活躍、技能過硬、作風優良的數字化轉型青年生力軍隊伍,為推進全面數字化轉型提供強有力的人才支持。,堅持傳統產品數字化改造與智慧政務、數字鄉村、電商、供應鏈金融等數字化產品一體學習,組合應用。要全面掌握DCRM系統、金融小店、“數字人”、掌上銀行、微銀行等客戶營銷服務數字化工具,增強員工在線虛擬營銷服務能力,有效提升“線上+線下”協同獲客、活客、留客、粘客的系統性能力。要建立創新教育培訓的新模式,加強數字化產品、業務、工具、系統等在經營管理與營銷服務中的應用經驗與好的做法,及時進行萃取、傳播、推廣等,促進組織智慧共享與價值傳播,有效提升員工數字化素質和能力,全面賦能數字化轉型在客戶營銷與維護中的全面應用。