王子君 梁峰



摘 要:客戶未來活躍度和購買頻次信息對客戶關系管理具有重要決策參考價值。文章基于國內某大型石化企業成品油客戶購油數據,采用MBG/CNBD-k模型對客戶未來活躍度及購買頻次進行建模,研究結果表明,該模型對客戶流失率預測具有較高的準確率,有助于石化企業及時發現可能流失的客戶,針對性地開展客戶維系與挽留措施,減少客戶流失。
關鍵詞:MBG/CNBD-k模型;客戶活躍度;客戶購買行為預測
中圖分類號:F274 文獻標識碼:A 文章編號:1005-6432(2022)13-0137-04
DOI:10.13939/j.cnki.zgsc.2022.13.137
1 引言
在客戶關系管理中,非契約客戶與企業關系不受合同影響,客戶轉移成本較低,客戶未來活躍度信息對于營銷決策具有重要價值。管理者可以依據客戶活躍度預測,提升營銷政策的精準性,通過對客戶活躍度細分,及時采取措施降低客戶流失率。目前,預測客戶購買活躍度主要有兩大類方法:一類是機器學習模型,例如邏輯回歸模型[1]、決策樹模型[2]、支持向量機[3]等;另一類是概率模型,例如Pareto/NBD模型[4-5]、BG/NBD模型[6-7]、MBG/NBD模型[8]、MBG/CNBD-k模型[9]等,這兩條技術路線均有各自的追隨者。MBG/CNBD-k模型是新提出的針對客戶購買行為的概率建模方法[9],其對經典Pareto/NBD概率模型進行了改進,由于提出時間較短,其預測效果尚未得到廣泛驗證。文章基于國內某大型石化企業成品油客戶購油數據,使用MBG/CNBD-k模型對客戶活躍度及購買頻次構建模型,增進客戶管理相關領域對MBG/CNBD-k模型的認識及推廣應用。
2 MBG/CNBD-k模型簡介
2.1 模型設定
MBG/CNBD-k模型建立在MBG/NBD模型的基礎之上,模型有六個基本假設。
(1)在客戶活躍時,客戶與企業交易的動機和行為是隨機的,并且客戶交易次數服從交易率為λ的泊松分布,客戶交易時間間隔服從k階愛爾朗分布,其概率密度為:
當k等于1時,MBG/CNBD-k模型退化為MBG/NBD模型,k值越大意味購買時間間隔的規律性越強。
(2)不同客戶之間的交易率存在異質性,既有頻繁購買客戶,也有購買一次之后流失的客戶。假定交易率λ在不同客戶間的異質性服從形狀參數為r和尺度參數為α的伽瑪分布,其概率密度為:
不同客戶交易率的平均值為E[λ|r, α]=r/α,方差為D[λ|r, α]=r/α2??蛻舻慕灰茁适艿絽祌和α的共同影響。
(3)每個客戶存在一個不可觀測的生命周期,假定客戶每次交易后變得不活躍的概率為p,允許客戶在首次交易便以概率p退出,客戶退出時間點服從幾何分布。
(4)假定客戶流失概率p的異質性服從形狀參數為a和尺度參數為b的貝塔分布。與伽瑪分布相比,貝塔分布其變量取值范圍介于0到1之間,適合用于描述未知概率值的變化。
其中B(a, b)為貝塔函數, 可以用伽瑪函數表示為:
不同客戶流失概率的均值為E[p|a, b]=a/(a+b),故客戶的流失概率受到參數a和b的共同影響。
(5)交易率λ和流失概率p相互獨立。
(6)觀測期從客戶第一次購買開始。
2.2 參數估計
MBG/CNBD-k模型除了需要客戶在觀測期內的重復購買次數x、交易關系時間長度tx 以及觀測截止時間T三個方面信息之外,還加入一個反映客戶購買時間間隔規律性的變量,記為litt,這是MBG/CNBD-k模型與之前提出的概率模型一個重要不同之處。客戶交易時間間隔是否具有規律性,對于預測客戶活躍度具有重要影響,litt近似為客戶交易時間間隔的對數和,表達式如下:
其中ti表示第i次交易時間,ti+1-ti為交易時間間隔。litt值越大,客戶購買時間間隔規律性越強。
MBG/CNBD-k模型中,隨機選擇的客戶在時間T活躍的條件概率為:
客戶在未來一段時間內條件期望交易次數為:
模型中的五個參數k, r, α, a, b可以通過式(9)的最大似然法估計得到,樣本的似然函數如下。估計程序使用R語言BTYDplus程序包。
根據式(7)和式(8),代入客戶歷史購買信息(x, tx, T, litt),可以計算客戶在觀測期結束時客戶活躍度及在未來指定時段的期望購買頻次。
3 實證分析
3.1 數據處理及描述統計
本研究選取國內某大型石化企業成品油客戶交易數據,數據包含約5萬客戶的80余萬條購油交易記錄,交易時間為2017年1月到2019年10月。對數據的轉換主要包括以下幾個方面。
(1)剔除數據中企業內部交易記錄,該類交易屬于非市場化的交易行為。
(2)構建客戶交易特征變量。將原始數據中同一客戶分布在多行的交易信息進行匯總,測算每一客戶在觀測期內除首次購買之外的重復購買頻次x;觀測期內第一次交易與最后一次交易的時間間隔tx;客戶在觀測期內第一次交易到觀測期截止的時間間隔T,計算客戶時間規律性變量litt。四個預測變量的描述性統計如表1所示。
3.2 實驗設計
為防止模型出現過擬合,客觀評價模型的預測效果,本研究將數據分為訓練數據集和測試數據集,訓練集為從全部樣本客戶中隨機抽取80%樣本客戶,測試集為剩下20%的樣本客戶。并將訓練集和測試集劃分為觀測期和驗證期,觀測期為2017年1月到2019年6月客戶交易數據,驗證期為2019年7月到2019年10月數據。使用訓練集觀測期數據估計模型參數。452F8187-7752-45FF-A17F-EB9E6F421547
MBG/CNBD-k模型對客戶流失率的預測效果使用預測準確率、精確率、召回率、特異度、F1值五個指標綜合評價。將預測的活躍度與客戶后期實際購買情況對比,使用KS曲線選擇活躍度閾值,作為流失預測臨界點??蛻艋钴S度大于或等于該閾值為未流失客戶,小于該閾值為流失客戶。
3.3 參數估計結果及預測效果
代入樣本客戶信息(X=(x, tx, T, litt)),式(9)最大似然法得到估計參數結果為:k=2, r=0.87, α=15.09, a=0.37, b=3.53,代入式(7)得到客戶2019年6月30日的活躍度。根據KS曲線選擇MBG/CNBD-k模型活躍度閾值為0.8。MBG/CNBD-k模型準確率為81.55%,指在模型預測結果中預測正確的樣本占總樣本數的81.55%;精確率為88.47%,指在模型預測為流失的客戶中預測正確的樣本所占比例,模型精確度越高,第一類錯誤越低;召回率為80.22%,指在真正流失的客戶中模型預測為流失的客戶占真正流失客戶的比重,召回率越高,第二類錯誤越低。這三個指標互相補充,綜合反映模型的估計結果,遠高于隨機判斷。
4 MBG/CNBD-k模型發現的客戶購買行為規律
通過對比模型測算的客戶活躍度及其購買特征,發現客戶在觀測截止時間點的活躍度與其購買特征存在以下規律。
4.1 最近購買時間距離當前越近,活躍度及未來復購頻次越高
具有相同復購次數客戶,客戶最后一次購買時間距離觀測截止點的時間越近,即tx與T差值越小,其計算得到的活躍度概率及未來交易次數越高。這表明與客戶之間沒有交易的時間越長,客戶流失的可能性越大。表2列出若干個隨機抽取的客戶,客戶6和客戶2重復購買頻次x及客戶時間規律litt相同,客戶6距離當前時間更短,其活躍度及未來復購頻次高于客戶2。
4.2 復購頻次越高,活躍度及未來復購頻次越高
客戶最后一次購買時間距離觀測截止點的時間相差不大,客戶重復購買頻次越高,客戶活躍度及未來交易頻次越高,如表2中,客戶7和客戶5時間規律litt及客戶最后一次購買時間距離觀測截止點的時間相差不大,客戶7復購頻次更高,其活躍度及未來復購頻次高于客戶5。
4.3 規律購買客戶具有更高的活躍度及復購頻次
客戶實際復購頻次及最后一次購買時間距離觀測截止點的時間間隔相差不大,客戶購買時間規律性litt越大,客戶活躍度及未來交易頻次越高,如客戶3和客戶4復購頻次及最近度相近,客戶4時間規律性越大,其活躍度及未來復購頻次高于客戶4。
4.4 最近購買時間對活躍度及未來復購頻次的影響高于復購次數及購買規律性
客戶最后一次購買時間距離觀測截止點時間間隔比復購頻次對活躍度及未來交易頻次的影響更大,如客戶2和客戶6活躍度及未來復購頻次變化幅度,遠大于客戶5和客戶7的變化幅度;客戶最近度影響比時間規律性對活躍度及未來復購頻次的影響更大,如客戶2和客戶6活躍度及未來交易頻次變化幅度大于客戶3和客戶4。
4.5 客戶活躍度與購買頻次正向相關
隨著客戶活躍度增大,客戶購買可能性和客戶未來復購次數也隨之增加,詳見表3。客戶活躍度小于0.8,發生0次購買的客戶占比較大,表明購買概率較低,可認為該客戶已流失;客戶活躍度大于或等于0.8,發生0次購買的客戶比例明顯下降,發生多次購買的客戶比例顯著增加。
從以上分析可知,采用KS曲線確定流失臨界值的效果較好。客戶活躍度臨界值對預測客戶購買行為具有重要作用,客戶活躍度大于或等于該臨界值,客戶與企業發生交易的概率顯著提升。
5 小結與應用建議
MBG/CNBD-k模型在預測客戶活躍度和重復購買頻次有較好的準確度,企業可將其用于客戶關系管理,作為石化企業預測客戶行為的決策依據,有助于石化企業維持客戶。企業根據客戶活躍度和未來重復購買頻次對客戶進行細分,實行不同類型的客戶差異化管理。針對MBG/CNBD-k模型的應用,文章提出以下建議。
5.1 根據客戶活躍度進行客戶分類管理,提升營銷的精準性
根據客戶預測活躍度可將客戶分為兩大類客戶:活躍客戶和不活躍客戶。在活躍客戶中進一步識別出零星活躍客戶,零星活躍客戶是指模型預測為活躍,但是兩次購買時間間隔較長的客戶。針對不同類型客戶采取個性化管理措施。零星活躍客戶在活躍與流失之間搖擺,挽留這類客戶是企業營銷工作的重點,可以給企業帶來較大價值。針對活躍客戶應采取定期回訪措施,保持客戶的活躍度。不活躍客戶是已經流失的客戶,應該分析其流失原因,屬于近期流失還是早已流失,針對近期流失的采取必要的挽留營銷措施。
5.2 定期根據客戶交易特征數據開展客戶活躍度預測,了解客戶活躍總規模
活躍度除了設置閾值判斷客戶活躍程度,反映具體客戶的流失情況,還可以運用MBG/CNBD-k模型計算客戶活躍度,然后將所有客戶的活躍度進行加總,以此估算企業客戶總規模??蛻艋钴S度總和反映企業有購買需求的累計客戶數量,該統計指標是對以客戶人數記錄測度客戶規模指標的一個補充,幫助企業了解客戶總體滿意度的變動。
參考文獻:
[1]周靜,周小宇,王漢生.自我網絡特征對電信客戶流失的影響[J].管理科學,2017(5):28-37
[2]張宇,張之明.一種基于C5.0決策樹的客戶流失預測模型研究[J].統計與信息論壇,2015(1):89-94.
[3]夏國恩,馬文斌,唐嬋娟,等.融入客戶價值特征和情感特征的網絡客戶流失預測研究[J].管理學報,2018,15(3):442-449.
[4]齊佳音,李懷祖,舒華英,等.SMC模型在IT分銷業的實證研究[J].中國管理科學,2003,11(6):71-76.
[5] SCHMITTLEIN D C,MORRISON D G,COLMBO R.Counting your customers: who-are they and what will they do next?[J].Management Science,1987,33(1):1-24.
[6]吳昊,王純,周立娟.BG/NBD模型的手機閱讀業務客戶價值預測實證研究[J].計算機系統應用,2013(3):166-169.
[7] OEST R V,KNOX G.Extending the BG/NBD: a simple model of purchases and complaints[J].International Journal of Research in Marketing,2011,28(1):30-37.
[8] BATISLAM E P,DENIZEL M,FILIZTEKIN A.Formal response to “Erratum on the MBG/NBD Model”[J].International Journal of Research in Marketing,2008,25(3):227-227.
[9] PLATZER M,REUTTERER NADINE S.Leveraging purchase regularity for predicting customer behavior the easy way[J].International Journal of Research in Marketing,2020(12): 194-215.
[基金項目]文章得到教育部人文社科基金(項目編號:19YJA790052)資助。
[作者簡介]王子君(1998—),女,漢族,湖北人,碩士,研究方向:客戶關系管理;通訊作者:梁峰(1977—),男,漢族,廣東人,副教授,博士,研究方向:經濟統計、數據挖掘。452F8187-7752-45FF-A17F-EB9E6F421547