999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于先驗信息分類的客戶消費動態終身價值估計研究

2022-12-15 11:18:18熱依木江克里木
新疆財經大學學報 2022年4期
關鍵詞:分類

熱依木江·克里木

(中國科學院大學,北京 100190)

一、引言

品牌營銷即通過營銷手段提升品牌在需求者心目中的綜合形象(品牌價值),在這一過程中,想要識別某一具體品牌的核心價值則需考慮其在目標消費者群體中的影響力以及與競爭者品牌的差異性,而考慮目標消費者群體,實質上就是考慮如何更加準確地細分消費者(客戶細分),因而針對品牌消費者進行消費者行為分析是品牌營銷的重要內容。

從現有關于構建區域產業品牌策略的研究中可以發現,客戶(消費者)是品牌資產的關鍵驅動要素。在對客戶的分析中,Ascarza[1]認為并非每個客戶都會在停止消費前作出正式的取消合約行為(例如注銷賬號)。同樣地,也并非每個客戶都會保證下次繼續消費。僅使用當前客戶的整體消費數據進行客戶分析可能會忽略某些客戶消費行為的動態變化,如高消費客戶可能已經考慮不再繼續消費,而第一次消費的客戶,即使消費金額較高也可能未來不再進行高頻度消費而直接進入消費末期。因此,有必要從時間維度出發考察客戶在不同消費時點上階段歸屬的變化,從而更好地動態擬定針對不同客戶群體的品牌營銷策略。目前學界在分析評估客戶消費階段時存在兩個困境:一是某些客戶在樣本期內僅消費一次;二是客戶的消費行為未必總是按照消費的生命周期階段進行,可能存在大幅向前或向后而跳過中間階段的情況。前一個問題多由數據信息不足引發,后一個問題則可視作分類問題,即將客戶分為包含所有消費生命周期階段的客戶與僅包含部分消費生命周期階段的客戶。若要準確地對客戶消費行為進行動態階段識別,需使用合理的假設與工具處理上述兩個困境帶來的不利影響。

本文通過SMOTE方法合理增加多次消費客戶的消費行為數據后,使用非監督學習的受限玻爾茲曼機計算每個客戶包含各消費階段的初始概率,再采用區制轉移動態因子模型,并以不同區制代表客戶消費行為所處的不同生命周期階段,從而計算動態變化的顧客終身價值(CLV)。

二、基于消費周期階段的客戶分類及CLV計算

(一)通過SMOTE方法平衡數據

現實中,大多數消費行為數據中消費頻率和消費總金額的分布往往呈現明顯的右偏特征,消費次數很多和消費總金額很大的客戶數量相對較少,但這些客戶往往是品牌營銷的主要目標,因此有必要對其消費行為進行動態分類與預測,從而更好地制定維護這類客戶消費的策略。然而,較少的樣本數量增大了預測這部分客戶消費行為的難度,同時非平衡數據也使得機器學習方法無法總結出少數類的類別特征,可能導致對這部分客戶的分類出現偏誤,因而有必要對數據進行平衡調整,合理增加虛擬的消費次數很多和消費總金額很大的客戶樣本數量。

平衡數據主要有以分層抽樣為代表的概率抽樣方法、以過采樣和欠采樣為代表的比例抽樣方法以及二者結合的混合抽樣方法,這3種采樣方法的主要思路均是調整每次抽樣時多數類與少數類的比例,主要從抽取概率或者抽取比例上入手。鑒于本文主要考察客戶從屬于不同類別的概率,調整抽取概率可能會影響客戶實際從屬概率,因此選擇從抽取比例上進行數據平衡。目前從抽取比例上進行數據平衡主要有過抽樣與欠抽樣兩種思路,欠抽樣在每次訓練時需舍棄一部分多數類中的樣本從而減小多數類與少數類兩種類別間的差異。本研究中數據非平衡程度較高,利用欠抽樣可能要舍棄大部分多數類樣本,不能滿足機器學習訓練集的樣本量要求,且欠抽樣可能使得機器學習無法充分掌握少數類客戶的特征,與了解重點客戶的初衷不符,因此選擇過抽樣方法。SMOTE方法是一種經典的過抽樣方法,其在簡單隨機過采樣方法上進行了擴展。簡單隨機過采樣方法通過簡單復制少數類樣本來平衡數據,這會導致模型出現過擬合、模型訓練集泛化程度不夠等問題,在應用于新的數據集時其分類效果會大打折扣,而SMOTE方法主要采用插值法為少數類增加新的樣本。假設訓練集中少數類樣本數為nminority,多數類樣本數為nmajority,合成樣本數為anminority,a為正整數。對于少數類中的一個樣本i,其包含的變量構成的向量為xi,xi的k個近鄰記作xi(j),其中j=1,…,k。從xi的k個近鄰中隨機選擇一個樣本xi(j),并用均勻分布隨機生成一個0~1之間的數值ζ,則新的合成樣本可以表示為依此重復a次并對每個少數類樣本進行這樣的操作,則可生成anminority個新的樣本。通過調整a數值進而調整多數類與少數類的比例,可使后續神經網絡對少數類的分類有更高的準確性。

需要說明的是,k和a的取值需根據后續通過神經網絡估計得到初步分類的結果進行調整,本文參考薛薇[2]的做法,在使用SMOTE方法增加樣本數量時主要考慮靈敏度、特異度、查準率、查全率和AUC值。第一次訓練前設定k=1、anminority=nmajority進行第一次初步分類,令得到的各類別均值的平均差異為----Δxˉ、組間標準差為sdinter、組內標準差為sdinner;然后令k增加1而anminority減少并進行分類訓練,計算得到類別間3個指標的數值,若當----Δxˉ、sdinter增加而sdinner減少時,則再次增加k并減少anminority。由于3個指標可能并不同時滿足上述變化條件,客戶分類目標是區別各客戶類別的動態行為,因而可將----Δxˉ與sdinter的幾何平均變化作為兩個變量修正的終止條件,即當----Δxˉ與sdinter的幾何平均不再增加時則停止兩個變量的修正,將此時得到的穩定初步分類結果作為最終的初步分類結果。

(二)基于受限玻爾茲曼機的初步分類

在動態計算每個客戶消費階段歸屬概率前,需通過受限玻爾茲曼機識別客戶的先驗類別,判斷客戶消費是否包含所有的消費階段。先驗類別可為后續分類提供依據,并為階段歸屬概率的計算提供先驗信息。受限玻爾茲曼機是一種可進行無監督學習的人工神經網絡,無監督學習的主要優勢在于不需依賴先驗信息便可進行數據分類,能夠避免錯誤先驗信息帶來的干擾。將無監督學習得到的分類作為先驗分類信息可以較充分地利用數據本身的特征,增強最終階段歸屬概率識別的穩健性。受限玻爾茲曼機的結構主要分為兩層,即可見的輸入層及不可見的識別層,兩層的層內單元間沒有關聯而兩層間則進行全連接。假設輸入層包含n個輸入單元即n個樣本,每個樣本可能包含k個變量;同時假設識別層包含m個單元即劃分為m個類別。分類的主要邏輯是運用輸入層與識別層的能量函數計算不可見的識別層的條件概率,并運用Sigmoid激活函數判斷輸入層對應的識別層單元,最終實現對輸入層分類的目的。學界一般使用對比散度算法(CD算法)對受限玻爾茲曼機進行訓練,主要做法是比較當次估計的參數,如對于隱藏層節點權重與上次估計參數間的熵,當二者較為接近時則認為分類效果較理想,可以進一步使用經典的反向傳播算法對參數進行調優從而使模型達到局部最優。這種方法稱為逐層貪婪訓練法,其不僅可解決訓練速度慢的問題,還能找到較好的模型參數初始值。

基于受限玻爾茲曼機和客戶RFM(最近一次消費recency、消費頻次frequency、消費金額monetary)數據的初步分類思路如下:一是根據RFM指標對客戶數據進行整理并進行異常值調整、標準化處理等,參考許靜[3]的研究,同時考慮到受限玻爾茲曼機需二值型輸入,故本研究使用Min-Max法進行標準化處理。當指標為正向指標時,其數值x的標準化公式為當指標為負向指標時,數值x的標準化公式為二是將處理后的指標納入受限玻爾茲曼機模型以得到初始客戶類別。Pfeifer[4]將客戶消費周期分為考察期、發展期、成熟期、衰退期、終止期5個階段,但最后一階段不再發生消費行為或者只發生極少數消費行為,可以觀測到消費行為的階段一般只有4個,且對于僅消費一次客戶,其后續轉移到第二階段與第三階段的概率是未知的,可將這兩個階段合并為消費中期階段,因此消費生命周期便可劃分為3個階段,即消費初期、消費中期和消費末期。本研究只考察樣本期內開始消費的客戶群體,類別數m取值為3,代表了消費階段組合的3種情況,即包含所有消費階段、僅存在消費初期、僅存在消費初期與消費末期。

(三)基于區制轉移動態因子模型的客戶分類及CLV計算

在進行數據平衡與客戶初步分類后,便可計算每個時期客戶屬于某消費階段的概率。客戶的消費行為包括最近一次消費R、消費頻次F、消費金額M共3個維度,需綜合各維度信息提取客戶消費行為特征,動態分析客戶消費行為在每個時間點上屬于各階段的概率。動態因子模型可以較好地提取不同維度中包含的共同信息,而加入帶區制轉移的狀態變量則可同時給出客戶屬于各消費階段的概率。因此,本研究使用區制轉移動態因子模型估計客戶動態階段概率,模型形式如下:

式(1)中,xit為第i個客戶在t時期的消費行為變量R、F、M,向量ft是客戶消費行為變量的共同因子,eit為各變量的特質性部分,為便于研究假設ft、eit均服從一階自回歸。αi為第i個客戶的因子載荷系數,β、γi為ft、eit的自回歸系數,εt、ηit為ft、eit自回歸過程的擾動項,假設其服從均值為0的正態分布,標準差分別為σε、σi。μSt為客戶消費行為最可能歸屬消費階段的因子均值,且滿足μSt=μ0+St μ1,其中μ1>0,St可取值0、1、2,代表客戶消費生命周期的3個階段。St服從一階Markov鏈,轉移概率矩陣為:

式(2)中,pij代表從i狀態轉移到j狀態的概率,即pij=Pr(St=j|St-1=i),其中i、j取值為0、1、2(狀態0、1、2分別對應消費初期、消費中期、消費末期)。可以看到,在給出每個客戶每個時間點上所屬階段的同時,上述模型也能給出客戶在各時間點上屬于每個階段的概率,所屬階段以外的從屬概率相對較小。

Pfeifer[4]認為處于不同生命周期階段的客戶,當不考慮最后一個狀態時,其轉移概率除了從i狀態轉移到i+1狀態非零外,僅有所有狀態轉移到0狀態非零,也就是說,其將客戶最近一次消費的時間點作為消費狀態的代理變量。這樣做的好處在于對轉移概率矩陣作出了較強的假設,減少了需要估計的變量。但與此同時,其假設過程可能導致對客戶的分析并不符合現實中客戶消費行為的動態變化特征。本研究中,客戶僅有3種可能的消費狀態,跨階段轉移僅有狀態0和狀態2之間,因此可以放寬假設認為存在跨階段轉移,而不必擔心過多參數帶來的估計問題。

對于僅消費一次客戶,由于計算CLV時并不能獲知其后續狀態演進過程,故假定其后續兩個狀態相應的轉移概率由消費金額決定,即不論是從初始狀態0轉移到狀態1還是狀態2,又或是從狀態1、狀態2轉移到其他狀態,其概率均以消費金額進行模擬。相較于多次購買客戶第一次消費金額的中位數,僅消費一次客戶消費金額越高則認為其向狀態1轉移的概率越大,反之則向狀態2轉移的概率越大。狀態1、狀態2的消費總金額與消費次數通過倒“U”形函數與隨機擾動項進行模擬,消費時間則以實際值來降低模擬帶來的對僅消費一次客戶的評價提升。這是因為如果消費時間仍使用模擬數值,則默認僅消費一次客戶后續還會繼續消費,但其實并不能確定其后續是否真的會繼續消費,這將使對僅消費一次客戶的評價過高,因此對僅消費一次客戶的消費時間使用實際值來避免這種情況的發生。具體而言,假設僅消費一次客戶的實際消費總金額為y,則模擬的狀態1和狀態2的消費總金額可以寫作:

式(3)中,yi表示i狀態下模擬的消費總金額為某客戶依最大概率所屬類別內的平均消費金額,ε服從正態分布,其均值為0,標準差由某客戶依最大概率所屬類別內消費總金額的標準差決定。同時,對于消費次數也有類似設定,不同之處在于因僅消費一次客戶的消費次數為1,故每個時間點上或每個消費階段上的消費次數不會進一步減少,因此每個階段上消費次數的變化可表示為:

本研究根據包含的消費階段數量將客戶分為3類:第一類客戶僅包含消費初期,第二類客戶包含消費初期與消費末期,第三類客戶包含所有3個消費階段。式(4)中,后兩個階段消費次數的構建方法是在前一階段消費次數基礎上對其增加一個隨機整數。η1服從初步分類后消費中期客戶中消費總金額大于僅消費一次客戶消費總金額的消費次數減1的分布,η2服從消費末期客戶中消費總金額大于包含了虛擬消費金額的僅消費一次客戶消費總金額的消費次數減1的分布。從后續初步分類結果中可以發現,第二類與第三類客戶均包含消費末期,因此此處η2服從的分布由第二類客戶與第三類客戶中消費總金額超過75%分位數的部分組成。在決定了消費次數后,依據不同階段客戶消費最近時間分布特征決定僅消費一次客戶后續兩個階段的消費最近時間。上述調整雖對僅消費一次客戶的后續消費行為假設較強,但仍不失為增加多次消費客戶消費行為信息的有效方法。多次消費且消費總金額較大的客戶是銷售者最為關注的群體,通過虛擬僅消費一次客戶的消費行為來進一步剖析這類人群的消費行為動態變化特征,有助于為銷售決策的制定提供更加豐富、合理的建議。

對于區制轉移動態因子模型,本文參考Kim[5]的研究,使用Gibbs抽樣方法對參數集進行估計。由前文可知每個客戶從屬于不同階段的概率在每個時間點上均是變化的,因此在每個時間點上均能得到每個客戶的CLV,其為客戶從屬于每個階段的概率與該階段客戶CLV均值(由區制轉移動態因子模型中的狀態均值得出)的乘積。參考Chiang[6]的研究,本文以固定權重計算客戶平均CLV,得到WR=0.197,WF=0.366,WM=0.437,即消費最近時間、消費頻率、消費總金額權重分別為0.197、0.366、0.437。

三、基于庫爾勒香梨銷售數據的實證分析

(一)SMOTE平衡與受限玻爾茲曼機分類結果

本研究所用數據來源于京東、淘寶天貓、京東樂鮮關于庫爾勒香梨的97348條交易記錄,時間跨度為2017年9月1日至2017年11月30日。由于時間長度相對較短,因此研究中將每個星期作為一個時間節點,總時間長度T為12。數據顯示,僅消費一次客戶占比為87.23%,因而僅就消費頻率而言消費數據的分布就存在明顯的右偏現象,在使用SMOTE方法增加多次消費客戶的數據總量并通過受限玻爾茲曼機的識別訓練后,確定k、a兩個參數值分別為3和4。通過計算可知,當a=4時單次消費客戶數量約為多次消費客戶數量的1.7倍,這與薛薇[2]計算出的臨界值基本一致。下面以消費總金額和消費最近時間為例說明SMOTE方法平衡數據的效果。

圖1給出了多次消費客戶(10767條數據)的消費總金額與消費最近時間的分布情況,可以看到,相較于原始數據圖中消費總金額較多的數據樣本較為缺乏的情況,SMOTE方法平衡后的多次消費客戶(43068條數據)在消費總金額與消費最近時間的維度分布均較為均勻。

圖1 SMOTE平衡前后少數類部分數據分布情況

圖2給出了僅消費一次客戶(73679條數據)的分布情況。可以看出,經SMOTE方法平衡后,多數類與少數類消費總金額的K-L散度由1.25變為0.83,分布變得更為相似,對于消費最近時間也有類似結論,K-L散度由0.005784降至0.005764。同時,多次消費客戶信息由10767條增至43068條,與僅消費一次客戶的信息比由0.1277∶0.8723變為0.369∶0.631。

圖2 多數類部分數據分布情況

通過穩定的SMOTE過抽樣增加樣本點后多數類與少數類分布特征如表1所示。由消費總金額的變化可知,該方法增加了多次消費客戶的總記錄數,其對分布的影響主要體現在標準差的減少上,其他指標無太大變化,保留了多次消費客戶的類別特征,在增加記錄信息數量的同時減少了多數類與少數類的差異,為模擬多數類中僅消費一次客戶后續消費行為提供了相對合理且更加豐富的數據基礎。

表1 消費總金額平衡前后的指標變化

續表1

因此,可以認為通過SMOTE方法增加多次消費客戶消費行為數據是可行且有效的,其不僅增大了少數但重要客戶消費行為的信息占比,減小了多數類與少數類的分布差異,還可保留少數類的大部分分布特征,具備良好的增加數據量的特質。此外,根據Hinton[7]關于受限玻爾茲曼機的參數建議,設定對比散度的迭代運行次數為1000,隱藏層節點數為150,批量隨機梯度下降中每個mini-batch中包含10個訓練樣本點,動量為0.5,稀疏性目標為0.01,可得到如圖3所示的隱藏層部分節點權重圖。

圖3 受限玻爾茲曼機部分隱藏層節點權重(前30個節點)

進一步地,根據權重結果可計算初步分類后不同類別客戶消費的差異,此處以消費總金額為例給出各類別的多個統計量,如表2、表3所示。由表2和表3可知,三類客戶統計量均具有明顯差異,特別是標準差與組間統計量,第三類客戶不論是與其他類別相比或者相比于類別內部,其消費總金額均具有較大差異,這主要是因這些客戶的消費次數與消費最近時間具有較大差異,呈現顯著的右偏特征,從而導致即使第三類客戶平均消費金額與其他類別差異不大,但總金額均值仍遙遙領先,而中位數差異則小得多。這一特點在組間標準差上也能得以體現。從初步分類后的結果來看,在不考慮客戶消費行為動態特征時,受限玻爾茲曼機對客戶消費行為具有良好的分類效果。

表2 初步分類后不同類別客戶消費總金額統計量(一)

表3 初步分類后不同類別客戶消費總金額統計量(二)

進一步觀察三類客戶可以發現:第一類客戶消費次數基本為1,同時包含少數消費次數為2的客戶(596名);第二類客戶消費次數大多介于2~5次之間,僅有少數消費次數為1次的客戶(400名)和消費5次以上的客戶(68名);第三類客戶均為消費5次以上(最多為14次)的客戶(1082名)。消費次數最多的消費者數據主要由原始數據以及由這些原始數據生成的約30%的虛擬數據構成。從消費最近時間來看,三類客戶并沒有顯著差異,均在2017年10月15日左右,標準差為3日,這可能是因SMOTE方法在劃分多數類與少數類時,兩類消費次數差異更大,而消費最近時間差異相對較小,因此SMOTE方法并不能生成更多能夠明顯區分兩類客戶消費最近時間的虛擬客戶數據。分析原始數據中消費次數較多的客戶可以發現,消費次數超過5次的客戶具有最小的平均消費最近時間,即2017年11月10日,而消費1次與消費2~5次的客戶平均消費最近時間沒有太大區別,即2017年10月6日與2017月9月28日。綜合最近一次消費R、消費頻次F、消費金額M這3個維度的信息推斷可知,第一類對應僅存在消費初期的消費者,而第二類、第三類對應于存在消費中期與消費末期行為的消費者,由于后續計算中假設消費末期的消費總量小于消費中期,故此處假設第三類對應于包括消費三階段的消費者,而第二類則對應于除消費初期外僅包含消費末期的消費者。從消費最近時間上來看這種假設也是相對合理的,消費2~5次客戶的原始消費最近時間距離基準時間最遠。

綜上可知,在提供靜態先驗分類信息方面,受限玻爾茲曼機具有良好特質,其劃分的三類客戶在消費總金額和消費次數上均具有顯著差異,消費最近時間上雖然差異較小,但結合包含消費階段的推論可知,消費最近時間在三類間仍存在一定差異。因此,在SMOTE方法基礎上,如不考慮動態效應,則使用受限玻爾茲曼機是對客戶消費行為進行分類的較好選擇。

(二)基于區制轉移模型的客戶所屬類別概率變化特征與CLV

前文3種不同類別的客戶本質上可劃分為僅消費一次客戶與多次消費客戶,因此下文以分屬兩種情況的不同類別中較為典型客戶的消費行為特征為例,分析區制轉移模型估計的客戶消費階段的動態變化特征以及屬于各個不同階段概率的變化情況。

1.第一種情況(僅消費一次)的典型客戶分析。僅消費一次客戶在初步分類中基本可歸屬于第一類別,因此本研究在歸屬于第一類別且消費金額在33~34元的客戶中隨機抽取,將第一類別(共112242名客戶)中的第7008號客戶作為分析消費階段歸屬概率動態變化的例子,該客戶的消費總金額為33.9元,僅消費一次,消費最近時間為2017年10月1日。根據式(3)與式(4)模擬增加該客戶的消費總金額、消費次數與消費最近時間,消費總金額增加為33.9+316.8=350.7元,消費次數增加為1+6=7次,消費最近時間為2017年10月21日,模型參數估計結果如表4和表5所示。需注意的是,表中區制順序分別為消費初期、消費中期與消費末期,對應的典型類別代表分別為受限玻爾茲曼機中的第一類、第三類與第二類。表5中p01、p11、p21數值在轉移概率矩陣各行中最大,意味著典型的僅消費一次客戶在后續消費過程中,如果參照其他多次購買客戶的平均水平,則處于消費中期的概率最高,且由其他狀態轉移到消費中期的概率也更高;同時,p12數值在轉移概率矩陣其所在行中最小,可以認為多數情況下典型僅消費一次客戶會進行多次消費,但未必會到達消費末期,可能在消費中期就停止消費行為,這與Ascarza[8]的研究結論類似,即消費者可能在消費早期或消費中期就停止進一步的消費行為。此外,p20數值也較小,說明當該消費者進入消費末期后很可能不會再次回到消費初期,即當營銷條件等外部因素不變時,其不太可能重新燃起消費商品的欲望。對于階段均值也可以得到類似的結論,即消費中期具有最大的消費總金額均值,此時消費者具有最大的高消費可能性。

表4 僅消費一次典型客戶(7008號客戶)區制轉移動態因子模型的主要參數

表5 僅消費一次典型客戶區制轉移動態因子模型的轉移概率矩陣

僅消費一次客戶由于時間維度上數據相對缺失而使用其他多次消費客戶的數據進行補足,故而大多體現出多次消費客戶的平均傾向,但數據補足的基本假設符合邏輯與數據集特征。第一次消費總金額越大的客戶越有可能進行多次消費,并且不容易直接進入消費末期;同時,數據補足也為識別多次消費客戶的消費行為動態特征提供了更多的模擬數據,例如單次最小消費金額與單次最大消費金額均在僅消費一次客戶群體中,起到了時間維度上SMOTE平衡的作用。此外,通過每個時間點上7008號客戶屬于每個狀態(消費階段)的概率可以計算其在每個時間點上的CLV,結果如圖4所示。由圖4可知,在7008號客戶的7次消費中,前2次屬于消費初期的概率較大,中間第3~5次被判斷為消費中期(以第二類、第三類客戶的平均水平來說),最后2次則被判斷為消費末期。在這個過程中,雖然屬于非歸屬階段的概率相對較小,但平均來說仍有9.26%,并不屬于可以忽略的概率值,因此,在計算該客戶的動態CLV時必須考慮非歸屬階段帶來的影響。

圖4 僅消費一次客戶的動態CLV

2.第二種情況(多次消費)的典型客戶分析。多次消費的客戶在初步分類中既有屬于第二類也有屬于第三類的。從前述分析可知,第三類似乎最有可能包含客戶消費的所有階段,因此,本研究從第三類中隨機抽取典型客戶與僅消費一次的典型客戶(即第一類客戶)進行對比分析,第二類客戶也能得到類似結論。本研究抽取第三類(共350名客戶)中的第31號客戶進行分析,該客戶的消費總金額為362.4元,消費次數為6次,消費最近時間為2017年9月26日。通過構建該客戶的區制轉移動態因子模型,可以得到主要參數結果如表6、表7所示。由表中數據可知,從均值來看,多次消費客戶在3個階段的均值與僅消費一次客戶的虛擬數據差別不大,這也驗證了僅消費一次客戶后續數據的可靠性,至少在該數據集中其后續數據的假定是符合現實情況的。從轉移概率來看,結果顯示其在進入消費末期后轉移回之前階段的可能性很小。當然,這可能是因該客戶本身就有退出消費的傾向,其最后一次消費總金額大幅下降,從而導致消費末期階段的狀態均值相對表4僅消費一次客戶生成虛擬的多次消費數據后的平均傾向小得多。同時,客戶維持在消費中期的可能性相對較大,這與表5情況類似。主要原因是31號客戶的消費次數與7008號客戶生成虛擬消費數據后較為接近,消費最近時間也有一定的共同性,消費間隔較為穩定,一個約為10天,一個約為7天,且后續消費并未出現,這進一步驗證了31號客戶退出消費的可能性。此外,相對于僅消費一次客戶后續消費的特征而言,31號客戶的αˉi較小而σˉη較大,且其3個維度的異質性更強,共同變化的因素影響相對較小。

表6 包含所有消費階段典型客戶(31號客戶)區制轉移動態因子模型的主要參數

表7 包含所有消費階段典型客戶區制轉移動態因子模型的轉移概率矩陣

類似于僅消費一次客戶的情況,本研究使用各個時間點上31號客戶的階段從屬概率與其RFM數據可計算得到如圖5所示的CLV動態變化情況。

圖5 包含所有消費階段典型客戶的動態CLV

從第一類和第三類典型客戶的區制轉移動態因子模型的估計結果和動態CLV的估計結果中可以發現,區制轉移動態因子模型可以較好地識別客戶在不同時間點上所處的消費階段。另外,不論是通過整體樣本均值虛擬得到的第一類典型樣本還是由真實數據產生的第三類典型樣本,估計得到的動態CLV均呈倒“U”形特征,符合理論模型的預測結果,說明使用區制轉移動態因子模型具有較好的消費階段識別能力和較準確的客戶動態CLV估計能力。

四、結語

(一)研究結論

現有研究中,在分析客戶消費行為類別以及在計算CLV時,先驗信息與僅消費一次客戶的行為特征未被充分重視,這可能導致消費行為的跳躍性被忽略,對低頻率消費客戶的分析也不夠合理。本研究通過SMOTE方法虛擬增加了數量較少但較重要的多次消費且高消費金額的客戶樣本數據,從而更好地估計占樣本大多數的僅消費一次客戶后續的消費行為。在足夠數據支撐的基礎上,本研究通過受限玻爾茲曼機較好地提取了多維數據中的概率分布特征,對客戶跳躍性消費行為進行分類,為動態消費階段的識別和CLV的計算提供較為準確的先驗信息。在獲得先驗分類信息后,本研究使用區制轉移動態因子模型為非線性客戶消費階段變化提供了較為穩健的模型分析框架,在此基礎上計算客戶在每個時間點上從屬于不同消費階段的概率,從而計算得到更為準確的動態CLV,并采用庫爾勒香梨的網絡銷售樣本數據進行示例分析。實證結果表明:通過SMOTE方法增加數據后,多次消費客戶的消費行為在消費金額和最近消費時間上的分布變得更加均勻,并且與多數類(僅消費一次客戶)的分布更為相似,但分布的統計量則變化不大。這意味著SMOTE方法在模擬增加重要客戶消費行為數據方面具有很好的效果。而以受限玻爾茲曼機進行初步分類后得到的先驗信息也是如此,初步分類后三類客戶各維度上表現出明顯不同,分類效果優良。使用典型客戶的區制轉移動態因子模型進行的研究則證明了以多次消費客戶對僅消費一次客戶的后續消費行為進行模擬具有一定的合理性,二者的動態CLV均呈現倒“U”形特征,僅消費一次客戶的預期CLV較高。

(二)研究貢獻與局限

本研究測試的動態客戶分類方法能夠提供更為充足的客戶信息,進而為制定庫爾勒香梨品牌營銷、構建品牌聯合體及產業化發展等策略提供科學合理的動態信息,使得及時修正或填補營銷與發展策略中未考慮完全或有所疏漏的部分成為可能。特別是對于庫爾勒香梨這種季節性較為明顯的商品而言,動態分析極為重要。在客戶信息不足如僅消費一次客戶數據較多的情況下,仍能為重點客戶群體提供較高質量的類別動態信息,進而為及時預警、維護重要客戶提供決策依據,同時也使得制定適合重要客戶的針對性營銷策略成為可能。此外,本研究對于客戶維護具有一定的啟示意義。例如,第一次消費總金額較大的客戶,其進行多次消費的可能性較大,并且不易直接進入消費末期,對于此類客戶,企業需要為其提供更好的服務和體驗,并進行定期的營銷推送來喚醒其重購動機。同時,對于那些典型的僅消費一次客戶,研究表明其在后續消費過程中如果參照其他多次購買客戶的平均水平,則處于消費中期的概率最大,且由其他狀態轉移到消費中期的概率更大;同時p20數值較小,說明當該消費者達到消費末期后很可能不會再次回到消費初期,即當營銷條件等外部因素不變時,不太可能重新燃起消費該種商品的欲望。因此,此類客戶極可能成為潛在的流失對象,企業需多關注這一類別的客戶,可以通過電話回訪或者營銷促銷等策略激發客戶的參與興趣。

本研究也存在一些不足,如對于僅消費一次客戶,其真實消費行為模式其實是未知的,模擬數據主要源于已有觀測數據的平均值,并不能很好地預測極端數據或者具有新的消費模式的消費者CLV的變化情況,因此在未來的研究和實際應用中,還需依據后續觀測數據進行修正,盡量避免已有數據帶來的過擬合情況。

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數據分析中的分類討論
按需分類
教你一招:數的分類
主站蜘蛛池模板: a毛片在线| 国产精品视频系列专区| 久久精品中文字幕少妇| 91小视频在线播放| 无码免费的亚洲视频| 无码 在线 在线| 狠狠亚洲五月天| 2021天堂在线亚洲精品专区| 国产午夜人做人免费视频中文| 伊人婷婷色香五月综合缴缴情| 国内99精品激情视频精品| 手机在线免费不卡一区二| 久久一本精品久久久ー99| 99热这里只有精品在线观看| 国产主播一区二区三区| 呦视频在线一区二区三区| 亚洲天堂久久| 欧美精品H在线播放| 国产91小视频| 日韩av无码精品专区| 九色综合视频网| 国产精品无码翘臀在线看纯欲| 精品国产电影久久九九| 一级不卡毛片| 亚洲欧洲日本在线| 成AV人片一区二区三区久久| 亚洲日韩精品欧美中文字幕| 亚洲精品久综合蜜| 欧美www在线观看| 毛片大全免费观看| 99青青青精品视频在线| 亚洲国产精品不卡在线 | 欧洲精品视频在线观看| 中文字幕乱码中文乱码51精品| 亚洲天天更新| 免费无码网站| 波多野结衣爽到高潮漏水大喷| 美女潮喷出白浆在线观看视频| 久久国产亚洲欧美日韩精品| 国产高颜值露脸在线观看| 国产91线观看| 国产精品吹潮在线观看中文| 欧美日韩国产综合视频在线观看 | 天天综合网色| 五月综合色婷婷| 国产美女91呻吟求| 国产成人精品视频一区视频二区| 亚洲一区第一页| 白浆视频在线观看| AV在线麻免费观看网站| 免费毛片a| 亚洲中字无码AV电影在线观看| 国产成人凹凸视频在线| 久久一级电影| 亚洲成网站| 91热爆在线| 国产在线专区| 亚洲无卡视频| 午夜视频免费试看| 亚洲不卡无码av中文字幕| 四虎精品国产AV二区| 国产午夜无码片在线观看网站| 国产一级视频久久| 91久久偷偷做嫩草影院精品| 国产亚洲现在一区二区中文| 色有码无码视频| 99re免费视频| 亚洲一级毛片在线观| 国产精品自拍合集| 日韩A∨精品日韩精品无码| 黄网站欧美内射| 精品伊人久久大香线蕉网站| 制服丝袜在线视频香蕉| 精品乱码久久久久久久| 国产精品久久久久久久久kt| 91高清在线视频| 中文字幕无码制服中字| 免费视频在线2021入口| 中文字幕波多野不卡一区| 一本视频精品中文字幕| 欧美啪啪视频免码| 日本亚洲欧美在线|