覃宜霜 陶雯 賈建雙 張健



摘 要:為了更好地評價零售戶對工業企業的價值,本文將行業內外數據融合,構建了品牌市場需求畫像、消費環境畫像和消費者畫像,挖掘出內外部因素與品牌市場需求的關系,并以此為基礎提出了一種全新的基于三大畫像的價值客戶智能篩選模型,建立零售戶標簽池,優選真龍品牌的價值客戶。基于本文研究的模型在真龍(海韻中支)卷煙的終端營銷過程中,實現精準選點、指導與服務,幫助企業更好地運用終端資源培育品牌,使營銷服務更有目的和成效,更好滿足消費者需求,促進品牌的高質量發展。
關鍵詞:市場需求畫像;消費環境畫像;消費者畫像;價值客戶
一、研究現狀
零售戶作為卷煙和消費者之間的紐帶,是煙草工業企業連接市場最關鍵的環節。隨著行業高質量發展的深入推進,在零售戶價值評價研究領域,國內越來越多學者開始探索卷煙零售戶價值預測與評價工作,以提升零售終端在卷煙營銷中的“紐帶”作用。
漳州煙草陳巧玲等研究面向零售客戶的客戶價值模型,建立了客觀準確的客戶價值評價體系。濟寧煙草閆磊從當前價值和潛在價值兩方面設計卷煙零售客戶價值指標體系,采用K-Means進行客戶聚類,為精準營銷、客戶經理職業化等工作提供更加細致的客戶細分依據。福州煙草祖強以卡諾模型理論為基礎,從消費者需求研究、需求項目分類、零售客戶評價標準、實際運用和管理等方面,探索構建面向消費者的零售客戶分類評價體系。廈門煙草秦琴采用層次聚類法對零售戶和消費者群體進行分類,從多維度、全方位得出零售戶和消費者的畫像。柳州煙草玉明濤運用顧客金字塔模型,選取毛利貢獻額、品牌經營寬度、重點品牌上柜銷量等核心指標對客戶進行評級分類。
總結以上研究不難發現,現有學者圍繞客戶畫像、消費者畫像等運用“互聯網+”、大數據等新興技術,做出了大量深入、細致的研究,也有不少學者嘗試運用行業內大量數據對煙草商業客戶畫像、客戶價值評價等方面進行研究,但從煙草工業企業角度進行客戶價值的相關研究較少。
本文從工業企業卷煙營銷實際應用出發,運用大數據技術,研究基于客戶需求畫像、消費環境畫像和消費者畫像的客戶價值預測,對煙草工業企業定位自身品牌的高價值零售戶、開展卷煙精準營銷工作具有一定的參考價值。
二、三大畫像技術原理與實現
為深度挖掘行業內外部因素與品牌市場需求的關系,本文融合卷煙交易、市場采集、消費者、外部POI、商圈、消費能力等數據,建立了以“商圈”為核心的卷煙市場需求、消費環境和消費者三大畫像。
1.基于商圈地圖實現多源數據打通
沃頓商學院大衛·貝爾教授在《不可消失的門店》中提出“消費者行為與其消費環境息息相關”的核心觀點。同樣地,卷煙營銷價值鏈中涉及消費者、零售終端、卷煙品牌、產品、商圈、消費環境各個要素,要素間相互影響、相互作用,形成復雜的關系網。結合實際業務應用場景,我們基于商圈地圖分析挖掘人、貨、場三個維度數據,實現多源數據的打通。
(1) 商圈地圖的繪制
路網將城市劃分為多個閉合的區域,這些區域由于交通、地理位置、環境因子等因素具有不同的商圈消費價值。以公共開放的城市路網數據為基礎,通過深度學習圖像識別算法,自動識別原始數據包含的區域繪制商圈,實現目標市場的細分。
(2) 數據導入
將零售終端地址的經緯度、商零交易數據、POI數據、消費能力數據、商圈數據、消費者掃碼數據的地理位置信息等,按經緯度打入商圈地圖,并對以上所有數據按商圈網格進行匯總、清洗、去除異常值,補足缺失商圈的數據。
(3) 數據打通與衍生
人貨場多維數據打通需要的基礎數據及打通方式如表1所示。
2.建立三大畫像模型
(1) 市場需求畫像
①模型目標
現行貨源投放方式易造成卷煙的異常流動,運用歷史失真的數據無法準確判斷多變的市場需求,結合商圈數據,提升市場需求畫像的準確性。
②模型思路
使用零售戶近1年的歷史訂購數據,利用特征工程技術以人工特征選擇作為輔助手段,選擇有效特征作為輸入(主要有上柜率趨勢、訂足率趨勢、季度銷量趨勢、月銷量趨勢、月訂購次數趨勢、節假日信息、總訂足率、總上柜率、環境特征等),使用Prophet時間序列預測模型以商圈為單位對未來每周/月的銷量進行預測,得到市場需求畫像。
③模型結果與呈現
如圖1所示,可以查詢真龍(海韻)在每個商圈的市場需求趨勢及不同商圈+擋位網格的市場需求指數,結果顯示高端、混合和交通商圈對真龍(海韻)的市場需求指數較高。
(2) 消費環境畫像
①模型目標
基于行業卷煙數據和商圈環境數據的融合分析,探索商圈消費環境與卷煙規格需求之間的相互關系,挖掘驅動卷煙銷售的真實原因,進而提升客戶價值預測的準確率。
②模型思路
首先,計算品規在每個商圈網格各周的投放量、訂購量、上柜率、訂足率、市場需求預測值的數據,運用矩陣分解得到商圈-周的特征矩陣,通過因子分析評估不同消費特征商圈對目標品規的貢獻度,挖掘其優勢商圈,形成消費環境畫像。
③模型結果與呈現
如圖2所示,真龍(海韻)的優勢消費環境主要集中在混合、高端、交通、商業等,即這些消費環境對真龍(海韻)的貢獻度相對較高。
(3) 消費者畫像
①模型目標
融合消費者、商圈數據,實現消費者標簽化管理,精準描繪消費者畫像,指導客戶精準服務。
②模型思路
基于商圈地圖融合分析消費者掃碼數據、商圈數據、消費能力數據,運用GIS技術,以消費者掃碼地理位置的經緯度在商圈地圖上統計分析真龍品牌的消費者數據,并采用RFM模型細分消費者形成畫像(如圖3)。
消費者畫像主要包括以下內容:
a、消費者對品牌的態度:購買量、購買頻次、掃碼量、掃碼頻次;
b、商圈、消費者數據融合分析。
·不同類型商圈消費者的忠誠度分析(購買量、購買頻次、購買間隔、掃碼量、掃碼頻次);
·不同商圈消費者最喜歡的消費時間。
三、基于3大畫像的價值客戶預測體系
本預測體系主要在卷煙市場需求、消費環境和消費者三大畫像的基礎上,構建客戶價值指標體系,實現客戶價值的預測。
1.指標計算及處理
(1) 指標計算
結合營銷經驗分析法,對行業內外數據進行挖掘分析,構建品規客戶價值評價指標體系。該體系分為當前價值和潛在價值兩個維度,指標集不僅包括了零售戶的擋位、業態、所屬商圈、訂購量、訂購次數等基礎指標,還包括基礎指標在不同時間尺度(周、月)下各數據項歷史前期的平均、變化比率、方差、趨勢等,及復雜變換后的衍生指標,如訂購周期、商圈屬性、優勢環境因子等,共30個指標。
(2) 數據清洗
數據清洗是對數據進行重新審查和校驗的過程,目的是刪除重復信息、糾正錯誤,確保數據一致性,清洗的內容包括:
①錯誤值修正。
②KNN(k-Nearest Neighbors)缺失值處理:首先,用KNN計算每個樣本缺失值臨近的K個數據,后將每個缺失值的特征填補為所選擇的K個鄰居的均值。
③異常值處理:采用孤立森林(Isolation Forest)算法進行異常值檢測。
(3) 指標初篩
運用特征工程技術進行零售終端價值預測指標的初篩。特征工程,是指用一系列工程化的方式從原始數據中篩選出更好的數據特征,以提升模型的訓練效果。
一是數據標準化。對數值型數據進行標準化,減少指標量綱對預測結果的影響。
二是啞變量化處理。對業態、商圈類型等離散型數據啞變量化,為檢驗其對結果的影響,提高預測模型的精度,需將其轉化為數值變量。
三是指標初篩。從業務角度,基于決策樹對指標的重要度進行排序,初步篩選指標。
2.客戶價值預測模型
(1) 模型相關算法原理
本文采用專家打分法和One-Class SVM機器學習模型相結合的方式,篩選出價值客戶,然后基于相似度實現價值客戶的預測。
首先,使用專家評分法(Delphi Method)建立價值客戶的評價標準,步驟如下:
①選擇專家:選擇一組具有行業相關知識與經驗的專家參與評估。
②第一輪調查:向專家發送問卷或問題,要求他們提供答案或評分。
③匯總反饋:收集所有的反饋并匯總。
④第二輪調查:將匯總的反饋發送給所有的專家,并要求他們考慮其他專家的觀點,并在必要時修改自己的答案或評分。
⑤再次匯總:再次匯總反饋,并根據需要重復第2~4步,直到達到相對穩定的共識或足夠的迭代。
同時,結合One-Class SVM算法篩選典型價值客戶。One-Class SVM機器學習模型是一種無監督算法,主要用于異常檢測。其目標是找到一個在高維空間中最大化間隔的超平面,該超平面將大多數數據點與原點分開。與常規的SVM不同,One-Class SVM只使用一個類別的數據進行訓練。One-Class SVM的主要參數:kernel,定義數據轉換到新特征空間的方式。常見的核函數有linear(線性)、poly(多項式)、rbf(徑向基函數)和sigmoid核函數。參數nu(在[0,1]范圍內)表示異常點的上限比例和支持向量的下限比例,它確定訓練誤差和支持向量的數量。Gamma,對于rbf、poly和sigmoid,gamma是一個重要的參數,當gamma為auto時,會使用1/n_features。當gamma為scale時,則使用1/(n_features*X.var())作為gamma的值。
(2) 預測步驟
本文搭建的價值客戶預測模型分為四步:指標確定、價值客戶篩選、典型價值客戶篩選、基于相似性度量的客戶價值預測。
①基于專家打分法與皮爾遜系數確定價值指標
首先,對初篩后的指標使用專家打分法進一步篩選,找出所有與客戶價值有線性相關性的指標,然后采用皮爾遜相關系數計算這些指標之間的協方差矩陣,挑選出相關系數大于0.7的指標對,使用專家評分法去除每個指標對的其中一個,剩余所有指標作為使用指標,提取出14個有效指標(如圖4)。
②價值客戶篩選
使用最終指標,通過專家評分法,對每個投放擋位的客戶分別進行多輪選擇(測試品規投放25~30檔6個擋位),在每個擋位選取出所有專家認可的35個價值客戶,共210個。
③典型價值客戶篩選
對這210個最有價值客戶,使用One-Class SVM算法學習其數據典型分布,并進行離群點預測,根據預測值去掉10個最可能的離群點。
本文通過交叉驗證以及專家意見評價,確定了最佳參數組合:kernel = rbf,nu = 0.05,gamma = scale。
將剩余的200個數據點使用UMAP降維方法將多維數據降到三維并可視化,從不同可視角度選擇了10個數據點作為典型價值客戶。從不同角度進行選擇的目的是獲得有指標差異性的典型數據代表。
UMAP降維方法的主要參數包括:n_neighbors,用于考慮局部與全局的權衡,較大的鄰居點個數代表更偏向于全局結構;Min_dist,用于控制嵌入空間中相鄰點之間的最小距離。較小的值會使數據更加緊密,而較大的值會使數據在嵌入空間中更加分散;n_components,目標降維后的維數,設置為2或3會使數據降維到2D或3D空間,方便可視化。Metric,用于計算輸入數據中的距離的度量,可以是“歐幾里得”“曼哈頓”“cosine”等。本文使用neighbors = 10,min_dist = 0.2,n_components = 3,Metric = cosine作為參數進行降維并可視化。
④典型價值客戶篩選
a、價值客戶預測
為了最大程度避免不同擋位投放量大小的差異對價值客戶預測的影響,本文對數據特征進行PCA降維,將降低到5維后的數據計算余弦相似度(cosine),用向量夾角衡量客戶的價值。首先,計算待預測客戶與篩選出的10個價值客戶余弦相似度的弧度,選擇最小弧度作為此客戶的相似性預測值,設定弧度閾值為0.3,預測值小于閾值且實際總銷量大于同擋位均值的客戶作為價值客戶。待預測客戶與價值客戶的夾角分布如圖5所示。從夾角分布情況可以看出,降維使數據分布相對分散,且與10個價值客戶的夾角以相近或相反為主。
b、潛力客戶預測
在步驟a的預測中,預測值小于閾值且實際總銷量小于同擋位均值的客戶作為潛力客戶。
四、結果與應用
以真龍(海韻中支)為例,使用10個典型價值客戶作為錨點,對其余客戶進行預測,篩選出555戶價值客戶和343戶潛力客戶,以此為基礎選取市場人員重點維護的終端,并開展個性化終端服務工作。針對價值客戶開展特色陳列、產品品鑒等活動,進一步提升產品的影響力,同時調研目標消費者的畫像,以指導產品投放;針對潛力客戶介紹產品文化,提升其訂購意愿。
圖6是終端個性化營銷活動對訂購量的影響結果,可以看到預測的潛力客戶經過終端精準服務后,有效訂足率明顯增加。
本文結合外部消費環境數據,實現了卷煙市場需求預測;以客觀需求和價值客戶預測,建立了品牌的零售客戶標簽池,智能篩選出價值終端,實現了精準選點、指導與服務;促使終端服務更有目的和成效,能夠更好地滿足消費者需求,對促進品牌健康發展有重要的指導意義。本研究有利于通過信息技術手段,形成動態小程序,優化卷煙品牌在其客戶關系管理工作的應用效能。
參考文獻:
[1]陳巧玲,葉周良,陳海勇.客戶價值模型在煙草行業的研究與應用[J].中國新通信,2020,22(17):119-121.
[2]閆磊,劉旭,徐斌.基于客戶價值的卷煙零售客戶分類研究與應用[J].價值工程,2019,38(25):89-90.
[3]祖強.基于卡諾模型的面向消費者客戶分類評價體系建設研究[J].福建省煙草學會2014年學術年會,2014:30-37.
[4]秦琴.數據挖掘算法在廈門市卷煙新零售策略中的應用[J].海峽科學,2021(7):62-70.
[5]玉明濤,溫林萍,趙燕妮,等.突出客戶價值分類,創新引領精準營銷新模式——基于CPM模型的客戶“盈利提升導航”模式研究[J].廣西壯族自治區煙草公司柳州市公司2021年學術論文匯編,2021.
[6]李欣欣,肖駿孔,維力.工商零消大數據助力煙草行業客戶價值預測與精準服務[J].商場現代化,2022(19):4-6.
[7]馮娟娟,辜麗川,饒海笛,等.基于客戶畫像和GBDT算法的客戶價值預測方法[J].洛陽理工學院學報:自然科學版,2018,28(3):51-56.
[8]AMEYAW,E.,HU,Y.,SHAN,M.,e.l.(2016).Application of Delphi method in construction engineering and management research:A quantitative perspective.Journal of Civil Engineering and Management.
[9]MCINNES,L.,HEALY,J.,SAUL,N.,&Gro?berger,L.(2018).UMAP:Uniform Manifold Approximation and Projection.Journal of Open Source Software.