潘澤華 樊紅



摘 要:根據市場資料對零售戶經營進行分析和分類,可以為改善卷煙營銷提供決策支持的依據。針對當前研究以及零售門店細分方法存在的不足,提出基于三步KMEANS模型的卷煙零售門店分類,借助Kmeans聚類分析算法,分三步對煙草銷售門店進行分類。首先以銷售價格將煙草分為高低端,再由不同門店對不同分類煙草的銷售額比例將門店分為AB類;然后再用活躍度門店的經營穩定度指標將門店分為AB兩類;最后將兩個分類結果加以整合,得到四類不同的門店。
關鍵詞:Kmeans;門店分類;卷煙分類
中圖分類號:F713.5 文獻標志碼:A 文章編號:1673-291X(2016)19-0052-04
緒論
在煙草行業,近年來隨著卷煙信息化系統的建設,零售行業數據采集與存儲技術的進步,煙草公司已經積累了生產和銷售數據,這些數據并不是無用的數據,通過對其進行挖掘分析,獲得有價值的信息,能夠給企業帶來巨大的商業價值以及服務創新。
在卷煙營銷方面,煙草公司在以往的經營中產生了海量的柜臺掃碼的卷煙銷售交易數據,使用這些數據進行發掘,發現零售戶的銷售規律和群組特征,可以優化渠道網絡,實現貨源合理配置,提高營銷產值,逐步實現精準營銷。
近年來,國內學者在聚類分析探索及卷煙營銷挖掘等已經開展了一些研究,李綱等研究了國產轎車市場競爭格局的聚類分析法;黃鐘穎研究了兩步聚類分析法在汽車市場研究中的應用;張紅梅等提出了基于兩步聚類算法的卷煙零售客戶分類研究。盡管如此,尚未見到文獻采用更為客觀的掃碼數據進行零售客戶分類研究。
本文提出了基于三步Kmeans模型的卷煙零售門店分類模型,基于卷煙零售門店較為客觀的每日銷售掃碼數據,通過數據挖掘手段,可以有效地挖掘和區分不同門店的經營特性,為煙草公司的精細營銷提供基于數據的決策支持。
一、Kmeans模型簡介
Kmeans算法首先從n個數據對象中任意選擇k個對象作為聚類中心;而對于所剩下其他對象,則根據它們與這些聚類中心的相似度(距離),分別將它們分配給以其最相似的(聚類中心所代表的)聚類;然后再計算每個所獲新聚類的聚類中心(該聚類中所有對象的均值);不斷重復這一過程直到標準測度函數開始收斂為止。一般都采用均方差作為標準測度函數。
在Kmeans的實際應用中,分類數目K的選取對分類效果有較大的影響。本文通過枚舉,令K從2—10,在每個K值上重復運行數次Kmeans(避免局部最優解),并計算當前K的平均輪廓系數,最后選取輪廓系數最大的值對應的K作為最終的集群數目。
二、組合分類模型方法的思路和流程
(一)研究問題的提出
在門店的卷煙銷售中,每筆交易都會通過掃碼做出記錄,我們收集的數據來自貴州省?菖?菖煙草銷售公司全部零售門店2014年1月1日至2014年9月1日的銷售數據,這些原始數據較為客觀地反映了各個門店的銷售情況,根據煙草公司項目中數據分析的要求,本文基于零售門店的掃碼信息,使用組合分類模型對零售門店進行細化分類。
(二)組合分類模型流程
基于零售門店的掃碼信息,本文提出組合分類模型對零售門店進行細化分類(如下頁圖1所示),該方法首先按不同類別卷煙銷售額占比將門店分為AB兩類,再按門店活躍度分類將門店分為AB兩類,然后再將兩個分類結果組合得到最終的四個分類結果。
三、分類實驗及實驗結果分析
(一)原始數據和實驗工具選擇
煙草公司在以往的經營中產生了海量的柜臺掃碼交易數據,本文數據來自貴陽市紅華煙草公司零售門店在2014年1月1日至2015年3月20日之間產生的柜臺掃碼銷售及庫存數據,共有2014年1月1日至2015年3月20日的1 797 371條銷售數據,有銷售碼、執照—代號、交易時間、商品代號、交易數量、單價、交易金額、門店名等字段。論文采用選用R工具調用Kmeans方法進行了掃碼銷售數據組合分類的實驗研究。
(二)卷煙高低檔分類
本文首先根據不同類別卷煙銷售額占比將門店分類,首先,為了確定最佳的分類數,通過計算不同分類數目的輪廓系數,得到圖2的輪廓系數圖,從圖中看出在按卷煙價格為卷煙分類時,分為兩類獲得了最高的輪廓系數。因此,我們將卷煙品牌按價格分為高低兩類。高于**稱為高端煙,低于*的稱為低端煙。
(三)按不同類別卷煙銷售額占比將門店分類
通過上文的卷煙分類,我們計算不同門店一年銷售額中,高低檔煙的占比,然后將比例進行kmeans聚類。通過輪廓系數圖,發現分為兩類獲得了最大的輪廓系數。因此,我們按比例的不同將門店初略分為AB兩類,A類、B類門店的聚類中心高端煙的銷售占比值分別為0.0888和0.0332,A類、B類門店聚類中心低端煙的銷售占比值分別為0.911和0.967。
(四)按門店活躍度分類
接著,我們根據門店穩定度對門店分類,首先根據每日營業額計算店鋪的穩定度,再用Kmeans將其劃分為兩類,穩定A門店聚類中心的穩定度值為0.2868,穩定B門店聚類中心的穩定度值為1.005。穩定度數值越小,說明其每日經營額越穩定,波動幅度不大。穩定度數值越大,說明其每日經營額越不穩定,波動幅度較大。
(五)組合兩類分類
在完成了門店的兩種不同分類后,對每個門店,按不同指標我們有兩種不同的分類。將他們進行組合。則可將所有76個門店分為四類,其中,AA為高端穩定門店共18個(23.6%),AB為高端不穩定門店共1個(1.3%),BA為低端穩定門店共50個(65.8%),BB為低端不穩定門店共7個(9.2%)。
(六)結果分析
我們分別統計四類門店的每日卷煙銷售均價,及每日銷售額,得到圖3和圖4。從兩張圖中我們可以明顯觀察到不同類別間的顯著差異,參見圖3和圖4我們可以得出通過組合分類得到的四類門店其經營結構特征如下:
1.類AA:每日營業額相對穩定,浮動區間為2 000~6 000元之間;其賣出的每包煙平均售價也較為穩定,維持在每包18元上下,此類店鋪可預期性強,客單價維持在較高位,屬于高端穩定門店,例如月亮巖店、東門店、小石城點等。
2.類AB:每日營業額不穩定,浮動區間在1 000~12 500元之間,而營業額超出5 000元的天數占絕對少數;同樣,其賣出的每包煙平均售價也較不穩定,均價在10~30元之間寬幅波動,但大多數時間能維持在15~20元之間;此類店鋪可預期性較差,客單價也不穩定,屬于高端不穩定店鋪。76個店面中,僅有威清店屬于此類。
3.類BA:每日營業額相對穩定,浮動區間在2 000~6 000元之間;其賣出的每包煙平均售價也相對穩定,均價在14~16元之間;此類店鋪可預期性強,客單價有待提高,屬于低端穩定店鋪,如白云一店、白云二店、家樂店等。
4.類BB:每日營業額不穩定,浮動區間在1 000~10 000元之間,而營業額超出4 000元的天數占絕對少數;另一方面,其賣出的每包煙平均售價也較不穩定,在14~18元之間波動;此類店鋪可預期性差,客(其)單價也不穩定,屬于低端不穩定店鋪,如云陽店、世紀園店等。
(七)策略建議
根據本文的分析結果可知,AA店是最優質的店鋪,應該在供貨,服務上面優先滿足,著重銷售高價煙;對于AB類店,其客單價較高,但是每日營業額不穩定,在供貨上我們可以對這類店鋪彈性供貨,對于旺季,增加供貨,而在淡季則減少供貨;對于BA類店,屬于銷售主力,單價穩定,每日銷量穩定;對于BB類店,我們可以適當裁減。
總結
本文提出了基于三步Kmeans模型的卷煙零售門店分類模型,基于卷煙零售門店每日掃碼銷售數據,基于銷售價格和活躍度對門店分類,通過分類實驗結果的分析可知,根據高低端卷煙銷售占比分類,可以將門店顯著區分為高低端;而通過活躍度指標分類,可以將門店顯著分為穩定與非穩定;最后的組合模型得出的四類門店,可以綜合考慮銷售價格和活躍度對門店分類,特點顯著,效果明顯,經過實際比對可以驗證,采用本文方法得到的門店結果比較合理,可以幫助公司制定相應的改進策略,獎優罰劣,優化銷售渠道,實現貨源合理配置,提高營銷綜合效益。論文提出的方法,也可以為根據其他指標的實際分類問題的研究提供參考。
參考文獻:
[1] 張紅梅,李以鋼.基于兩步聚類算法的卷煙零售客戶分類研究[J].經濟研究導刊,2012,(34).
[2] 李綱,畢振力.國產轎車市場競爭格局的聚類分析[J].統計與決策,2007,(22):125-127.
[3] 黃鐘穎.兩步聚類分析法在汽車市場研究中的應用[J].管理觀察,2008,(9):200-201.
[4] 劉樂山,雷丁.論農村消費需求潛力向現實消費需求的轉化[J].新疆財經,2010,(2):22-24.
[5] 仲秋雁,莫佳卉.基于拓展自組織神經網絡方法的客戶市場細分[J].中國管理科學,2008,(10):551-555.
[責任編輯 陳麗敏]