黃 曦 李清沛 張 帆 楊 成 劉 沁
(1.四川省瀘州市煙草公司,瀘州 646000;2.四川省瀘州市江陽區煙草公司,瀘州 646000)
煙草經濟是國民經濟的重要組成部分,為國家財政收入做出了重要貢獻。中國煙草也是國民經濟的重要參與者,其調控社會煙草投放,保障煙草這類“特殊”商品的供給。煙草行業也是我國現存唯一的計劃經濟行業,因此其商品的投放具有特殊性[1]。文章以瀘州市江陽區為例,通過客戶畫像分析客戶煙草真實需求,以達到煙草公司向客戶精準投放貨源的目的。
煙草行業是我國現存唯一的計劃經濟行業,煙草實行專賣許可制度,目前煙草公司貨源投放依據主要是客戶檔位和客戶訂購數,因此某些煙草單品就成了相對緊缺的資源[2]。客戶為了能夠獲得較多的貨源,不得不想方設法保住目前檔位,這就造成了客戶對煙草需求不真實,沒有反映出市場真實需求。因此,本文擬定通過客戶畫像研究貨源需求之間的關系,實現貨源精準投放。
假設煙草客戶畫像與客戶檔位、客戶業態、客戶市場類型、客戶經營場所面積、客戶從業人員數量、收銀機類型六個維度有關;假設客戶無隱匿信息,無串貨銷售行為;假設單品無貨源短缺情形。通過系統抽樣方法,在全江陽區境內抽取了253 家(全區客戶數的10%左右)客戶作為庫存調查樣本客戶,重點圍繞這253 家客戶目前在銷的154種單品展開研究。
筆者分別進行了抽樣客戶庫存調查,獲得了單品庫存量,通過單品庫存特點得出客戶畫像維度的部分特征數據。調查時間間隔的單品庫存量之差及此時段貨源投放量,可得到該單品在調查期間的銷量。此外,從銷售系統調取1 年的貨源投放量,假設2020 年6 月及2021 年6 月單品庫存量相當,則貨源投放量就是銷售量。即使有少許誤差,一年中的投放量平均到每個月之后,誤差也會相對較小。
選取盡可能涉及六個維度且訂購數量較大的單品作為目標進行分析,抓大放小,讓模型具有普遍性、代表性[3]。分析單品選擇,篩選出2020 年6 月至2021 年6 月訂購數量最多的前兩種單品,找到排名第一的單品為紅塔山(經典100),一年訂購量為90 641 條,且抽樣的253 家客戶均在此時段訂購;排名第二的單品為云煙(紫),一年訂購量為90 298 條,且抽樣的253 家客戶均在此時段訂購。因此,將紅塔山(經典100)及云煙(紫)作為模型分析的目標單品。
對多元選擇模型進行賦值問題。對于客戶業態,有便利店、超市、其他、商場、食雜店、煙酒商店、娛樂服務7 種。對于客戶市場類型,有鄉村、城鎮、城區3 種。對于收銀機類型,分為無收銀機、有收銀機、有行業收銀機3 種[4]。因此,對于以上3 個維度數據,利用邏輯回歸的方式,根據極大似然估計方法重新對數據進行修正賦值,修正之后,無收銀機、有收銀機和有行業收銀機賦值分別為0.262 605 566、0.415 560 684、0.321 833 75,鄉村、城鎮、城區賦值分別 為0.282 311 964 605 102、0.340 864 162 665 914、0.340 864 162 665 914;便利店、超市、其他、商場、食雜店、煙酒商店、娛樂服務賦值分別為0.115 731 84、0.195 222 701、0.104 860 583、0.173 092 84、0.106 853 107、0.200 555 197、0.103 683 731。
此時,模型融入了線性回歸與邏輯回歸。融入邏輯回歸之后,紅塔山(經典100)回歸參數如表1、表2 所示。

表1 融入邏輯回歸后紅塔山(經典100)回歸擬合參數

表2 融入邏輯回歸后紅塔山(經典100)回歸參數

表3 融入邏輯回歸后云煙(紫)回歸擬合參數
可以看出,檔位、經營場所面積、業態具有很強的顯著性,但市場類型、從業人員數量及收銀機類型具有較低的顯著性。因此可以初步斷定,市場類型、從業人員數量及收銀機類型對于客戶訂購量是不顯著的。造成不顯著的原因主要有以下三個方面。
一是根據市場類型得出劃分區別度在實際調查過程中已經不明顯。如此次調查的253 戶客戶涉及三大類,分別為城區、城鎮、鄉村。在實際調查過程中,調查所在區縣除了街道和鎮以外,沒有鄉,且城鎮人口占總人口的65%,常住城區人口超過70%,調查樣本對城鎮及鄉村的代表性不足。二是從業人員數量在調查時未進行詳細的定量定性約定,如煙酒專賣店的店鋪從業人員專門服務與卷煙的比例約為40%(煙酒專賣店的一個從業人員專門從事卷煙銷售占整個崗位工作量的40%),而便利店經營品種眾多,1 位從業人員分攤到卷煙銷售的工作量可能不到10%,因此單看從業人員數量并不能與客戶的訂購數形成顯著關系。三是收銀機與客戶業態、市場類型等有較大的關聯,易形成自相關關系。例如:大型商超、專賣店收銀機占比較大,便利店收銀機占比較小;城區收銀機占比較大,偏遠地區收銀機占比較少。
因此,不妨只考慮檔位、業態及經營場所面積這3 個較為顯著的畫像指標來擬合客戶訂購量。紅塔山(經典100)擬合的結果如表5 和表6 所示。

表5 只考慮檔位、業態及經營場所面積紅塔山(經典100)回歸擬合參數

表6 只考慮檔位、業態及經營場所面積紅塔山(經典100)回歸參數
只考慮檔位、業態及經營場所面積,融合線性回歸與邏輯回歸之后,云煙(紫)參數如表7 和表8 所示。

表7 只考慮檔位、業態及經營場所面積云煙(紫)回歸擬合參數

表8 只考慮檔位、業態及經營場所面積云煙(紫)回歸參數
除了紅塔山(經典100)與云煙(紫)以外,對其他銷量品種回歸參數的P 值也進行了匯總,見表9。
總體來看,檔位、業態、經營場所面積對訂購量的解釋是顯著的。可以認為,檔位、業態、經營場所面積對訂購量有很重要的影響。但這也不乏奇異單品,這3 個解釋變量對訂購量的影響不顯著,此類單品可能需要其他分析方法尋找影響其訂購量的變量。另外,模型經過不斷修正,有一個維度對訂購量的影響一直是非常顯著的,這就是客戶檔位。客戶檔位可以理解成模型受到了時間序列的影響,根據營銷規則,客戶訂貨量與其檔位相關,客戶檔位正是其歷史訂貨量的體現。
根據上述推導模型,得到紅塔山(經典100)的訂貨數量回歸函數關系式,由表6 得:
y=-33.591 +16.111 26x1+1339.433x2-0.088 26x3
預測值計算如下。
第一步,將目前掌握的253 家客戶的檔位、客戶業態、經營場所面積分別代入回歸表達式,得到253 個不同的y 值。
第二步,將這253 個y 值求和,并求得每個y 值在求和中的占比。
第三步,根據樣本客戶調查期間月度訂購數據(7.25—8.23),計算出此次紅塔山(經典100)總投放量,再根據第二步占比計算得出每種單品的預計投放量。
第四步,將第三步求出的預計投放量與系統調出的實際投放量作差求絕對值。計算出每個客戶預計值與實際值偏離比例。結果如圖1 所示。
經過檢驗,2022 年7 月25 日至8 月23 日,有103 家客戶投放偏離度低于10%,投放偏離度低于20%的客戶數為189 戶,占總戶數的74.7%。模型整體預測準確度較高。
本模型能較好地通過客戶畫像預測客戶單品訂購數量,誤差在可控范圍內。但該模型也有一定的局限性:一是未能完全囊括原先預想的6 個維度,對客戶畫像不夠全面。二是客戶訂購數量不只依賴于客戶畫像,或者說客戶畫像并不是客戶訂多訂少的直接原因,訂購數量最終來源于市場,而客戶畫像只是對訂購數量的側面反映[5]。后期市場數據不斷豐富完善,模型經過市場不斷檢驗、優化,客戶畫像將更加全面、完整,客戶畫像與客戶訂購數的關聯程度也將更強。