劉燕 張瓊 呂佳敏 謝瑩 陳輝 鄭培







摘?要:煙草行業(yè)擁抱數(shù)字化,如何利用海量卷煙數(shù)據(jù)更好地為卷煙品牌培育賦能,成為煙草行業(yè)的工作重點(diǎn)。大數(shù)據(jù)算法的發(fā)展與應(yīng)用,讓精準(zhǔn)營(yíng)銷變得更有科學(xué)依據(jù),助力精準(zhǔn)品牌培育。因此,文章以湖南省衡陽(yáng)縣轄區(qū)在銷的卷煙品牌為研究對(duì)象,通過(guò)收集卷煙品牌主客觀指標(biāo)數(shù)據(jù),采用協(xié)同過(guò)濾模型和K-means聚類等算法進(jìn)行分析,旨在探索基于關(guān)聯(lián)推薦算法的卷煙品牌精準(zhǔn)培育方法,形成一套可移植的方法論,助力新卷煙品牌實(shí)現(xiàn)更好的品牌培育效果。
關(guān)鍵詞:關(guān)聯(lián)推薦;精準(zhǔn)營(yíng)銷;K-means聚類;品牌培育
中圖分類號(hào):F274文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1005-6432(2023)35-0123-04?
DOI:10.13939/j.cnki.zgsc.2023.35.123
1?引言
2023年全國(guó)煙草半年工作會(huì)議作出不斷深化改革創(chuàng)新、持續(xù)增強(qiáng)發(fā)展動(dòng)能的部署,要求充分發(fā)揮品牌帶動(dòng)發(fā)展作用。而煙草行業(yè)數(shù)字化的海量煙草數(shù)據(jù)資源尚未得到充分發(fā)掘利用,如何利用卷煙數(shù)據(jù)更好地為卷煙品牌培育賦能,成為煙草行業(yè)工作重點(diǎn)。
文章以湖南省衡陽(yáng)縣轄區(qū)在銷的卷煙品牌為研究對(duì)象,通過(guò)收集卷煙品牌主客觀指標(biāo)數(shù)據(jù),借助K-means聚類、協(xié)同過(guò)濾等關(guān)聯(lián)推薦算法,分析出不同卷煙品牌之間的關(guān)聯(lián)程度,形成以暢銷煙為品牌定點(diǎn)的關(guān)聯(lián)推薦列表,為新卷煙品牌培養(yǎng)提供更具針對(duì)性和高效性的關(guān)聯(lián)推薦方法論指導(dǎo)。
2?指標(biāo)選取與數(shù)據(jù)收集
2.1?主客觀指標(biāo)選擇與調(diào)研
文章基于深入訪談,在深入洞察卷煙市場(chǎng)信息后,總結(jié)歸納出14個(gè)卷煙品牌主客觀指標(biāo)并形成調(diào)研表進(jìn)行指標(biāo)調(diào)研,其中包括包裝軟硬、卷煙規(guī)格、價(jià)類等11個(gè)客觀指標(biāo)。另依據(jù)《卷煙感官技術(shù)要求》,選取了刺激性、香味以及余味3個(gè)主觀指標(biāo),采用5級(jí)量表進(jìn)行指標(biāo)評(píng)分。
客觀指標(biāo)由衡陽(yáng)市煙草公司衡陽(yáng)縣分公司客戶服務(wù)分部工作人員調(diào)取內(nèi)部官方指標(biāo)數(shù)據(jù),進(jìn)行分類填寫(xiě)匯總。主觀指標(biāo)由代表性零售商組織進(jìn)行卷煙品吸并進(jìn)行填寫(xiě),上報(bào)后統(tǒng)一匯總。
2.2?數(shù)據(jù)收集基本情況
衡陽(yáng)縣域內(nèi)在銷卷煙品規(guī)共179種,其中,國(guó)產(chǎn)卷煙170種,進(jìn)口卷煙9種。國(guó)產(chǎn)卷煙中,湖南省內(nèi)煙有30種,余下140種為國(guó)產(chǎn)省外煙,保證了衡陽(yáng)縣卷煙市場(chǎng)的品牌多樣性。根據(jù)衡陽(yáng)縣2023年1月至5月各卷煙品牌總銷額和總銷量統(tǒng)計(jì)結(jié)果可知,衡陽(yáng)縣卷煙市場(chǎng)呈現(xiàn)出明顯的品牌偏向性,以芙蓉王(硬)為代表的芙蓉王系列、白沙系列與雙喜系列在衡陽(yáng)縣卷煙市場(chǎng)占據(jù)著絕對(duì)的市場(chǎng)龍頭地位。如圖1和圖2所示。
3?關(guān)聯(lián)推薦模型分析
3.1?協(xié)同過(guò)濾模型
協(xié)同過(guò)濾(collaborative?filtering,CF)算法是一類用于推薦系統(tǒng)的算法。而基于項(xiàng)目的協(xié)同過(guò)濾算法(CF)以項(xiàng)目作為標(biāo)準(zhǔn)來(lái)思考問(wèn)題,算法本體根據(jù)用戶行為來(lái)判定項(xiàng)目間的相似度。文章選用卷煙品牌主客觀指標(biāo)作為數(shù)據(jù)基礎(chǔ),既有卷煙產(chǎn)品本身的特征,也有用戶評(píng)價(jià)賦予的特征,因此選用基于物品的協(xié)同過(guò)濾算法以及CF算法進(jìn)行數(shù)據(jù)分析。
3.1.1?特征提取及數(shù)據(jù)處理
文章結(jié)合深入訪談結(jié)果和市場(chǎng)卷煙消費(fèi)者看重指標(biāo),最終選取了九項(xiàng)指標(biāo)進(jìn)行協(xié)同過(guò)濾分析。主觀指標(biāo)具體評(píng)分由調(diào)研數(shù)據(jù)加權(quán)平均得出,焦油含量取mg/支,對(duì)其余的客觀指標(biāo)見(jiàn)表1所示的卷煙產(chǎn)品指標(biāo)信息編碼表進(jìn)行編碼轉(zhuǎn)化,得到如表2所示的標(biāo)準(zhǔn)化指標(biāo)數(shù)據(jù)。
圖1?2023年1月至5月總銷售額TOP20卷煙產(chǎn)品(元)
圖2?2023年1月至5月總銷售量TOP20卷煙產(chǎn)品(條)
計(jì)算卷煙產(chǎn)品相似度,采用的是余弦相似度公式:
similarityi,j=∑u∈Uijrui·ruj?∑u∈Uijr2ui·?∑u∈Uijr2uj(1)
其中,Uij表示對(duì)物品i和j都有評(píng)分的用戶集合,rui表示用戶u對(duì)物品i的評(píng)分。
生成推薦列表呈現(xiàn)的推薦分?jǐn)?shù)是基于卷煙產(chǎn)品相似度的加權(quán)平均推薦分?jǐn)?shù):
r^uj=∑i∈Iusimilarity(i,j)·rui∑i∈Iusimilarity(i,j)(2)
其中,Iu表示用戶u已評(píng)分的物品集合。
3.1.2?分析結(jié)果展示
文章采用Python設(shè)計(jì)卷煙產(chǎn)品的協(xié)同過(guò)濾分析程序,進(jìn)行各個(gè)卷煙產(chǎn)品之間的相似性計(jì)算,并生成卷煙產(chǎn)品的相似性矩陣。文章選取衡陽(yáng)縣域王牌產(chǎn)品芙蓉王(硬)作為示例產(chǎn)品進(jìn)行關(guān)聯(lián)推薦分析。當(dāng)輸入芙蓉王(硬)進(jìn)行推薦產(chǎn)品的相似度查詢,可以得到程序推薦的相似產(chǎn)品列表,如表3所示。
3.2?K-means聚類模型
K-means算法是一種常見(jiàn)的聚類分析方法,旨在將相似的數(shù)據(jù)點(diǎn)分配到預(yù)先定義的K個(gè)簇中。
一般采用歐氏距離來(lái)表示樣本之間的相似度關(guān)系。距離公式如下所示:
du,v=∑|ui-v|(3)
其中,ui表示數(shù)據(jù)成員,v表示k個(gè)簇的中心。
文章同時(shí)采用K-means算法,對(duì)卷煙品牌主客觀指標(biāo)數(shù)據(jù)進(jìn)行聚類分析,以得出關(guān)聯(lián)推薦分析結(jié)果,同時(shí)輔助驗(yàn)證協(xié)同過(guò)濾分析模型給出的結(jié)果可靠性。
3.2.1?數(shù)據(jù)處理
文章通過(guò)肘部法(elbow?method),得出合適的聚類數(shù)量為3,其后文章采用了主成分分析(PCA)方法,將原始數(shù)據(jù)的多維特征空間降維到三維空間,評(píng)價(jià)指標(biāo)Silhouette?Score為0.347,Davies-Bouldin?Index為1.080,Calinski-Harabasz?Index為79.867,說(shuō)明聚類結(jié)果在這三個(gè)指標(biāo)下都表現(xiàn)良好,降維聚類后的結(jié)果如圖3所示。
通過(guò)對(duì)每個(gè)簇心進(jìn)行進(jìn)一步分析,識(shí)別出簇心代表性產(chǎn)品,并從中獲得有關(guān)產(chǎn)品特征和市場(chǎng)定位的洞察,如表4所示。
3.2.2?基于K-means聚類的產(chǎn)品培育建議
文章基于相似度關(guān)聯(lián)推薦的邏輯,選取市場(chǎng)表現(xiàn)較好的簇心產(chǎn)品作為代表性產(chǎn)品,而培育產(chǎn)品則是簇心周?chē)嚯x最近的產(chǎn)品群,梳理總結(jié)得出三大類可用于指導(dǎo)衡陽(yáng)縣實(shí)施精準(zhǔn)卷煙品牌培育的產(chǎn)品培育對(duì)照表,部分對(duì)照表如表5所示。
3.3?K-means與CF算法結(jié)合推薦
協(xié)同過(guò)濾模型與K-means聚類模型在指導(dǎo)卷煙品牌精準(zhǔn)培育的關(guān)聯(lián)推薦結(jié)果方面,分析預(yù)測(cè)是否一致,文章對(duì)這兩種算法結(jié)果進(jìn)行了對(duì)照檢驗(yàn),隨機(jī)抽取白煙(精品)作為驗(yàn)證目標(biāo)產(chǎn)品,在CF算法中輸入白沙(精品)作為相似性產(chǎn)品的對(duì)照產(chǎn)品,生成的相似性矩陣和推薦列表進(jìn)行比對(duì)后可以發(fā)現(xiàn),基本上兩者的推薦產(chǎn)品都實(shí)現(xiàn)了重合,且相似度都能夠達(dá)到98%。因此從另一個(gè)方面驗(yàn)證了兩種推薦算法的可靠性,對(duì)應(yīng)關(guān)系如表6所示。
4?以關(guān)聯(lián)推薦算法指導(dǎo)卷煙品牌精準(zhǔn)培育的方法探析
文章探索了兩種關(guān)聯(lián)推薦算法在卷煙品牌精準(zhǔn)培育上的指導(dǎo)路徑,結(jié)果驗(yàn)證均可行。無(wú)論是協(xié)同過(guò)濾模型還是K-means聚類模型都可以基于產(chǎn)品指標(biāo)數(shù)據(jù)算出產(chǎn)品之間的相似性,從而指導(dǎo)關(guān)聯(lián)推薦的營(yíng)銷策略組合選擇,如可以基于產(chǎn)品相似度指數(shù)給出以老帶新的模版化的陳列組合方式選擇。
卷煙企業(yè)想要基于關(guān)聯(lián)推薦算法實(shí)施卷煙品牌精準(zhǔn)培育,可以將兩種推薦算法并入一套程序,先后輸出聚類結(jié)果和基于物品的協(xié)同推薦,采用云數(shù)據(jù)庫(kù)協(xié)同更新,幫助煙草專賣(mài)局統(tǒng)一獲取和更新原煙草產(chǎn)品特性矩陣,包括增減煙草產(chǎn)品、修改特性值、增加其余客觀指標(biāo)以幫助更好地分析產(chǎn)品相關(guān)性。經(jīng)銷商也可以通過(guò)程序錄入新產(chǎn)品的主觀指標(biāo)反饋,從而更好地?cái)U(kuò)充修正原產(chǎn)品評(píng)價(jià)矩陣內(nèi)的數(shù)據(jù)內(nèi)容,實(shí)現(xiàn)系統(tǒng)迭代更新。
參考文獻(xiàn):
[1]鄭陽(yáng)洋.基于大數(shù)據(jù)時(shí)代的卷煙精準(zhǔn)營(yíng)銷模式研究[J].財(cái)經(jīng)界,2021(30):49-50.
[2]唐明翔.?深化“數(shù)據(jù)營(yíng)銷”?探索“科學(xué)管理之路”——卷煙品牌精準(zhǔn)培育體系構(gòu)建[C]//廣西壯族自治區(qū)煙草公司柳州市公司.廣西壯族自治區(qū)煙草公司柳州市公司2020年學(xué)術(shù)論文匯編,2020:208-214.
[3]王雄峰.?衡陽(yáng)市煙草公司省外卷煙品牌培育研究[D].衡陽(yáng):南華大學(xué),2020.
[4]羅登山.解析GB?5606.4-2005《卷煙感官技術(shù)要求》[J].煙草科技,2005(9):47-48.
[5]徐翔宇,劉建明.基于多層次項(xiàng)目相似度的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)科學(xué),2016,43(10):262-265,291.
[6]韓琮師.?K-means聚類算法優(yōu)化及其在電商平臺(tái)精準(zhǔn)營(yíng)銷中的應(yīng)用研究[D].青島:山東科技大學(xué),2020.
[7]梁子敬,賀帥,李洋,等.煙草品牌培育的現(xiàn)狀及對(duì)策研究[J].品牌與標(biāo)準(zhǔn)化,2021(5):14-15.
[8]馬駿珍.?基于數(shù)據(jù)挖掘的卷煙品牌培育“三找”新方法實(shí)踐與探索[C]//中國(guó)煙草學(xué)會(huì).中國(guó)煙草2013年學(xué)術(shù)年會(huì)論文集,2013:324-328.