周麗莉 王寶軍 梁文敏 袁秋萍 梁鈺娟



摘 要:本文針對電子商務產品銷售組合的智能化構建開展研究,將關聯規則融入PDCA循環之中,利用其螺旋上升、持續優化的機制,不斷提升和改進關聯規則的生成,并將隨著時間推移不斷變化的消費者需求因素引入到產品組合的構建之中,從而幫助電商企業智能化動態構建和優化產品組合。
關鍵詞:關聯規則;PDCA;產品組合;電子商務
一、引言
隨著電子商務的高速發展,企業的競爭不斷加劇,如何為消費者有效地推送產品組合,成為電商企業提升客單價與盈利能力的重要手段。傳統的產品銷售組合往往依賴于企業經營者的個人經驗以及靜態的統計分析,時效滯后且精準度不足。本文將PDCA戴明循環與關聯規則數據挖掘方法相結合,幫助企業開展產品組合的智能化構建研究,利用企業歷史交易數據,動態地、精準地智能化構建產品組合。
二、研究背景與相關理論
1.研究背景
國內外學者針對大數據、數據挖掘技術與電子商務的結合開展了大量研究,但數據挖掘與電商產品組合相關的研究較少,與管理方法融合的研究更為缺乏。本文將PDCA循環的管理思想與關聯規則融合應用,通過計劃、執行、檢查、處理的迭代思想,不斷循環調整與優化,實時、動態、精準的生成產品組合。
2.相關理論
(1)關聯規則
關聯規則是數據挖掘的重要技術,其反映一個事物與其他事物之間的相互依存性和關聯性。關聯規則挖掘目的是發現強關聯規則,也就是從數據中挖掘出滿足用戶需要設定的最小支持度和最小置信度的規則。
關聯規則的一般表示形式為:X->Y(S=s%,C=c%)
其中:X表示前項可以是一個項目或者項集,Y表示后項一般為一個項目。
支持度Support(X->Y)=P(X∪Y)是X與Y同時被消費者購買的概率。
置信度Confidence(X->Y)=P(Y|X)是消費者在購買X之后再購買Y的條件概率。
提升度Lift(X->Y)=P(Y|X)/P(X)P(Y)是判斷關聯規則實用性的指標,當提升度大于1,表示X出現對Y的正向促進,如果小于1,則X與Y為負,等于1則表示不相關。
本文將選取Apriori作為關聯規則的挖掘算法,該算法具有單維、單層、布爾型的特點,是經典的關聯規則算法。
(2)PDCA循環
PDCA循環將管理分為四個階段,是一個不斷前進的工作循環,每通過一次PDCA循環,就要進行檢查總結,分析仍存在問題,提出新目標,再進行循環優化。
(3)產品組合
產品組合指某個銷售商所能提供給消費者整套的或者搭配銷售的產品或項目組合,產品之間往往具有相關性,能夠引導消費者同時購買,通過產品組合的設計,可以幫助企業優化客戶體驗、提升客戶轉化率與客單價。
三、模型設計
企業在經營過程中,都會積累客戶消費的歷史記錄,這些歷史記錄包含著不同消費者的購物清單,關聯規則的通過分析這些歷史購物清單,發現產品之間的聯系,進而挖掘出一系列產品組合。模型可以按固定時間段或者固定銷售量,對樣本數據進行分組,實施多次基于PDCA循環的數據分析與挖掘。本文兩輪PDCA分組如下:
2020年11月01日-2020年12月13日A組樣本數據1641條,A組校驗組數據652條。
2020年12月14日-2021年01月28日B組樣本數據1975條,B組校驗組數據1248條。
并按照以下流程進行兩輪P-D-C-A循環數據挖掘,分析模型如下圖:
(1)Plan:實施目標與計劃的制定;(2)Do:關聯規則模型設定與運行;
(3)Check:計算效驗組概率值,執行結果檢查;(4)Act:效果評估與優化參數。
四、數據準備與實驗分析
1.數據準備
(1)數據來源
本文選取具有較高銷售量的某化妝品天貓旗艦店作為研究對象,通過八爪魚數據采集軟件爬取全店所有商品上述時間段的評論內容,結合購買用戶信息、購買時間和商品SKU模擬還原交易訂單。本文采集該店鋪全店共約5萬條評論數據,模擬還原交易訂單5516條。
(2)數據預處理
本文選取用戶標識和商品標識信息兩個數據項,然后對數據實行轉換、清洗等預處理操作,得到如表1形式的購物籃數據,在依據確準的數據類型通過關聯規則挖掘算法實行數據挖掘,分析評估挖掘結果。
①Plan:實施目標與計劃的制定
在第一輪環節,企業可以通過智能化產品組合的構建,提升產品推送的精準度,促進消費者關聯購買,提升消費者體驗和提高企業客單價,利用歷史交易數據的關聯規則挖掘,為企業自動化推送產品組合。
②Do:關聯規則模型設定與運行
運用R語言對采集的數據進行處理,根據綜合分析本輪參數設定為:最小支持度為1.1%,最小置信度為50%,通過R語言導入A組交易樣本數據1641條,運行Apriori算法如下:
共生成的關聯規則共24條,經過對關聯規則的提升度進行排序,表2展示了前8條關聯規則。
生產的24條規則置信度在50%以上且提升度都遠大于1,說明規則有效且有實用價值,即購買左側商品項的買家有非常大的可能性會同時購買右側商品項,如“氣墊BB霜&凍感水光唇釉->絲絨霧面口紅”的支持度與置信度都較高且提升度達到了9.72,此三個商品非常適合作為關聯產品同時展現,也適合作為套餐進行捆綁銷售。
根據生成的關聯規則,企業可以以此為依據來對生成產品組合,在關聯營銷推送產品組合,讓客戶能夠更加方便地瀏覽到所需的產品,獲取需要的組合套餐,促進客戶的捆綁銷售、增加銷售額和提升購物體驗。
③Check:計算效驗組概率值,執行結果檢查
接下來將A組樣本數據產生的關聯規則在A組校驗組數據中進行核查檢驗,計算關聯規則在校驗數據中出現的置信度,挖掘生成的關聯規則,在校驗集中有較高的置信度,說明規則有可靠性高,表3展示了前8條關聯規則在校驗組中的置信度。
④Act:效果評估與優化參數
本輪執行過程產生了評估指標較好的關聯規則,并且驗證了這些規則的有效性與實用性,企業可以將這些規則運用于產品組合關聯營銷、產品套餐設計和客戶接觸點優化等領域,但也存在關聯規則數量偏少,所能覆蓋的產品種類偏少的不足。
(2)第二輪P-D-C-A
①Plan:實施目標與計劃的制定
經過上一輪PDCA的運行,企業能夠高質量挖掘出一系列關聯規則,但數量偏少,覆蓋產品較少。因此本輪需對支持度、置信度參數進行調整,另在結果分析過程需考慮消費者需求變化因素。
②Do:關聯規則模型設定與運行
本輪最小支持度為0.7%,最小置信度為35%,通過R語言導入B組交易樣本數據1975條,運行Apriori算法如下:
共生成的關聯規則共36條,經過對關聯規則的提升度進行排序,表4展示了前8條關聯規則。本輪關聯規則數量得到了一定提升,規則的支持度雖然有所調低,但仍有較高的頻數,置信度處于較高水平,規則提升度均遠大于1,規則具有較高的有效性與實用性。
③Check:計算效驗組概率值,執行結果檢查
通過計算規則在B組校驗數據中的置信度,均得到的較高的置信度,因此驗證了生成的關聯規則結果具有較高的可信度,表5展示了前8條關聯規則在校驗組的置信度。
④Act:效果評估與優化參數
根據本輪的執行產生了更多的關聯規則,且均有較高的有效性與實用性,能夠覆蓋更多的產品,企業可以運用該方法智能化產品組合構建。此外企業需根據第一輪與第二輪產品的關聯規則的差異變化,了解季節性、活動性及流行趨勢等因素影響對產品組合的影響,與時俱進,不斷優化與更新產品組合。
3.實驗結果分析
(1)雖然本文兩輪PDCA過程都獲得了優質的關聯規則,但支持度與置信度的設定會較大的影響關聯規則生成,將關聯規則支持度與置信度的調整融入到PDCA循環中,將能實現參數的精細化、動態調整。
(2)將數據源根據時間維度或銷量維度進行合理的劃分,能夠有效地幫助企業挖掘貼近市場需求變化的關聯規則。
(3)企業可根據支持度、置信度的以及提升度的變化趨勢對生成關聯規則的發展趨勢跟蹤,幫助企業較早地捕捉到產品及產品組合的需求和生命周期變化。
(4)企業可以對多輪PDCA循環產生的規則進行統計分析,根據關聯規則隨時間的變化程度的大小,區別性地實施不同的營銷策略。
五、總結
本文將PDCA管理方法與關聯規則數據挖掘算法相結合,實現了數據挖掘算法在企業商務應用的規范規設計,通過PDCA循環迭代,螺旋上升的機制,動態地調整關聯規則算法應用,保證了數據挖掘效果的可靠性與實用性,企業通過多輪的PDCA循環迭代,能夠有效積累具有時間維度的關聯規則,幫助企業識別產品及產品組合的變化趨勢與生命周期,進而幫助企業更加全面系統地實現產品組合的智能化構建。
參考文獻:
[1]李冬云.利用關聯規則挖掘技術實現數字圖書館個性化推薦服務[J].蘭臺內外,2020(34):40-42.
[2]郝海濤,馬元元.基于加權關聯規則挖掘算法的電子商務商品推薦系統研究[J].現代電子技術,2016,39(15):133-136.
[3]菲利普.科特勒,加里.阿姆斯特朗.營銷學導論[M].華夏出版社,1998.
[4]朱晴.融合關聯規則挖掘算法的信息化教學管理系統設計[J].現代電子技術,2020,43(23):159-163.
作者簡介:周麗莉(1999.07- ),女,漢族,籍貫:廣東省揭陽市,本科在讀,研究方向:電子商務;通訊作者:王寶軍(1985.08- ),男,漢族,籍貫:江西省景德鎮市,研究生,工程師,研究方向:電子商務、數據挖掘