黃 焯,張維緯
(1.華僑大學 工學院,福建 泉州 362021;2.工業智能化技術與系統福建省高校工程研究中心,福建 泉州 362021)
關聯規則最早是由Agrawal等[1]于1993年首次針對購物籃分析提出的,以發現交易數據庫中不同商品之間的聯系規則為目的,用規則來刻畫顧客的購買模式行為,用來指導商家科學的貨架設計和進行商品組合。
挖掘關聯規則針對的問題,最早出現于超市的數據,交易可以由顧客購買的項目組成,我們將數據看成是二制的(交易中出現為1,否則為0),當然是不考慮交易中項目的數量。針對交易數據庫中的頻繁項集,所有大于或等于客戶指定的Smin都需要找出。可以利用頻繁項集來生成挖掘所需要的關聯規則,并且根據用戶設定的Cmin來篩選出強關聯規則。
本文主要說明尋找Smin,找出頻繁集是比較困難的,而有了頻繁集再生成強關聯規則就相對容易了,Apriori算法是找出頻繁集比較經典的算法。
在筆者看來,算法的效率才是關鍵,現階段關聯規則挖掘面臨的主要挑戰是如何有效發現大項目集,針對此問題,Agrawal提出了Apriori[1-4]算法,Apriori算法是一種可以挖掘關聯規則的頻繁項集算法,核心思想是重復掃描數據庫,這樣就可以通過候選集生成和剪枝的向下封閉檢測兩個階段來挖掘頻繁項集。
向日葵農場的原身是宜園農場,是由幾個80后的大學老師一起創立的,發展到2014年與另外一家農場合并,改名為向日葵農場,筆者于2014年7月份進入農場,購物籃分析則是筆者進入該農場實習的主要任務。
向日葵農場原有的流程為客服與生產者溝通產生菜單,然后客服發布到群里,由客戶進行個人的點菜,客服進行記錄,完畢之后進行蔬菜的分裝,然后再是運輸到客戶的家里,最后客服進行售后反饋。
向日葵購物籃分析太過被動和粗放,沒有具體根據于哪方面的原理來進行分析,只是簡單的客服售后發現有哪些產品多了或者少了,然后與生產者溝通后相應地減少或增加,但是每次都是發現多的產品沒有客戶需求,少的產品需求量過大,造成客戶的滿意度下降甚至流失,對銷售數據當中的產品進行多支持度挖掘[5],可以提高主動效益,進行更好的溝通生產。
不知不覺,在這一年里面在農場里面有過消費記錄的社員已經累計了快1 000人,但是活躍的人數卻一直只有30人左右,有時候會偶爾上升到50人,但是馬上就會下降,很多老顧客都沉寂了,新客戶雖然一直也有增加,但是由于忠誠度不高,變為老客戶的轉化率也不是很高,因為這些問題,農場一直都是處于虧損的狀態,根據這些方面的原因,我們提出了基于關聯規則的購物籃分析這一個概念,目的是通過對客戶菜籃子的數據進行挖掘,找出其中存在關系的菜品的搭配,進行全新的套餐配送,提升客戶滿意度和忠誠度[6]。
因為一直以來都是與客戶打交道,比較了解客戶的需求,后期菜籃子數據的錄入也是由自己完成的。根據筆者的分析,認為客戶點菜必然是有著一系列的原因,家庭和喜好這部分原因沒有辦法探究,菜品之間本身存在的某種聯系才是要探求出來的,紫背天葵&四季豆&秋葵&空心菜這4種菜總是會一起購買的,而且在購買了其中3種的情況下購買另外一種的概率幾乎是100%。于是筆者提出本文的論點,菜與菜之間必然存在著某種必然的聯系,并且提出一個猜想,紫背天葵&四季豆&秋葵&空心菜存在著某種聯系,并且在買下其中3種的情況下,購買第4種菜的概率很大,并對此展開論證。
如圖1所示,我們可以發現,菜與菜之間是存在的聯系的,這幾條規則也是驗證了這種聯系的必然存在,紫背天葵、空心菜、四季豆、秋葵這4種菜及玉米、紅莧菜、黃瓜這3種菜,其中四季豆和空心菜驗證了本文前面所提到的關于這兩樣菜會一起購買的猜想,也論證了論點,所以證明了基于關聯規則的購物籃分析是可以得出結果的,并且具有一定的可行性,可以運用到實際的生產當中,可以將這2種得出來的組合運用到實際的產品推廣當中,相信可以提高客戶的滿意度。
圖1 結果論證
因為數據量的關系,存在著誤差與偶然性,所以結果在沒有經過實踐之前是具有不確定性的,在以后的生活當中,將會收集更多的數據,利用數據挖掘來進行分析,作為判斷的參考。
[參考文獻]
[1]AGRAWAL R,IMIELINSKE T,SWAMI A.Mining association rules between sets of items in large databases[C].Washington:Proceedings of ACM SIGMOD on Management of Date,1993:207-216.
[2]范明,孟小峰.數據挖掘:概念與技術[M].北京:機械工業出版社,2001.
[3]蔡偉杰,張曉輝,朱建秋,等.關聯規則綜述[J].計算機工程,2001(5):31-33.
[4]AGRAWAL R.Srikant fast algorithms for mining association rules in large databases[J].On Very Large Databases,1994(2):487-499.
[5]PARK J S.CHEN M,YU P S.Using a Hash-based memory with transaction trimming for mining association rule[J].IEEE Transactions on Knowledge and Data Engineering,1997(5):813-825.
[6]LIZHENGNANHUA.Apriori算法詳解之一:相關概念和核心步驟 [EB/OL].(2013-06-09)[2018-03-20].http://blog.csdn.net/lizhengnanhua/article/details/9061755,2013-06-09.