辛智慧,薛亞楠,楊燦
(西安財經學院,陜西西安710100)
數據挖掘能發現數據中隱藏的信息,為制定決策提供依據,研究的比較多而且應用得很廣泛的就是關聯分析,毛國君對關聯規則挖掘算法的典型問題進行了討論與研究[1]陳國青等通過引入模糊語言修飾詞,用模擬數據與現實數據對廣義關聯算法、帶有修飾詞的模糊廣義關聯規則算法以及模糊廣義關聯規則進行對比[2]于芳提出應用關聯規則中各項目的加權利潤之和的思想評估關聯規則的價值,設計了三個超市關聯分析模型[1]超市通常以快速消費品的銷售為主,用購物籃數據進行分析,利用數據挖掘軟件中的關聯規則[4],發現更有價值的信息。
快速消費品市場價格競爭空間很小,超市間存在競爭,如何對商品進行合理布局、設計促銷方案和快速商品推薦業務是競爭客戶的關鍵點,如何獲取更多有用信息是超市永久發展的根本要求。研究方法是利用關聯分析對超市的交易數據進行研究,得出一些滿足條件的關聯規則,來研究超市的貨架擺放,商品的布局優化和促銷設計及商品的快速推薦模型并給建議。
用某超市會員顧客消費記錄的的原始數據集,進行預處理包括數據的清洗、查詢和增加字段,提取有用數據信息供關聯分析使用。
表1記錄顧客購買商品信息,調整數據結構來關聯分析。
根據關聯分析的支持度、置信度、關聯規則等得出商品貨架擺放的優化布局。
有些商品很容易被同時購買,商品擺放期間可把他們放的靠近些或同一個通道內。當顧客購買某商品,可方便購買其他關聯商品,也會產生一些購物沖動來同購其他商品。啤酒和凍肉、罐裝蔬菜一組,甜食、葡萄酒一組,魚和蔬菜水果一組,這幾個組合容易被同時購買,說明有潛在的聯系。

表1 部分購買商品

表2 關聯規則
給數據中的顧客推薦其他商品需找出商品的推薦規則,利用Apriori運算計算關聯規則。
表2共運行三條規則,規則2是同購啤酒和罐裝蔬菜的顧客167人其87.43%的人同購凍肉,同購三種商品的顧客占比15.55%,比隨機推薦提升效率2.72倍,可知已購買啤酒和罐裝蔬菜的顧客,有可能會繼續買凍肉;規則1是同購啤酒和凍肉,有可能買罐裝蔬菜;規則3是同購凍肉和罐裝蔬菜,可能買啤酒,依據關聯結果設計促銷方案會更能吸引顧客。如關聯性強的葡萄酒和甜食,可設計捆綁促銷,同時購買這兩種商品折扣5%,或買葡萄酒后可優惠10%買甜食。
點算完顧客購買的商品后,用關聯模型,可推測顧客還可能購買的商品,提高銷售額。
ID 61342顧客可推薦凍肉,推薦把握度0.847;ID92868顧客可推薦啤酒,推薦把握度0.844,少數人可繼續推薦,而對數人沒有可推薦商品,是找出的關聯規則較少造成的,對模型參數進行調整獲得7個規則,向顧客進行多選擇的快速推薦,提高出售效率。
本文用數據挖掘中的關聯規則方法對超市中應用問題進行研究。結論:1)通過網絡圖,分析那些商品很容易被同時購買,可擺放的靠近些,來優化商品布局2)根據關聯的結果對關聯性強的商品進行設計促銷3)通過關聯分析模型可推測顧客還可能購買的商品向顧客進行快速推薦商品。用數據挖掘研究各商品的關聯性問題,進行優化商品布局、設計促銷方案和快速商品推薦的方式應用于超市營銷中,有一定合理性。