999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向零售業的關聯規則挖掘的研究與實現

2016-02-27 00:43:32田建學
計算機技術與發展 2016年10期
關鍵詞:數據挖掘關聯規則

張 玨,陳 莉,田建學

(1.榆林學院 信息工程學院,陜西 榆林 719000;2.西北大學 信息科學與技術學院,陜西 西安 710000)

面向零售業的關聯規則挖掘的研究與實現

張 玨1,2,陳 莉2,田建學1

(1.榆林學院 信息工程學院,陜西 榆林 719000;2.西北大學 信息科學與技術學院,陜西 西安 710000)

隨著零售業在城市的快速發展,智能系統積累了大量的零售業原始數據,急需一種技術來發現數據中蘊含的內在規則,為企業管理者提供決策支持。數據挖掘是目前一個重要的研究方向,可以把日常業務數據知識化。介紹了零售業商務智能系統的發展現狀,并通過分析零售業數據來掌握顧客的購買偏好,并同時對挖掘結果進行說明,在一定程度上利用關聯規則技術解決現實中的商業問題。針對數量和利潤的因素,提出利用頻繁項目集尋找商品利潤最大化的銷售組合模型,零售商可以根據該模型輸出的銷售組合模型對商品進行捆綁銷售,以獲得最大利潤。提出來競爭商品的概念,即找出隱含在數據庫中相互競爭商品的模型,這樣就得到了零售業商品推薦模型。實驗結果表明,提出的模型能找出高交叉銷售利潤的商品,在零售業中有很好的實用性。

數據挖掘;關聯規則;零售業商務智能系統;Apriori算法

0 引 言

隨著零售行業競爭的日益激烈,傳統的銷售模式已經不能適應當前的形勢。超市作為日常生活中一種非常頻繁重要的零售購物方式,是目前商家爭奪的焦點。超市的經營特征決定了超市的特點:雇傭人員少、商品流量大、資金周轉快等?,F代社會市場變化快,顧客需求也漸漸趨向于個性化,零售業的競爭日趨激烈,超市要獲得更多的利潤、取得更好的銷售業績就需要最大限度地利用數據庫中的大量業務數據。這些數據對企業管理者來說意義重大、價值非凡,通過數理模式分析營銷過程中產生的大量數據,劃分出不同類型的客戶或市場,并分析消費者的偏好和行為,幫助商家保留老客戶,發展新客戶,提升客戶的滿意度。比如市場部需要實時獲得近兩年的銷售記錄,來向有潛在購買能力、購買意向的客戶宣傳自己的產品。傳統的信息管理系統一直停留在事物處理層面上,只能用于綜合統計等一些簡單功能,不能獲得其他一些較為高級的統計信息,而企業高層決策者則希望通過數據挖掘技術從海量數據中找出更多有用的信息以幫助決策,及時應對市場變化[1-2]。

許多大的零售商由于依據“最佳猜測”來定價而失去了利潤,如果他們等待很久才對產品進行打折,或者一些產品本不需要打折,卻因為某些不正確的決策對產品進行了打折,則會影響企業的利潤。商場的目的是為了追求利潤最大化,比如:銷售什么樣的商品,促銷策略如何制定,貨架上的商品如何擺放才能吸引顧客眼球,這些都是零售商需要考慮的問題。只有準確掌握顧客的購買偏好才可以幫助商場對類似問題制定準確合理的決策[3-4]。關聯規則挖掘就是對商場銷售數據進行分析,得到顧客的購買偏好,然后做出合理的決策。在客戶消費偏好關聯規則分析中,使用數據挖掘中的經典Apriori算法對客戶消費的商品進行了挖掘,建立合理的客戶消費方式模型,根據客戶購買偏好進行促銷分析,為零售商提供貨架擺放和促銷方案推薦,更好地把關聯規則挖掘用到零售業中,從大量業務數據中找出有用的模式和規律,為客戶分析決策服務。

1 關聯規則挖掘的相關算法及分析

關聯規則挖掘由R.Agrawal,T.Imielinski和A.Swami提出,應用在數據庫上,用來發現零售業中用戶購買商品之間的內在的隱含關系及關聯規則。關聯規則挖掘,就是對業務數據里不同類型的信息進行處理,得到不同類型信息之間的關系,并進一步分析信息之間內在的邏輯規律,為業務運作提供決策支持。決策者還可以利用關聯規則提供的信息來合理地設計和安排貨架等,從而優化商場布置。

在對商品做促銷時,也可以利用關聯規則對用戶進行分類。例如,英國的某大型超市利用數據挖掘方法對商場上架商品進行關聯分析時,發現有一部分滯銷商品居然是總計消費額最高的前25%顧客的購買對象,于是該商場決定繼續銷售這批滯銷產品,而不是簡單地撤下這些滯銷產品[5-7]。

基于關聯規則的Apriori算法有助于挖掘出有用規則,關聯規則挖據是在給定的事物數據中找到所有滿足最小支持度和最小置信度的形如X→Y的規則。其中,X和Y分別表示屬性集合(稱為項集),并且滿足X∩Y=?。蘊含式XY稱為關聯規則,X、Y分別稱為關聯規則的前提和結論。假設T為要進行處理的所有事務記錄的集合,X為T中包含X的事務記錄的個數,X∩Y為T中同時包含X和Y的有共同屬性的事務記錄個數,X∪Y為T中所有事物記錄的個數[8-9]。支持度和置信度為:

support(XY)=support(X∪Y)

confidence(X

支持度衡量整體數據集合的重要性;置信度是描述規則成立的可信度。一般情況下,決策者和用戶感興趣的、有用的關聯規則是支持度和置信度都高的關聯規則。在統計意義上最小支持度表示項目集合最低重要度,最小置信度則表示規則最低的可靠度。關聯規則挖掘問題就是找到支持度和置信度都大于指定閾值的關聯規則。如果規則的置信度和支持度都大于最小支持度、最小置信度時,規則是有效的,也稱為強關聯規則。當數據項集合X的支持度大于最小支持度時,就把X稱為頻繁項目集合。

關聯規則挖掘算法中涉及的問題主要有兩個:如何減少I/O操作,因為頻繁的I/O操作會影響挖掘效率;如何降低需要計算支持率的項目集數量,盡量與頻繁項目集的數量接近。

Apriori算法非常經典,主要分為兩大步驟:

第一步驟:找出高頻項目集合。

(1)找出高頻項目集k-1,若為空,則停止執行。

(2)由(1)中找出任意兩個有(k-2)項目相同的項目集k-1,組合成項目集k。

(3)判斷由(2)找出的項目集,其所有包括的項目集k-1是否都出現在(1)中,假如成立就保留此項目集k;否則就刪除。

(4)檢查由(3)所獲得的項目集k是否滿足最小支持度,如果符合就加入高頻項目集k;否則就刪除。

(5)轉到(1)繼續查找高頻項目集k1,循環結束,直到無法產生高頻項目集。

第二步驟:產生關聯規則。

(1)將所有高頻k項目集(k1)拆解成XY,X,YXY。

(2)判斷所有的規則是否符合最小信任度,若符合則稱為關聯規則。

因為第二步的開銷遠低于第一步,因此關聯規則挖掘的性能主要取決于第一步。

關聯規則主要分為以下幾類:

(1)根據變量類別的不同,關聯規則可分為布爾型和數值型。布爾型處理的值是離散的、種類化的,顯示了變量之間的關系。數值型處理的是連續的變量,把多維、多層關聯規則結合起來對數據進行動態分割或者直接處理。

(2)根據數據的抽象層次,關聯規則分為單層關聯和多層關聯。在單層的關聯規則中,不考慮變量的現實數據是否屬于同一層次;但在多層的關聯規則中,就需要考慮數據是否屬于同一層次、考慮變量的多層性。

(3)根據規則中數據的維數,關聯規則可以分為單維和多維。單維的規則考慮數據的一個維度和單個屬性的關系,多維的關聯規則考慮處理數據的多個維度和多個屬性之間的關系。

2 關聯規則應用實例

假定事務數據庫如表1所示。該數據庫中有4個事務,設定支持度為2,置信度為0.5。

表1 事物表(1)

頻繁項集發現過程:

(1)掃描數據集中的所有事務,對每個項的出現次數計數。

(2)最小事務支持度為2,確定項目集合為L1。

(3)為發現頻繁項集L2,算法連接L1產生候選2項集的集合C2={{蘋果,橘子},{蘋果,火腿},{蘋果,葡萄},{橘子,火腿},{橘子,葡萄},{火腿,尿布}}。

(4)掃描D中所有事務,計算C2中每個候選項集的支持數目,如果某個事務包含該候選項集,那么候選項集的支持計數加1。

(5)確定頻繁2項集的集合L2,它是由C2中大于并等于支持度計數的2項集組成,L2={{蘋果,橘子},{蘋果,火腿},{蘋果,葡萄},{橘子,火腿}}。

(6)候選3-項集的集合C3由頻繁2-項集產生,C3={蘋果,橘子,火腿}。

(7)掃描D中事務,計算C3中候選集的支持計數,所以{蘋果,橘子,火腿}為頻繁3-項集L3。

由于頻繁項集已經滿足最小支持度的要求,所以這時只考慮置信度。設最小置信度為80%,由頻繁項集{蘋果,橘子,火腿}可生成強關聯規則{蘋果,橘子}→{火腿}和{蘋果,火腿}→{橘子}。置信度規則如表2所示[10-11]。

置信度為100%說明,購買前一物品的同時,也會購買后一物品。也就是說購買蘋果、橘子的用戶同時會購買火腿。購買蘋果、火腿的用戶同時也會購買橘子。

已知另一數據庫數據如表3所示。

表2 置信規則表

表3 事物表(2)

數據挖掘過程如下:

第一步:根據定義,計算每種商品的關聯規則的支持度。

Support(帽子)=3/9=33%

Support(圍巾)=3/9=33%

Support(手套)=3/9=33%

Support(棉衣)=2/9=22%

Support(毛巾)=1/9=11%

Support(電熱毯)=1/9=11%

Support(鞋刷)=2/9=22%

Support(香皂)=3/9=33%

Support(浴衣)=3/9=33%

Support(剃須泡沫)=3/9=33%

Support(空氣清新劑)=1/9=11%

第二步:設定最小的支持度閾值為20%,將大于或等于最小支持度閾值的商品挑選出來,那么帽子、圍巾、手套、棉衣、鞋刷、香皂、浴衣、剃須泡沫可以被挑選出來。

第三步:計算商品關聯規則的置信度。

帽子、圍巾、手套、棉衣、鞋刷、香皂、浴衣和剃須泡沫的置信度為:

Confidence(棉衣帽子)=Support(棉衣帽子)/Support(棉衣)=11%/22%=0.5

Confidence(棉衣圍巾)=Support(棉衣圍巾)/Support(棉衣)=11%/22%=0.5

Confidence(棉衣手套)=Support(棉衣手套)/Support(棉衣)=22%/22%=1

Confidence(毛巾毛毯)=Support(毛巾毛毯)/Support(毛巾)=11%/11%=1

Confidence(香皂浴衣)=Support(香皂浴衣)/Support(香皂)=22%/33%=0.67

Confidence(香皂剃須泡沫)=Support(香皂剃須泡沫)/Support(香皂)=22%/33%=0.67

Confidence(浴衣剃須泡沫)=Support(浴衣剃須泡沫)/Support(浴衣)=33%/33%=1

Confidence(鞋刷剃須泡沫)=Support(鞋刷剃須泡沫)/Support(鞋刷)=11%/22%=0.5

其余數據通過XY的信任度表示如表4、5所示。

表4 置信度(1)

表5 置信度(2)

第四步:設定最小信任度閾值為0.6,得到的規則如表6所示。

根據上述生成的關聯規則,可以發現顧客潛在的購買習慣和偏好,將帽子、圍巾放置在一起,以方便顧客選購,甚至可以把帽子、圍巾和手套,棉衣和手套放在一起捆綁銷售。浴衣和剃須泡沫可以捆綁在一起銷售,香皂、鞋刷和剃須泡沫也可以在一起捆綁銷售。在進貨的時候,可以考慮將上述商品統一采購,也可以放在一起統一印發促銷廣告,來提高商品的支持度和信任度。上述關聯規則生成中,任務度和支持度都高的就可以考慮在一起捆綁銷售,讓消費者交叉購買以提高消費力[12-13]。

大型零售業的利潤主要來自于以下三個方面:商品差價、供應鏈成本和管理成本。但在目前激烈競爭的客觀環境下,大型零售業在以上三方面利潤上升空間很小。想要在市場中擁有競爭力關鍵在于提高銷售額,即吸引更多的顧客,并要提高顧客的購買金額,這樣零售業才能獲得更多更高的利潤、在市場中擁有更

表6 規則表

多的競爭力。超市促銷就是為了提高營業額,利用各種方法和手段,讓消費者能夠了解并且注意到超市的產品從而刺激消費者的購買欲望,最終促使消費者實現購買行為,因此促銷是零售業日常非常重要的一項工作。以往零售商考慮的角度就是單個商品的利潤,但在實際經營中,很多時候最大利潤來源于商品組合銷售。消費者心理學指出,消費者的購買決策帶有很強的情景性,顧客是否購買商品會隨著情景的變化而變化,所以零售業貨架的安排和設計變得尤其重要,目標就是讓顧客發現更多的商品,進而產生購買沖動,那么可以建議在擺放商品時,盡量將置信度較高的商品擺放在和人視線平行的貨柜以方便用戶購買,同時也能促進相鄰商品的銷售量上漲。通過統計數據還發現,最大置信度和最小支持度相差越小,生成的競爭商品組數越多。如果兩種物品的置信度都較低,說明這兩種物品之間在購買時沒有關聯關系,那么就可以分開擺放。對于這些支持度、置信度較小的商品可以采取一些措施來提高銷售業務和顧客滿意度,進而提升企業競爭力。一般來說采取以下策略來激發顧客購買的欲望:

(1)制定促銷活動,利用關聯規則確定不同商品銷售的關聯關系,來精確確定促銷對象。

(2)對銷售、顧客、產品、時間和地區進行分類分析,考慮到不同顧客的需求、不同產品的銷售和不同品牌日用品的質量、價格、利潤等,對不同維度進行分類,這樣就可以更準確地掌握顧客類型、產品暢銷程度,以及在不同時間、不同地域的銷售區別。

(3)分析顧客購買趨勢,對顧客在不同時期購買的商品進行分析,分析顧客消費變化的原因,然后及時調整商品的價格和種類,挽留老顧客,吸引新顧客。

(4)如果某種產品存在它的競爭商品,那么企業可以把購買競爭商品的顧客列為重點顧客,并且商品缺貨時,競爭商品就可以作為臨時替代品進行銷售。

(5)高推薦度的商品個體利潤都比較低,超市可以把推薦度高的商品陳列在顯眼的地方,這樣在節省顧客購買時間的同時也可以增加相關聯商品的銷售額[14-15]。

(6)進行捆綁銷售,比如優惠購買,消費者購買A產品時可以用低于正常價格的形式購買到B。比如統一出售,多種產品按照捆綁后低于單獨標價的價格出售,這樣在降低了銷售成本的同時,也增加了銷售額和顧客滿意度,起到“1+1>2”的效果,讓產品相互協調和促進。

(7)交叉銷售,在貨架擺放時把關聯程度高的商品由過去的就近擺放調整為遠離擺放,比如可以交換個人衛浴和廚具餐具的位置,使洗衣用品和衛生清潔品相對遠離,這樣購買這兩類產品的顧客就需要穿過廚具和家居日用品區,這樣就可能引起消費者的購物沖動。經常性有意識地改變超市貨架布局,來打破消費者的購買習慣,使消費者發現沒有注意到的商品,吸引消費者購買,以提高營業額,而同時超市應該將日銷售量高的物品擺放在兩端,銷售量低的產品擺放在容易引人注意的地方,這樣消費者在購買的時候可以快速定位,也可以引起顧客對各個貨架的關注,從而瀏覽整個貨架,帶動更多的銷售量。

3 結束語

關聯規則技術是一項重要的數據挖掘技術,該技術可以從海量的業務數據中挖掘消費者的購買行為的關聯性。關聯規則能挖掘不同種類項目之間的相關性,因此,可以找出潛在的商品銷售的關聯性和客戶消費傾向等信息。當然如果考慮序數資料間存在相似度,可以找出更多有意義的規則。然而,在產生更多有意義的高頻項目集的同時也會產生相似度太低的項目集。為了解決上述問題,文中以Apriori算法為基礎,挖掘出具有高度關聯性的關聯規則,針對挖掘結果提出了包括捆綁銷售、競爭分析、交叉營銷、商品推薦等不同的解決方案,利用挖掘出的有意義信息,企業可進行決策參考,實現了關聯規則挖掘在零售業實體中的應用研究,對零售業的發展有著較為重要的現實意義。

[1]HanJW,KamberM.數據挖掘概念與技術[M].范 明,孟小峰,譯.北京:機械工業出版社,2006.

[2] 亓文娟,晏 杰.關聯規則挖掘在超市中的應用研究[J].吉林師范大學學報:自然科學版,2013,34(2):138-141.

[3] 陳 莉,焦李成.文檔挖掘與降維技術[J].西北大學學報:自然科學版,2003,33(3):267-271.

[4] 李穎基,彭 宏,鄭啟倫,等.Web日志中有趣關聯規則的發現[J].計算機研究與發展,2003,40(3):435-439.

[5] 卜耀華.關聯規則挖掘技術在零售業中的應用[J].商場現代化,2009(10):97-98.

[6] 張小利,陳 莉.數據挖掘在智能交通系統中的應用[J].西北大學學報:自然科學版,2005,35(6):687-690.

[7]HeraviMJ,ZaianeOR.Astudyoninterestingmeasuresforassociativeclassifiers[C]//Proceedingsofthe2010ACMsymposiumonappliedcomputing.Sierre:ACM,2010:1039-1046.

[8]TingSL,TseYK,HoGTS,etal.Mininglogisticsdatatoassurethequalityinasustainablefoodsupplychain:acaseintheredwineindustry[J].InternationalJournalofProductionEconomics,2013,152:200-209.

[9]LiaoShu-Hsien,ChuPeihui,HsiaoPei-Yuan.Dataminingtechniquesandapplications-adecadereviewfrom2000to2011[J].ExpertSystemswithApplications,2012,39:11303-11311.

[10]RongJia,VuHQ,LawR,etal.AbehavioralanalysisofwebsharersandbrowsersinHongKongusingtargetedassociationrulemining[J].TourismManagement,2011,33(4):731-740.

[11]LiouJJH,TzengGH.Adominance-basedroughsetapproachtocustomerbehaviorintheairlinemarket[J].InformationSciences,2010,180(11):2230-2238.

[12] 王偉輝,耿國華,陳 莉.數據挖掘技術在保險業務中的應用[J].計算機應用與軟件,2008,25(3):123-125.

[13] 閆 珍.面向零售業的關聯規則動態挖掘算法研究[D].南京:南京航空航天大學,2010.

[14] 黃嘉滿.面向零售業的關聯規則挖掘的研究與實現[D].上海:上海交通大學,2007.

[15]HanJiawei,KamberM.Datamining:conceptsandtechniques[M].2nded.Beijing:ChinaMachinePress,2011:146-155.

Research and Realization of Association Rules Mining in Supermarket

ZHANG Jue1,2,CHEN Li2,TIAN Jian-xue1

(1.Department of Information Engineering,Yulin College,Yulin 719000,China; 2.School of Information Science and Technology,Northwest University,Xi’an 710000,China)

With the rapid development of supermarket,a lot of business data are accumulated by intelligent system.It’s imperative and necessary to find an effective technique to explore and discover the potential knowledge from the enormous amount of data,which is helpful for business decision making.Data mining has an important research role in the world.It can be used to acquire the knowledge.The current situation of supermarket development is analyzed,and the customer’s buying behavior is understood through the analysis of the retail sales data,making the explanation to the mining result,application of association rules to solve real business problems.According to the factors of the quantity and profit,the frequent item sets are adopted to find the sales combination model of profit maximization of commodity,and retailers can use it to bundling and gain the biggest profit.Based on the concept of competitive products,a model is proposed that can be used to find out the hidden in the retail database by the frequent and non-frequent items,getting the model of retail commodity recommendation.The experiment shows that the model can find out the high cross selling goods with good practicality in supermarkets.

data mining;association rules;retail business intelligence system;Apriori algorithm

2015-08-12

2015-12-24

時間:2016-09-18

陜西省自然基金資助項目(2003JM8005);榆林市科技局資助項目(NY13-15);榆林學院青年科技基本資助項目(14YK37)

張 玨(1984-),女,講師,博士研究生,研究方向為大數據、智能信息處理、數據挖掘。

http://www.cnki.net/kcms/detail/61.1450.TP.20160918.1707.012.html

TP311

A

1673-629X(2016)10-0146-05

10.3969/j.issn.1673-629X.2016.10.032

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 日韩色图在线观看| 精品国产aⅴ一区二区三区| 国产成人免费高清AⅤ| 欧美亚洲欧美| 精品国产毛片| 国产一级毛片网站| 四虎国产在线观看| 视频二区中文无码| 少妇露出福利视频| 国产日韩精品欧美一区喷| 5555国产在线观看| 亚洲Aⅴ无码专区在线观看q| 人妻无码AⅤ中文字| 最新精品国偷自产在线| 色欲综合久久中文字幕网| 国产高颜值露脸在线观看| www中文字幕在线观看| 国产无码网站在线观看| 欧美国产另类| 免费a在线观看播放| 呦女亚洲一区精品| 国产成人久视频免费| 国产视频大全| 黄色在线不卡| 亚洲成人一区二区| 69av免费视频| 久久精品无码国产一区二区三区| 欧美日韩高清在线| 少妇人妻无码首页| 国产91精品最新在线播放| 亚洲第一色网站| 国产理论精品| 久久77777| 亚洲成人精品在线| 99在线免费播放| 亚洲欧美另类中文字幕| 国产成人艳妇AA视频在线| 日本爱爱精品一区二区| 亚洲国产一区在线观看| 日韩成人午夜| 日韩资源站| 九色视频最新网址| 性网站在线观看| 亚洲欧洲日产国产无码AV| 欧美人人干| 欧美成人国产| 国产精品视频999| 国产啪在线| 国产AV毛片| a级毛片免费播放| 怡红院美国分院一区二区| 亚洲一欧洲中文字幕在线| 天天综合色网| 5555国产在线观看| 国产精品护士| 特级做a爰片毛片免费69| 欧美激情第一欧美在线| 国产精品久久久久久久久久久久| 无码又爽又刺激的高潮视频| 欧美色视频日本| 国产麻豆va精品视频| 亚洲成在线观看| 久久这里只有精品66| 亚洲欧美成人综合| 浮力影院国产第一页| 国产理论一区| 国产精品lululu在线观看| 色老二精品视频在线观看| 亚洲AV人人澡人人双人| 国产麻豆aⅴ精品无码| 久久频这里精品99香蕉久网址| 国产无遮挡猛进猛出免费软件| 熟女成人国产精品视频| 美美女高清毛片视频免费观看| 国产在线拍偷自揄拍精品| 一区二区三区精品视频在线观看| 精品一区国产精品| av在线无码浏览| 99视频在线观看免费| 色偷偷综合网| 91精品国产丝袜| 成人在线不卡视频|