999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Apriori算法和關(guān)聯(lián)度指標的購物籃分析

2014-12-26 02:07:06余文禮
科技視界 2014年4期
關(guān)鍵詞:關(guān)聯(lián)

余文禮

(中南財經(jīng)政法大學,湖北 武漢 430073)

0 引言

互聯(lián)網(wǎng)的飛速發(fā)展使得網(wǎng)絡購物漸變?yōu)橐环N主流的購物方式,網(wǎng)店經(jīng)營者關(guān)心的問題是顧客的購買習慣,各種商品之間存在的聯(lián)系。傳統(tǒng)的購物籃分析,在計算商品組合被同時購買的次數(shù)時,會產(chǎn)生大量的商品組合,時間和空間的開銷巨大,很難以得到令人滿意的結(jié)果。為彌補這一缺陷采用Apriori算法,不斷地通過k維商品集產(chǎn)生k+1維商品集,求出同時被購買概率大的商品組合。再分別對組合中的每一個商品求出其可信度,進一步得出該商品組合的關(guān)聯(lián)度系數(shù)。根據(jù)組合的關(guān)聯(lián)度系數(shù)來衡量商品之間關(guān)系的密切程度,進而把這些關(guān)聯(lián)度大的商品關(guān)聯(lián)在一起,以便于顧客瀏覽,引導消費,增加銷量。

1 關(guān)聯(lián)度指標的提出

數(shù)據(jù)挖掘是在沒有明確假設的前提下去挖掘信息、發(fā)現(xiàn)各種事物之間的聯(lián)系。數(shù)據(jù)挖掘所得到的信息應具有先未知,有效和可實用三個特征。

以一家電商網(wǎng)店為例,假設該網(wǎng)店有n種商品,編號分別為X1,X2,...Xn;取得該網(wǎng)店客戶的消費記錄集合D,其中有m次消費記錄,購買商品組合分別為T1,T2,...Tn。為衡量商品之間關(guān)系的密切程度,挖掘它們的聯(lián)系。首先定義支持度指標:

支持度:一個消費記錄數(shù)據(jù)庫D中包含的某商品組合的消費記錄的個數(shù)與D中總的記錄個數(shù)之比稱為該組合的支持度S。

對于支持度的計算,首先考慮只含有兩個商品的商品組合的簡單情況。n種商品形成的含有兩個商品組合有:種,采用傳統(tǒng)遍歷計算方法,勢必會耗時巨大。

2 Apriori算法應用

2.1 算法說明

Apriori算法是R.Agrawal和R.Srikant于1994年提出的為布爾關(guān)聯(lián)規(guī)則挖掘頻繁項集的原創(chuàng)性質(zhì)算法。算法的思想是先求出滿足條件低維度的商品組合,根據(jù)低維度組合求出高維度組合,對數(shù)據(jù)集進行多步處理,直至求出所有維度的商品組合,算法偽代碼如下:

Input:格式為(Tid,itemset)的消費記錄D,其中Tid為事務標識符,itemset為該事務所對應的商品集。

Output:所有的頻繁商品集。

L1=find_frequent_1-itemsets(D);//找出所有的一維商品集

for(k=2;Lk-1≠Φ;k++)//從2維開始對每一個維度進行計算,直到不存在滿足minsupport的k維商品

其中,GenerateLk是以(k-1)維最大商品集ItemSetk—1和minsupport為參數(shù),計算并返回k維最大商品集ItemSetk,分為組合和剔除兩步執(zhí)行:

第1步:組合(join)根據(jù)ItemSetk—1,計算ItemSetk

第2步:剔除(prune)

對CK中的任一候選組合C,如果C中存在一個不屬于LK-1的維度為 的子序列,那么就從CK中刪除該候選組合C。

2.2 實例應用

假設消費記錄D中有四條消費記錄如表,最小支持度minsupport=2/5:

表1 消費記錄集D

根據(jù) minsupport統(tǒng)計出一維候選商品集 L1為{X1、X2、X3、X5}。使用GenerateLk函數(shù)中join步,即:L1join L1,并通過prune步刪除那些C2中子集不在L1中的商品。生成了侯選商品集 ,與minsupport比較生成L2{(X1,X3)、(X2,X3)、(X2,X5)、(X3,X5)}。 重復以前步驟最后輸出滿足最小支持minsupport的商品組合為:

3 改進關(guān)聯(lián)度指標的提出及運用

Apriori算法可以求出關(guān)聯(lián)度大的商品集合L,但是支持度這一指標衡量的僅僅是商品同時被購買的概率,并不能客觀地反應商品之間的聯(lián)系。例如鉛筆和橡皮,電腦和鼠標這兩組商品在一起被購買的概率很大,但是前者的支持度肯定會遠遠地大于后者。常見易損品的購買記錄會很多,電腦等相對貴重的商品消費者一旦購買就有很長的使用周期,不會在短時間內(nèi)再次購買。所以后者的支持度會很小,但是關(guān)聯(lián)度卻很大。

基于這一局限,進一步定義可信度及關(guān)聯(lián)度系數(shù)指標減小不同商品的差異性。

(1)可信度R:商品組合的支持度與組合中的某種商品被購買概率的比值稱為該商品的可信度。

例如在商品組合(X,Y)中商品X和商品Y的可信度如下:

可信度Rx,即交易記錄集合D中既包含X也包含Y的記錄個數(shù)與D中包含X的記錄個數(shù)之比。實際上就是指,包含X商品的購物籃也包含Y商品的概率。

因為支持度小的組合中的單個商品被購買概率也會很小,可信度將不同類別商品本身之間的差異的影響因素排除在在外。只要用組合(X,Y)的支持度Sxy除以商品本身被購買的概率P(X),無論商品X的使用周期是否一樣,得到的可信度都是客觀,可以比較的。

商品可信度都是對給定商品組合中的單個商品而言的,每個商品都有自己的可信度。求出組合中每個商品可信度之后,就可以進一步求出這個組合的綜合關(guān)聯(lián)度系數(shù)。

(2)關(guān)聯(lián)度系數(shù) W:當商品組合為(X1,X2…Xn)時,該組合的關(guān)聯(lián)度系數(shù)為:

將關(guān)聯(lián)系數(shù)定義為商品互相之間的可信度的幾何平均數(shù),并且W越大,關(guān)聯(lián)度系數(shù)越高,商品之間的關(guān)系越密切,消費者更傾向于同時購買。

還是以上面的消費記錄為實例,最后我們可以得出最后支持度大于2的商品組合,如表2:

表2

根據(jù)以上的表格,我們可以看出的關(guān)聯(lián)度最大的商品組合是(I2,I5),其次是(I1,I3)、(I2,I3,I5),說明這些商品有很強的關(guān)聯(lián)性。 此外還可以看出支持度大的商品組合,可信度和關(guān)聯(lián)度系數(shù)不一定高,這也印證了前面所說的可信度指標可以避免因商品自身價格、類別等屬性不同而造成的支持度不客觀合理的這一現(xiàn)象。

4 促銷方案及總體評價

得出商品組合的關(guān)聯(lián)度系數(shù)后,我們可以有效的掌握商品之間的關(guān)聯(lián)信息。網(wǎng)店就可以把關(guān)聯(lián)程度高、經(jīng)常被同時購買的商品放在同一界面,方便顧客在購物中找到自己的商品,那樣會更加的節(jié)約顧客的時間,而且也會促進商品的銷售。在對商品進行廣告宣傳和推薦時,可以根據(jù)分析結(jié)果進行商品的選擇。對那些購買頻率較高、同其他商品關(guān)聯(lián)規(guī)則較多的商品進行宣傳推薦,其效果將事半功倍。

Apriori算法通過對數(shù)據(jù)的關(guān)聯(lián)性進行了分析和挖掘,得出在決策制定過程中具有重要的參考價值的信息,廣泛應用于商業(yè)、消費市場價格分析中。通過數(shù)據(jù)挖掘,商家可以瞄準目標客戶,采用個人股票行市、最新信息、特殊的市場推廣活動或其他一些特殊的信息手段,從而極大地減少廣告預算和增加收入。

[1]陸麗娜,陳亞萍.挖掘關(guān)聯(lián)規(guī)則中的 Apriori算法的研究[J].小型微型計算機系統(tǒng),2000,21(9):940-943.

[2]顏雪松,蔡之華.一種基于 Apriori的高效關(guān)聯(lián)規(guī)則挖掘算法的研究[J].計算機工程與應用,2002,38(10):209-211.

[3]王德興,胡學鋼,劉曉平,等.改進購物籃分析的關(guān)聯(lián)規(guī)則挖掘算法[J].重慶大學學報:自然科學版,2006,29(4):105-107.

[4]LIU X,SHI B,XIE Y.An improved apriori algorithm for mining association rules[J].Journal of Shandong University(Natural Science),2008,11:014.

[5]周霖,張宏山.購物籃分析在零售業(yè)中的應用研究[J].中國商貿(mào),2013(8).

[6]Ye Y,Chiang C C.A parallel apriori algorithm for frequent itemsets mining[C]//Software Engineering Research,Management and Applications,2006.Fourth International Conference on.IEEE,2006:87-94.

猜你喜歡
關(guān)聯(lián)
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“苦”的關(guān)聯(lián)
當代陜西(2021年17期)2021-11-06 03:21:36
船山與宋學關(guān)聯(lián)的再探討
原道(2020年2期)2020-12-21 05:47:06
“一帶一路”遞進,關(guān)聯(lián)民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
新制度關(guān)聯(lián)、組織控制與社會組織的倡導行為
奇趣搭配
基于廣義關(guān)聯(lián)聚類圖的分層關(guān)聯(lián)多目標跟蹤
自動化學報(2017年1期)2017-03-11 17:31:17
智趣
讀者(2017年5期)2017-02-15 18:04:18
探討藏醫(yī)學與因明學之間的關(guān)聯(lián)
西藏科技(2016年5期)2016-09-26 12:16:39
GPS異常監(jiān)測數(shù)據(jù)的關(guān)聯(lián)負選擇分步識別算法
主站蜘蛛池模板: 亚洲无码一区在线观看| 国产成人久视频免费| 国产国产人成免费视频77777 | 国产精品va免费视频| 国产成人无码播放| 亚洲欧美自拍一区| 中文字幕亚洲乱码熟女1区2区| 国产小视频在线高清播放 | 亚洲h视频在线| 在线看片免费人成视久网下载| 激情亚洲天堂| 久久综合激情网| 黄色成年视频| 88国产经典欧美一区二区三区| 久久福利片| 亚洲高清中文字幕| 综合色亚洲| 超清无码一区二区三区| 亚欧美国产综合| 欧美97欧美综合色伦图| 99久久人妻精品免费二区| 一级做a爰片久久免费| 成人一区专区在线观看| 色综合天天综合中文网| 网友自拍视频精品区| 久久中文无码精品| 久操线在视频在线观看| 成人福利一区二区视频在线| 国产91高跟丝袜| 亚洲 欧美 中文 AⅤ在线视频| 国产极品美女在线观看| 亚洲天堂啪啪| 国产成年女人特黄特色毛片免| 亚洲中久无码永久在线观看软件 | 99热国产在线精品99| 久久国产精品国产自线拍| 欧美成人第一页| 国产精品成人一区二区| 真实国产乱子伦高清| 中文字幕在线视频免费| 2020极品精品国产| v天堂中文在线| 婷婷亚洲综合五月天在线| 欧美视频免费一区二区三区| 美女潮喷出白浆在线观看视频| 欧美国产日韩在线观看| 2018日日摸夜夜添狠狠躁| 成年看免费观看视频拍拍| 亚洲欧美日韩精品专区| 2021国产精品自拍| 亚洲va精品中文字幕| 国产精品白浆在线播放| 美女扒开下面流白浆在线试听| 91无码人妻精品一区二区蜜桃| 91久久夜色精品| 99精品一区二区免费视频| 国产成人精品2021欧美日韩| 高潮毛片免费观看| www中文字幕在线观看| 久久久波多野结衣av一区二区| 国产网站免费观看| 97亚洲色综久久精品| 国内精品免费| 国产日韩欧美在线播放| 国产网站免费看| 亚洲 欧美 中文 AⅤ在线视频| 久久成人免费| 欧美啪啪一区| 国产成人亚洲精品无码电影| 97av视频在线观看| 亚洲日韩精品伊甸| 国产三级成人| 任我操在线视频| 欧美性色综合网| 国产喷水视频| 久久综合九九亚洲一区| 欧美性色综合网| 免费一级毛片在线观看| 亚洲精品久综合蜜| 米奇精品一区二区三区| 99精品热视频这里只有精品7| 国产在线97|