999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Apriori算法在電商網站個性化推薦中的研究與實現

2018-03-31 12:22:42耿曉利王淑娟陳曉鋒
電腦知識與技術 2018年6期
關鍵詞:數據挖掘

耿曉利 王淑娟 陳曉鋒

摘要:電商發展迅速,用戶不再局限于淘寶、京東等大型網站購物,小型商務網站時興起來。大型商務網站可以快速精準的對用戶做出個性化推薦,但小型商務網站由于自身規模、運營狀況等方面有獨有的特點,個性化推薦也需具有針對性。如何實現小型商務網站中的個性化推薦是個值得研究的課題。文章設計實現了領跑運動商城,對經典Apriori算法進行優化,著重闡述了Apriori算法的優化思路及領跑運動商城的個性化推薦實現過程。

關鍵詞:Apriori算法;領跑運動商城;數據挖掘;個性化推薦

中圖分類號:TP391-3 文獻標識碼:A 文章編號:1009-3044(2018)06-0244-03

電子商務發展越來越迅速,用戶在眾多的商品中瀏覽,時限逐漸加長,如果實現對用戶個性化推薦以方面用戶快速定位,是電子商務系統研究的重點與熱點。隨著小型企業商務網站的興起,個性化推薦受到高度重視。中小型企業商務網站由于自身規模、運營狀況等與大型商務網站不同,大型網站的個性化推薦在中小型企業商務網站中直接運用并不合適。本文設計實現了小型電子商務網站——領跑運動商城,并著重對Apriori算法在商城中實現個性化推薦及Apriori算法優化思路進行詳細的闡述。

1 Apriori算法原理

Apriori算法是關聯規則挖掘中最經典的算法,在1993年被R.Agrawl等人提出,算法的目的是從數據庫中找出最大項目集從而產生關聯規則。

Apriori算法通過掃描首先產生候選項集然后再生成頻繁項集進行逐層搜索,去尋找項集之間的關系。Apriori算法需要對數據集進行多步處理。含幾個元素的項集就稱為幾維項集,算法首先計算出一維項集出現的頻度,一維項集表示為1-項集,通過比較將頻度小于最小支持度的項集刪除,最后保留下來的即為一維頻繁項集。一直循環直到沒有頻繁項集生成。循環過程是:第k步中,根據第k-1步生成的(k-1)維頻繁項集,(k-1)頻繁集自連接后產生k維候選項目集,根據k維候選集與最小支持度的比較后找到k維頻繁項集。剪枝過程伴隨著候選項集的產生而進行著,算法尋找k-頻繁項集的過程如圖1所示。

Apfiori算法有著某些的缺陷。通過“掃描-產生候選項集-比較剔除-產生頻繁項集”的模式,逐層產生新的項集然后不斷循環,直到頻繁項集無法結合產生候選項集為止。基于上述情況,Apriori算法在執行時會多次掃描事務數據庫產生所挖掘的規則存在大量冗余,產生大量的候選項集,而且部分規則可能是沒有價值甚至是具有誤導性的;其次因為每次都要對候選集Ck進行支持度計算,計算項過多導致執行緩慢。

2 Apriori算法優化及實現

2.1最小支持度閾值設定

支持度和置信度兩個閾值是描述關聯規則的兩個重要概念,支持度反應關聯規則在數據庫中的重要性,置信度衡量關聯規則的可信程度。

Apriori算法規則的產生依賴于最小支持度與最小置信度兩個參數,兩者分別決定了規則的頻繁度與強度。最小支持度閾值的設定與最終產生的關聯規則結果有著密不可分的關系。

本文利用利用牛頓插值多項式實現最小支持度閾值的設定。從整個待挖掘的數據集中選取小部分數據集,然后運行挖掘算法。第一次運算根據用戶要求或經驗選擇支持度與置信度值,得到關聯規則數目n,用戶期待的規則數目為n,如果n/n>d,則支持度閾值要繼續增大然后重新運行,如果b

2.2優化思路

Apfiori算法不斷重復的掃描數據庫產生了大量的冗余,針對這個問題本文做出兩點修改。一是考慮候選項集Ck前,產生k-1維頻繁項目集時對該集中出現元素的個數進行計數處理,當某一個元素要成為k維項集的元素的話,該元素在k-1階頻繁項的計數次數必須達到k-1個,否則不可能生成k維項集,事先刪除這類元素,排除該元素的所有組合,達到降低循環判斷次數的目的。對龐大的數據量而言,這種時間開銷的降低對數據挖掘效率來說是顯而易見的。二是‘刪除一些不能支持頻繁集的記錄,即把不符合再次掃描比較條件的記錄通過交換記錄內容的方式移到數據庫的末端,把末端新記錄填入該記錄的位置。同時對數據庫中的記錄數邏輯地減少。

改進后的算法雖然會在記錄重寫中浪費時間和I/O的開銷,算法對以后在數據量增長中的掃描比較次數的優勢將逐漸體現出來。從理論上可以相信在數據量龐大的條件下算法在挖掘時間會上有改進。

算法實現步驟:

3商城界面生成

本文實現的商城及推薦后臺界面分別圖2和圖3所示。

在領跑運動商城主界面上,當用戶點擊一款商品后,在展示商品界面中除了展示商品信息外,還展示個性化推薦商品。圖3為后臺,在后臺中可以調整挖掘算法中的支持度以便得到用戶滿意的商品推薦結果。商城初始交易數據較少,對于最小支持度和最小置信度的設定會相對低些,隨著交易規模的擴大,逐漸調整參數值,以保證實現精確個性化推薦。

4結論

本文設計了一個基于Apriori算法優化的個性化電子商務網站,能夠在一定程度上滿足小型電子商務網站的快速響應、決策準確等要求。隨著系統交易數據的增多,系統的挖掘時間及推薦效果需要進一步驗證,相關研究仍將進行下去。

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 伦伦影院精品一区| 精品福利视频网| 国产精品女主播| 久热中文字幕在线观看| 97se亚洲综合在线韩国专区福利| 亚洲青涩在线| 国产一区二区三区在线无码| 久草网视频在线| www精品久久| 四虎精品免费久久| 国产成人调教在线视频| 亚洲精品无码人妻无码| 日韩欧美91| 亚洲欧美日韩中文字幕一区二区三区| 91精品久久久无码中文字幕vr| 国产亚洲精品91| 99视频有精品视频免费观看| 中国成人在线视频| 最近最新中文字幕在线第一页| 毛片免费视频| 国产尤物jk自慰制服喷水| 四虎国产精品永久在线网址| 动漫精品中文字幕无码| 无码AV高清毛片中国一级毛片| 超碰色了色| 国产精品私拍在线爆乳| 欧美特黄一免在线观看| 久久亚洲欧美综合| 亚洲国产中文精品va在线播放| 久久特级毛片| 国产粉嫩粉嫩的18在线播放91| 亚洲aaa视频| 欧美日韩精品综合在线一区| 亚洲精品无码在线播放网站| 狠狠综合久久| 人妻中文字幕无码久久一区| 亚洲二区视频| 国产成在线观看免费视频| 波多野结衣中文字幕一区| 97久久精品人人| 日韩毛片视频| 国产AV毛片| 国国产a国产片免费麻豆| 韩国福利一区| 欧美精品不卡| 特级做a爰片毛片免费69| 88av在线播放| 亚洲第一中文字幕| 99热这里只有精品在线观看| 日韩精品中文字幕一区三区| 亚洲国产精品无码AV| 小说区 亚洲 自拍 另类| 精品一區二區久久久久久久網站| 国产精品亚洲综合久久小说| 久久综合丝袜日本网| 亚洲国模精品一区| 欧美国产成人在线| 最新午夜男女福利片视频| 成人午夜视频在线| 国产精品微拍| 激情综合网激情综合| 亚洲综合狠狠| 亚洲—日韩aV在线| 国产毛片基地| 国产九九精品视频| 91蜜芽尤物福利在线观看| 日韩大片免费观看视频播放| 中文字幕 91| 国产成人欧美| 午夜精品久久久久久久2023| 欧美亚洲国产精品第一页| 日本91在线| 午夜国产大片免费观看| 亚洲国语自产一区第二页| 久久综合亚洲色一区二区三区| 欧美伊人色综合久久天天| 又爽又大又黄a级毛片在线视频| 亚洲天堂高清| 2021天堂在线亚洲精品专区| 国产精品视屏| 青青草欧美| 2021天堂在线亚洲精品专区|