999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

電子商務網站的個性化“混合”推薦服務

2017-08-01 00:14:00蔡銀英
重慶第二師范學院學報 2017年4期
關鍵詞:關聯用戶

蔡銀英

(重慶第二師范學院 數學與信息工程學院,重慶 400067)

?

電子商務網站的個性化“混合”推薦服務

蔡銀英

(重慶第二師范學院 數學與信息工程學院,重慶 400067)

隨著電子商務網站的快速發展,網絡商品銷售數量急劇增加,要提升用戶網購的體驗度,就必須為用戶提供個性化的推薦服務。目前常用的個性化推薦算法有:基于內容的推薦算法、基于關聯規則的推薦算法和基于協同過濾的推薦算法。在實際應用中,各算法都存在一定的局限,為了發揮各算法的優勢,可以采用個性化的“混合”推薦服務。

電子商務網站;個性化推薦算法;混合推薦服務

中國互聯網絡信息中心發布的《第38次中國互聯網絡發展狀況統計報告》顯示,截至2016年6月,中國網民總規模達7.1億,人均周上網時長26.5小時;網絡購物用戶規模達到4.48億,較2015年底增加3448萬,增長率為8.3%。2015年發布的同期數據顯示,當年的網絡購物用戶較2014年增長3.5%。從這些數據可以看出,越來越多的網民喜歡通過網絡購物平臺采購所需商品,究其原因無非就是因為網絡的便捷性與選擇的多樣性。而有需求就有發展,隨著電子商務網站的急速發展,網絡購物平臺的商品數量呈現爆炸式增長,商品數量的急劇增加在為用戶提供更多選擇的同時,也增加了用戶選到心儀商品的難度。如何幫助用戶快速找到自己喜歡的物品,提升用戶的使用感受就成了電子商務網站關注的熱點。目前普遍采用的方法為搜索引擎,搜索引擎可以根據用戶的搜索過濾大量的信息,但是返回結果是大眾化的,仍然需要用戶花費大量時間對返回結果進行瀏覽辨別。為了提高用戶的搜索效率,就需要對用戶進行個性化的推薦。

一、個性化推薦服務的流程

個性化推薦服務主要是基于用戶的歷史行為記錄以及用戶的原始信息,預測用戶感興趣的產品,并為用戶的購買行為或網頁瀏覽提供建議的服務。個性化推薦服務一般包含三個模塊:歷史信息采集模塊、推薦算法模塊、用戶尋求推薦模塊。其通用流程如圖1所示。從流程圖可以看出,推薦算法模塊是個性化推薦服務的核心。推薦算法其實就是從用戶的歷史行為記錄以及用戶的原始信息中深層次挖掘出用戶的偏好信息、個性化信息,并從中提取用戶的潛在興趣因素。

圖1 個性化推薦服務的流程

二、常用的三種推薦算法

常用的推薦算法主要包含基于內容的推薦算法、基于關聯規則的推薦算法與基于協同過濾的推薦算法。

(一)基于內容的推薦算法

基于內容的推薦算法,是利用用戶的興趣偏好屬性與待推薦項目的特征屬性的相似度進行推薦。該推薦算法首先建立用戶與項目的特征屬性集,采用向量空間模型得到用戶與項目特征屬性的稀疏矩陣集,再依據余弦相似度為用戶提供推薦結果。假設第k個用戶的特征屬性集為Ck={wk1,wk2,…,wkr},第t個項目的特征屬性集為Dt={dt1,wt2,…,wtr},這里的r是指項目與用戶特征屬性集中的關鍵詞個數。余弦相似度就為

cos(Ck,Dt)值越高說明第k個用戶與第t個項目的相似度就越高,共同屬性就越多。也就是說,第k個用戶也就越喜歡第t個項目,據此可以得到用戶與所有待推薦項目的余弦相似度,采用TOP—N的方法進行推薦即可。

基于內容的推薦算法,其優點為可解釋性強;不需要用戶的評分數據,只需建立特征屬性集;對于項目而言不存在冷啟動的問題(不存在新項目無法獲得推薦的問題)。其缺點為特征屬性集需要從用戶的描述與項目的表述中提取關鍵詞,并不是所有項目都可以提取關鍵詞,比如音樂、影視等項目是無法通過分詞的辦法提取關鍵詞的;對于沒有任何記錄的新用戶,因為沒有數據可用,也就無法推薦;不可挖掘用戶新的興趣點(因為所有推薦項目都與用戶的已有資料相匹配)。

(二)基于關聯規則的推薦算法

基于關聯規則的推薦算法,是從大量的數據中挖掘出項目間有意義的聯系,再通過這種聯系對用戶進行推薦。項目間的這種聯系可以用關聯規則或頻繁項集的形式來表示。該推薦算法的關鍵就是要發現頻繁項集,建立關聯規則。“啤酒與尿布”就是關聯規則的推薦算法中非常經典的實例。

設待推薦項目總數為N,待推薦項目表示為ti,i為1到N中的正整數,表示各個項目的編號。用戶的一次瀏覽或購買構成一個條目記為Sj,j表示該網站的瀏覽或者購買累計次數,取值為正整數,則Sj={ti|i為所購項目的編號}。由此構建所有歷史條目的二元數據矩陣M,即以待推薦項目為列,以每個購買條目為行,交叉處的元素cij為0或者1,0表示第i個條目沒有購買第j個貨物,1表示第i個條目購買了第j個貨物。

顯然,基于關聯規則的推薦算法不需要分析用戶的興趣偏好、物品的特征屬性,僅通過用戶的瀏覽與購買行為即可進行推薦,但是其推薦為共性推薦,忽略了用戶的個性特點;隨著數據量的累積,運算開銷太大;對于新的物品,因為沒有用戶的購買數據,所以無法進行推薦,即存在冷啟動的問題。

(三)基于協同過濾的推薦算法

基于協同過濾的推薦算法,是目前應用最多的推薦算法,其基本思想是利用群智對信息進行過濾篩選,分為基于近鄰的協同過濾推薦算法與基于模型的協同過濾推薦算法。基于近鄰的協同過濾推薦算法建立在用戶以前有相同的愛好,以后也有相同的愛好這一假設之上,主要是利用用戶的歷史信息(注冊信息、瀏覽信息、評分數據等)分析用戶的興趣愛好,并尋找與用戶興趣愛好相似的用戶群,再根據相似用戶群的選擇對用戶進行推薦,目前有基于用戶的協同過濾推薦算法與基于項目的協同過濾推薦算法。

基于用戶的協同過濾推薦算法是根據用戶對項目的評價信息,計算用戶間的相似性,并依據相似性尋找用戶相似群即用戶鄰居群,再根據用戶鄰居群對項目的評價信息預測用戶的偏好,并為用戶進行推薦。該推薦算法有三個關鍵步驟:用戶評價信息描述、用戶鄰居群構建、生成推薦。

用戶對項目的評價信息可以通過用戶—項目矩陣進行描述,設用戶集合為U={u1,u2,…,um},

項目集合為

I={i1,i2,…,in},

rij,(i=1,2,…,m;j=1,2,…n),

表示用戶ui對項目ij的評價,由rij所生成的m×n的矩陣就是對用戶評價信息的描述。用戶鄰居群的構建主要依賴于用戶間的相似性,用戶的相似性可以采用余弦相似度與皮爾森相似度來衡量,皮爾森相似度為

利用預測的評分進行TOP—N推薦。

基于項目的協同過濾推薦算法根據用戶對項目的評價信息,計算項目間的相似性,并依據用戶的偏好(已購買的物品或點擊過的頁面)預測用戶對各項目感興趣的程度,再根據用戶的興趣度為用戶進行推薦。該推薦算法主要依賴于項目的相似度與用戶的興趣度計算。

項目相似度的計算有多種方法,項目i,j的相似度較為直觀的一種算法為

Ruj表示用戶對項目j的興趣度,可以將其簡化為1。最后依據Pui對用戶進行TOP-N的推薦。

基于協同過濾的推薦算法與基于關聯規則的推薦算法一樣,都不依賴于項目屬性與用戶自身的數據信息,不會對用戶的推薦體驗帶來負面影響。但是基于協同過濾的推薦算法需要利用用戶的歷史數據或評價信息來推薦,若用戶的歷史數據較少或與其他用戶的重疊數據較少時會影響評價的準確性,同時基于協同過濾的推薦算法對新用戶與新項目是沒有辦法進行推薦的。

三、個性化的混合推薦算法

(一)個性化的混合推薦算法及應用

為了提高推薦的準確性,改進各個算法中的缺陷,建議依據歷史數據的多少將用戶分為老用戶(有較多的歷史數據)、次新用戶(有少量的歷史數據)、新用戶(沒有歷史數據)三類,分別適用不同的推薦算法。對老用戶采用基于協同過濾的推薦算法進行個性化推薦,次新用戶采用基于關聯規則的推薦算法進行推薦,只要數據積累到一定數量即可轉為老用戶進行個性化推薦;新用戶采用基于內容的推薦算法,主要是熱點推薦,只要新用戶有所選擇便是次新用戶,采用關聯規則推薦算法對其進行推薦。對用戶的推薦流程如圖2所示。新項目的推薦采用簡化的基于內容的推薦算法,根據用戶的歷史數據都可以為用戶設定標簽,計算新項目與用戶的相似性,選擇相似性較高的項目,作為TOP-N中的待選項目推薦給用戶。

圖2 混合推薦流程圖

利用此混合推薦算法對某網站的客戶進行推薦,主要分析步驟為:獲取用戶訪問網站的原始記錄;對數據進行預處理,包括數據去重、數據變換、屬性規約、屬性變換等;對比多種推薦算法,采用混合推薦算法對用戶進行個性化推薦,即第一次登陸網站的用戶采用內容相關的熱點推薦,一旦用戶有點擊則采用基于關聯規則的推薦對用戶進行推薦;老用戶采用基于協同過濾的推薦算法對其進行推薦。分析流程如圖3所示。

在對數據的探索過程中,發現約有1/4的網站用戶只登陸了網站的首頁,而沒有瀏覽其他頁面,這部分用戶應該是通過搜索引擎進入網站,在網站的導航頁面沒有找到所需要的內容而退出網站的;同時也說明網站原有的基于內容的新品推薦不能滿足用戶的需求。采用混合推薦算法中的對待新用戶的推薦策略,利用基于內容的熱點推薦與現有的社會熱點或時事熱點結合,可以留存部分用戶。一旦用戶瀏覽推薦頁面,即為次新用戶,可以采用關聯規則的推薦算法對其進行較為個性化的推薦。因為關聯規則模型中的最小支持度與最小置信度取值越大,事物之間的聯系也就越密切;滿足條件的頻繁項集也就越少。當然頻繁項集的多少也與數據量的大小有關,對于次新用戶的推薦經過多次調整,最后選取模型最小支持度為0.6%,最小置信度為65%的頻繁項集給出推薦結果。

圖3 混合推薦算法流程圖

對于老用戶采用協同過濾推薦算法進行個性化的推薦,因為該網站的網頁數明顯少于用戶數,所以采用基于項目的協同過濾推薦算法。豐富的歷史數據可以提高推薦準確度,利用協同過濾推薦算法對老用戶進行推薦時,發現部分用戶沒有推薦結果,主要是因為用戶的瀏覽量較少所致,對這部分用戶仍然采用次新用戶的推薦結果進行推薦。

(二)推薦算法評價

為了對比個性化推薦算法與非個性化推薦算法的結果,通過兩種非個性化的算法:隨機推薦算法、熱點推薦算法和個性化的算法:基于項目的協同過濾算法來對數據進行建模并對模型進行評價與分析。

數據中用戶行為是二元選擇(有瀏覽、無瀏覽),對用戶的推薦也就是一個二分問題。二分問題中,常將實例分為正類(positive)與負類(negative),預測中會出現四種情況,即正類被預測為正類(真正類Truepositive)、負類被預測為正類(假正類Falsepositive)、負類被預測為負類(真負類Truenegative)、正類被預測為負類(假負類Falsenegative)。可用表1來表示。

表1 二分問題的分類

二分問題的預測常用準確率(P)、召回率(R)、真正率(TPR)、假正率(FPR)作為評測指標,其中

由公式可以看出準確率就是預測正確的實例占總實例的比例;召回率是正類中預測正確的實例占預測為正類實例的比例;真正率又稱為靈敏度,是正類中預測正確的實例占正類實例的比例;假正率是負類中預測為正類的實例占負類實例的比例;除了假正率外,其余的準確率、召回率、真正率都是值越大越好,假正率是越小越好。

對于推薦算法的評價采用離線測試的方法來獲取,選擇準確率(P)、召回率(R)、真正率(TPR)、假正率(FPR)作為評測指標。

對三種推薦算法,選擇不同K值(推薦個數,K取3、5、10、15、20)的情況下進行模型構造,得到評測指標準確率、召回率、真正率(TPR)、假正率(FPR),并繪制出ROC(真正率-假正率)曲線如圖4所示。從ROC曲線可以看出,不管K取何值時基于項目的協同過濾推薦其真正率比其他兩種非個性化推薦取值都要高,假正率比非個性化推薦的取值都低,這說明個性化的推薦基于項目的協同過濾推薦優于隨機推薦與熱點推薦。同時又注意到隨機推薦與熱點推薦的假正率取值接近,但是隨機推薦的真正率要比熱點推薦的真正率低得多,所以熱點推薦優于隨機推薦。

圖4 ROC曲線

四、結語

綜上所述,個性化的“混合”推薦算法具有一定的優勢,它能夠改進協同過濾推薦算法中的數據稀疏性問題,同時可以利用協同過濾推薦的個性化及精準性為用戶進行推薦;可以有效改進冷啟動問題,使每一位用戶都有推薦項目;有效利用特征屬性的提取對新項目進行推薦,使特征屬性的提取最小化。

但是,該算法不能改善協同過濾算法的可擴展性的問題。

[1]中國互聯網信息中心.第38次中國互聯網絡發展狀況統計報告[DB/OL].http:∥www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201608/t20160803_54392.htm,2016-10-6.

[2]何佳知.基于內容和協同過濾的混合算法在推薦系統中的應用研究[D].上海:東華大學,2016.

[3]張同啟.基于關聯規則及用戶喜好程度的綜合電子商務推薦系統的研究[D].北京:北京郵電大學,2014.

[4]Pang-NingTan,MichaelSteinbach,VipinKumar.數據挖掘導論[M].范明,范宏建,譯.北京:人民郵電出版社,2011.

[5]博客頻道.基于物品的協同過濾算法[DB/OL].http:∥blog.csdn.net/yeruby/article/details/44154009,2017-2-17.

[責任編輯 文 川]

2017-03-24

重慶第二師范學院“青年教師成長支持計劃”(201605);重慶市教委科研項目(KJ1501414)

蔡銀英(1976— ),女,山西運城人,副教授,研究方向:概率論與數理統計。

O244

A

1008-6390(2017)04-0122-05

猜你喜歡
關聯用戶
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
“一帶一路”遞進,關聯民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 国产一区二区精品福利| 99精品视频播放| 黄色网页在线播放| 国产精品香蕉在线| 毛片最新网址| 成人国产精品2021| 亚洲成人动漫在线观看| 曰韩免费无码AV一区二区| 高清乱码精品福利在线视频| 狠狠色丁香婷婷综合| 亚洲男人的天堂在线观看| 多人乱p欧美在线观看| 久久综合亚洲鲁鲁九月天| 久久免费看片| 91亚洲视频下载| 在线免费亚洲无码视频| 精品国产成人国产在线| 国产一级在线观看www色| 福利小视频在线播放| 亚洲精品动漫| 在线观看网站国产| 婷婷综合色| 国产精品香蕉| 91精品福利自产拍在线观看| 亚洲综合久久成人AV| 无码电影在线观看| 色丁丁毛片在线观看| 2021国产乱人伦在线播放| 波多野结衣AV无码久久一区| 国产精品久久久久久久伊一| a天堂视频在线| 成人av专区精品无码国产 | 国产精品思思热在线| 欧美中文字幕一区| 亚洲伊人天堂| 中文字幕av一区二区三区欲色| 久草视频中文| 亚洲精品桃花岛av在线| 午夜老司机永久免费看片| 国产精品蜜芽在线观看| 亚洲人成日本在线观看| 中文字幕亚洲乱码熟女1区2区| 日本精品一在线观看视频| 九九精品在线观看| 亚洲永久精品ww47国产| 国产福利免费视频| 国产精品美女网站| 人人爱天天做夜夜爽| 狠狠ⅴ日韩v欧美v天堂| 国产高清在线观看91精品| 亚洲aaa视频| 中国国产一级毛片| 欧洲在线免费视频| 永久免费av网站可以直接看的| 伊人福利视频| 五月激情综合网| 影音先锋亚洲无码| 亚洲天堂视频网| 全部免费特黄特色大片视频| 2021最新国产精品网站| 亚洲天堂日本| 国产导航在线| 美女无遮挡免费视频网站| 亚洲高清无码精品| 欧美.成人.综合在线| 国产极品美女在线播放| 成人日韩视频| 怡红院美国分院一区二区| 国产一级毛片在线| 亚洲精品日产精品乱码不卡| 免费国产高清视频| 日韩精品一区二区深田咏美 | 亚洲欧美不卡视频| 国产美女91视频| 嫩草影院在线观看精品视频| 国产美女在线免费观看| 久久影院一区二区h| 全裸无码专区| 欧美成人看片一区二区三区| 欧美日韩精品一区二区视频| 青青青国产在线播放| 2020国产精品视频|