999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Top-K推薦中的多樣性研究

2017-10-13 05:58:53邢小璐復旦大學公共績效與信息化中心實驗室上海200126
微型電腦應用 2017年9期
關鍵詞:用戶方法

邢小璐(復旦大學 公共績效與信息化中心實驗室, 上海 200126)

Top-K推薦中的多樣性研究

邢小璐
(復旦大學 公共績效與信息化中心實驗室, 上海 200126)

隨著電子商務產業(yè)的不斷發(fā)展,推薦系統(tǒng)越來越多走入人們的生活,其中Top-K推薦能夠推薦一個商品列表供用戶選擇,在商業(yè)推薦中越來越多地扮演重要角色。對于Top-K推薦而言,多樣性的提高可以使推薦列表不再重復、單調,給用戶多樣化的選擇空間,更容易適應用戶需求。傳統(tǒng)的Top-K推薦方法大多在預測評分方法的基礎上進行優(yōu)化改良,本文通過MovieLens數據集上的統(tǒng)計調查,說明基于用戶興趣分布會比基于預測評分擁有更優(yōu)的效果。本文還提出兩個獲取用戶興趣分布的思路,供后續(xù)研究參考。

推薦系統(tǒng); 多樣性; Top-k推薦

Abstract: With the continuous development of e-commerce industry, recommender systems go more and more into people's lives. Top-K recommendation could recommend a list of items for the user to choose, and more and more plays an important role in the commercial recommendation. For Top-K recommendation, the increase in diversity can make the recommendation lists no longer repeat and monotonous. It provides users a variety of choices, convinience to adapt to users' needs. The traditional Top-K recommendation methods are mostly optimized on the basis of the rate prediction methods. Through the statistical survey on the MovieLens dataset, this paper shows that the user interest distributions will have better effect than the predictive rate. This paper also proposes two ideas for obtaining user interest distributions which may be used in later research.

Keywords: Recommendation; Diversity; Top-k

0 引言

推薦系統(tǒng)即通過對海量的用戶歷史購物信息進行學習,了解用戶的興趣特點和購買傾向,向用戶推薦用戶感興趣的信息和商品。近年來,隨著電子商務產業(yè)的不斷發(fā)展,網絡上商品或者說消費品的種類和數量不斷增長,用戶往往要在篩選大量商品信息的過程中浪費許多精力和時間,為了解決這個問題,許多購物網站、信息提供網站以及社交網站,諸如淘寶網、豆瓣網、微博,都建立了完善的推薦系統(tǒng),用來為用戶提供完全個性化的決策支持和信息服務。推薦系統(tǒng)已經在方方面面滲透入了人們的生活。

傳統(tǒng)的推薦系統(tǒng)通常通過應用一些標準推薦算法,向用戶推薦具有最高預測評分的商品。常見的方法有基于內容的方法,協(xié)同過濾(CF)[1],矩陣奇異值分解(SVD)[2]等。這些方法通過對用戶的歷史評分數據建模,得到用戶對其未評分商品的預測評分,從而對用戶進行推薦。在這些方法當中,預測評分的精準度決定了這些方法的優(yōu)劣。一般來說,用均方根誤差(RMSE)對預測評分的精準度進行評估,RMSE較低的方法被認為具有更好的效果。

然而,傳統(tǒng)的推薦系統(tǒng)雖然在推薦單個商品上已經達到很好的效果,但當推薦的為一整個商品列表,即進行Top-K推薦時,傳統(tǒng)推薦方法得到的推薦商品列表具有單調性以及重復性,很難真正滿足用戶的需求。尤其當用戶為興趣廣泛且模糊的用戶類型時,這種缺陷更加明顯。于是,最近的許多研究[3-5]更加注重在Top-K推薦中提高商品列表的多樣性,來覆蓋用戶多樣的興趣,從而達到更好的推薦效果。在評估這類Top-K推薦方法時,與單個商品不同,不僅需要評估推薦商品列表的精準度(Precision)和召回率(Recall),同時也要對列表的多樣性(Diversity)進行評估。

1 國內外Top-K推薦多樣化研究

近年來,已經出現了許多使推薦列表或搜索結果多樣化以增加用戶滿意度的研究。這些研究提高多樣性的方式主要分為以下兩類:

2 MovieLens數據集上的統(tǒng)計調研

最近的許多Top-K推薦方法主要基于傳統(tǒng)推薦方法得到的推薦列表對多樣性進行改進。一般來說,它們定義一個目標函數,在商品列表的精準度和多樣性間進行平衡。1998年提出的MMR方法[6]是大多數這類方法的基礎,其通過貪心算法每一步迭代選取當前能夠最大化列表精準度和多樣性的商品,最終得到一個同時兼顧精準度以及多樣性的商品列表。然而,這些方法的基礎仍是傳統(tǒng)推薦方法的預測評分方法,其預測評分并不能精準地代表用戶的興趣傾向,這使得在Top-K推薦當中,這些推薦方法的效果仍有上升的空間。我們接下來通過一個在MovieLens數據集上的統(tǒng)計調研來說明這個問題。在公開數據集MovieLens上關于電影主題的一個統(tǒng)計結果。MovieLens數據集中包含了一組從20世紀90年末到21世紀初由MovieLens用戶提供的電影評分數據,其中包括電影評分、電影元數據(風格、主題和年代)以及用戶信息(年齡、郵編、性別和職業(yè)等)。如圖1所示。

圖1 MovieLens數據集主題數據統(tǒng)計

圖1中橫坐標為MovieLens數據集中的顯性主題,我們對各主題所占比例以及主題所受到的各等級評分所占的比例進行統(tǒng)計。其中“Topic Popularity”表示數據集中每個主題所占比例,我們可以認為這是該主題的流行度,“Rated (x) Proportion”表示每個主題中評分為x的比例。我們很容易可以發(fā)現,流行的電影主題不一定會獲得高的評分。例如,“Comedy”主題的電影具有最高的人氣,但是在對該主題電影的評分當中,評分和的比例只有接近。此外,諸如“Film-Noir”和“Documentary”的高評分主題,它們也同時具有幾乎最低的流行度。這些觀察結果可以表明,用戶的興趣與其對商品的評分并不密切相關,也就是說,用戶會傾向于選擇的商品不一定是能得到高評分的商品。

因此,我們認為相對于傳統(tǒng)Top-K推薦方法中基于預測評分對商品進行排序的做法,基于用戶興趣分布來進行Top-K推薦才是更好的選擇。

3 獲取用戶興趣分布的兩種思路

本文提出兩種獲得用戶興趣分布的思路。它們都能直接獲取用戶興趣分布,而不是預測用戶對商品的評分,更加適用于進行Top-K推薦的推薦方法。

1.1 LDA主題模型:

在自然語言處理當中,LDA主題模型用來得到“文章-主題”和“主題-詞”這兩個概率分布,通過這兩個概率分布,可以實現如自動摘要、主題生成、文章分類等功能。其核心式如下式:

p(w|d)=p(w|t)*p(t|d)

其中d、w、t分別為文章、詞、主題。我們可以看到,在LDA中,文章d中的每一個詞w,都被看作是以p(t|d)的概率先選擇一個主題t,再以p(d|t)的概率從主題t相關的詞中選擇一個詞w。

而近年來一些推薦算法[11]將LDA主題模型應用于推薦領域,他們往往通過對商品的文本信息如介紹、評論等進行類似于自然語言處理中的LDA建模,得到“用戶-主題”和“主題-商品”的分布。在這些研究當中,用戶被看作先以一定概率選擇一個主題,然后再從主題相關的商品中以一定概率選擇一個商品。不同于常規(guī)推薦系統(tǒng)致力于預測用戶對商品的評分,通過LDA建模得到的這兩個概率分布,可以容易地計算出用戶選擇商品的概率,即用戶興趣分布。

1.2 隨機游走方法:

一些推薦方法[12]將用戶對商品的評分矩陣轉化成圖的形式,并在圖上進行隨機游走(Random Walk)的實驗。其核心思想來源于google的PageRank算法。如圖2所示。

圖2 評分關系圖

一般做法是將用戶和商品作為圖中節(jié)點,用戶對商品的評分關系作為圖中的邊,某些研究還將評分作為邊的權重。以此評分關系圖為基礎,每次選取一個用戶u,虛擬其在圖上隨機游走N輪的過程,統(tǒng)計該用戶u到達各個商品節(jié)點的次數Ci,則用戶u選商品i的概率可以近似看作Ci/N。多次實驗取均值,就可以得到用戶u的興趣分布。

4 總結

目前推薦系統(tǒng)研究中的一個重要方向是提高Top-K推薦的多樣性。本文對推薦系統(tǒng)及Top-k推薦的現狀進行介紹,然后通過一個在通用數據集MovieLens上的統(tǒng)計調研,說明了在Top-K推薦當中基于用戶興趣分布會比基于預測評分更加適用,并提出兩個獲取用戶興趣分布的思路,分別為LDA主題模型和隨機游走方法,希望能給后續(xù)研究帶來啟發(fā)。

[1] Koren Y, Bell R. Advances in Collaborative Filtering. Recommender Systems Handbook[M].2011: 145-186.

[2] Koren Y. The Bellkor Solution to the Netflix Grand Prize[J]. Netflix prize documentation, 2009(81): 1-10.

[3] Mi Zhang, Neil Hurley. Avoiding Monotony: Improving the Diversity of Recommendation Lists[R]. Lausanne, Switzerland, October, 2008:23-25.

[4] Zhou T, Kuscsik Z, Liu J G, et al. Solving the Apparent Diversity-accuracy Dilemma of Recommender Systems[J]. Proceedings of the National Academy of Sciences of the United States of America, 2010, 107: 4511-4515.

[5] Qin Lijing,Zhu Xiaoyan. Promoting Diversity in Recommendation by Entropy Regularizer[J]. IJCAI, 2013, 2698-2704.

[6] Jaime G. Carbonell, Jade Goldstein. The Use of MMR, Diversity-based Reranking for Reordering Documents and Producing Summaries[C]. SIGIR 1998, Melbourne, Australia,

[7] Tommaso Di Noia, Vito Claudio Ostuni, Jessica Rosati, et al. An Analysis of Users' Propensity Toward Diversity in Recommendations[C]. Eighth ACM Conference on Recommender Systems, Silicon Valley, 2014.

[8] Rodrygo L T. Santos, Craig Macdonald, IadhOunis. Exploiting Query Reformulations for Web Search Result Diversification[C]. Raleigh, 2010.

[9] A. Ashkan, B. Kveton, S. Berkovsky, et al. Optimal Greedy Diversity for Recommendation[C]. Proceedings of the Twenty-Fourth International Joint Conference on Artificial Intelligence, 2015,1742-1748.

[10] Van Dang, W. Bruce Croft. Diversity by Proportionality: An Election-based Approach to Search Result Diversification[C]. SIGIR12, Portland, 2012: 12-16.

[11] Deepak Agarwal, Bee Chung Chen. FLDA: Matrix Factorization through Latent Dirichlet Allocation[C]. WSDM 2010.

[12] Zhang Y, Wu J, Zhuang Y. Random Walk Models for Top-N Recommendation task[J]. Journal of Zhejiang University (SCIENCE A), 2009,10(7):927-936.

ResearchonDiversityinTop-krecommendation

Xing Xiaolu
(Pudong New Area, Shanghai 201203, China)

TG4

A

2017.04.15)

邢小璐(1991-),男,軟件工程師。研究方向:數據挖掘,推薦系統(tǒng)。

1007-757X(2017)09-0044-03

猜你喜歡
用戶方法
學習方法
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 欧美精品v欧洲精品| 亚洲成A人V欧美综合| 欧美亚洲国产一区| www精品久久| 国产人妖视频一区在线观看| a网站在线观看| 国产美女91视频| 日本三区视频| 国产91精品调教在线播放| 色AV色 综合网站| 日本欧美成人免费| 久草视频福利在线观看| 伦精品一区二区三区视频| 久久人搡人人玩人妻精品| 成人午夜亚洲影视在线观看| 99激情网| 97国产在线观看| 欧美无专区| 亚洲黄网在线| 日韩大片免费观看视频播放| 99这里只有精品在线| 亚洲男人的天堂在线| av色爱 天堂网| 国产精品欧美激情| 天堂网亚洲综合在线| 亚洲精品动漫| 色成人亚洲| 黄色成年视频| 国产精品美女免费视频大全| 亚洲午夜福利在线| 极品尤物av美乳在线观看| 2020极品精品国产| 日韩在线欧美在线| 欧美中文字幕在线二区| 国产在线无码一区二区三区| 国产精品一线天| 亚洲欧美一级一级a| 中文字幕亚洲综久久2021| 99成人在线观看| 久久精品中文字幕免费| 久久免费精品琪琪| 91 九色视频丝袜| 亚洲综合香蕉| 一本无码在线观看| 精品91自产拍在线| 2020最新国产精品视频| 免费看的一级毛片| 亚洲精品动漫在线观看| 亚洲av无码牛牛影视在线二区| 日韩123欧美字幕| 免费看黄片一区二区三区| 久久久久久国产精品mv| 久操线在视频在线观看| 日本五区在线不卡精品| 曰AV在线无码| 中文字幕在线一区二区在线| 一级毛片网| 成人蜜桃网| 国产激情无码一区二区免费| 久久人体视频| 亚洲成人网在线观看| 亚洲天堂成人在线观看| 成年A级毛片| 2021国产精品自产拍在线| 99久久精品国产精品亚洲| 日韩欧美在线观看| 99久视频| 黄色网页在线观看| 国产国模一区二区三区四区| 国产真实乱子伦精品视手机观看 | 欧美三級片黃色三級片黃色1| 日韩免费毛片| 午夜毛片免费观看视频 | 人人妻人人澡人人爽欧美一区| 国产精品自拍合集| 91麻豆国产精品91久久久| 最新精品久久精品| 色国产视频| 久夜色精品国产噜噜| 综合天天色| 91丝袜在线观看| 99久久人妻精品免费二区|