999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Baseline SVD主動學習算法的推薦系統

2015-06-15 22:12:41季蕓等
現代電子技術 2015年12期
關鍵詞:主動學習

季蕓等

摘 要: 推薦系統是一種解決信息過載的新型技術,為了解決推薦系統中新用戶帶來的冷啟動問題,提出一種基于主動學習的推薦系統。主動學習方法能有效減少需要標記的樣本數量,快速建立模型,在此選擇將主動學習方法和Baseline SVD推薦算法結合起來,通過記錄模型訓練得到的預估評價的改變程度,認為改變最大的樣例即是最具有信息量的樣例,供新用戶標記,并重新訓練模型。通過與其他選擇策略進行實驗比較,證實了該方法確實有效解決了新用戶帶來的冷啟動問題。

關鍵詞: 推薦系統; 主動學習; Baseline SVD; 樣例選擇

中圖分類號: TN915.03?34 文獻標識碼: A 文章編號: 1004?373X(2015)12?0008?04

Recommender system based on Baseline SVD active learning algorithm

JI Yun1, HU Xue?lei1, 2

0 引 言

隨著信息技術和互聯網的高速發展,各種互聯網應用充斥著每個人的生活,得益于互聯網的開放性,便利性和分布性,互聯網上的信息量急劇增加。為了解決信息過載問題,推薦系統成為了繼分類目錄和搜索引擎之后,大數據時代的新寵。協同過濾作為一種主流的推薦系統技術[1],在學術界和應用上都廣受好評,它的主要思想是通過用戶之間的聯系來分享物品。協同過濾算法分成兩種[2]:一種是基于記憶的協同過濾算法(Memory?based),包括ItemCF算法和UserCF算法,通過計算用戶或物品之間的相似度來做推薦;另一種是基于模型的協同過濾(Model?based),基于模型的推薦算法往往結合了數據挖掘、人工智能、機器學習等諸多技術,常見的有基于聚類的推薦、基于矩陣分解的算法、Slope One[3]等,其中基于矩陣分解的算法有:SVD,Baseline SVD[4],SVD++[5]等。在Netflix Prize推薦大賽之后,基于矩陣的推薦算法迅速崛起。推薦系統的發展受到了諸多因素的影響,其中一種便是新用戶問題。推薦系統算法非常依賴歷史數據,在用戶新注冊互聯網應用之后,系統由于沒有該用戶的相關數據,而無法為新用戶做出準確的推薦,這會大大影響互聯用應用對用戶的黏著性。為了解決新用戶問題,常見的方案有:

(1) 非個性化推薦,隨機推薦或者推薦熱門,這種方法不夠個性化,系統必須累積一定數量的數據才能啟動推薦系統;

(2) 根據用戶注冊信息做出推薦,用戶的注冊信息往往是有限的,這樣的推薦偏向粗粒度;

(3) 主動詢問,該方法通過與用戶交流,主動獲取建立模型需要的相關知識,快速建立準確模型。

推薦系統中,在將推薦產品呈現給用戶時,一方面期望得到用戶的滿意度,另一方面期望能從用戶的操作中學習到用戶的偏好,這正是主動學習所致力的,因此將主動學習結合推薦系統是不謀而合的[6]。國外研究人員目前常用的算法是將貝葉斯理論作為樣本選擇策略,AM(Aspect Model)算法為基準學習器[7]。Jin等針對模型本身不確定性的問題,提出了改進,使得用戶參數向著準確的方向增長[8]。Rasoul Karimi提出一種基于矩陣分解的主動學習算法,選出預估評分最低的樣本供用戶選擇[9]。

2 基于主動學習的Baseline SVD算法

為解決新用戶問題,本文選擇將主動學習策略和推薦算法結合起來的方法,以加快冷啟動速度。主動學習根據樣本選擇策略,從提問池中選擇一個樣本供新用戶標記,并不斷修正模型,直到模型穩定為止,訓練模型的過程如圖1所示,這是一個不斷迭代的過程。主動學習的核心是樣本選擇策略,目前常用的樣本選擇策略有:基于不確定性縮減的算法,基于誤差縮減的算法和基于版本空間縮減的算法。將主動學習策略與其他應用做結合的研究很多,例如基于主動學習的字符識別[10]、文本分類等。

由于不同的學習算法需要不同的主動學習策略,基于AM算法的主動選擇策略并不適用于Baseline SVD算法,并且他們的模型太過復雜,本文選擇Baseline SVD作為基準學習器,提出了一種基于評分改變程度作為樣例選擇的策略。在每次提問后,都會重新訓練,同時給出新的預估評分,預估評分波動較大的物品認為是最不能確定,也是最具信息量的。圖2中,(a)的預估評分在不同輪數之間的評分差變化很大,而(b)的預估評分相對于要穩定很多,相對于后者,不能確定(a)的評分的可能性更大,得到該樣本的標記可以讓模型更快趨于穩定,使用式(6)來衡量這種改變程度的大小:

[j=1cnt-1rj+1u,i'-rju,i'cnt-1] (6)

[i′*=argmaxi'∈I'j=1cnt-1rj+1u,i′-rju,i′cnt-1] (7)

式中:cnt表示模型訓練的總次數;I′表示為標注樣本的集合;[rju,i']表示第j次模型;用戶u對i′的預估評分,在所有未評分的物品,最終選出該值最大的物品供用戶標記,該式的意義是連續兩次模型計算出來的預估評分差的平均值。具體算法流程如圖3所示。

3 實驗分析

實驗使用經典的Movielens作為數據集,采用離線模擬的方式。為了更好地模擬在線用戶的實際情況,將Movielens中的用戶分成兩部分,選擇一部分用戶和其所評價過的電影數據作為初始的訓練集,認為這些用戶已經不是新用戶。剩下來的用戶作為新用戶,并將這一部分用戶評價電影的數據再拆分成兩個部分,每個用戶隨機預留20個電影評分作為最終的測試集,其他部分的電影評分作為提問池。本文假設用戶對每個電影都具有打分的能力,系統每次從提問池中選擇電影樣本,供用戶回答,再將這些被標注好的樣本放入訓練集后,重新訓練模型。初始化時,從提問池中隨機抽取該新用戶的3個樣本放入訓練集中,具體的訓練集和測試集的分布如表2所示。

表2 Movielens訓練集和測試集的分布

經過研究測試,Baseline SVD算法在Movielens數據集中,選擇隱分類數為200時效果較好,其中,學習速率α選擇0.02,正則系數λ選擇0.05。為了反映本文提出的算法性能,選擇以下兩種策略作為比較算法:

(1) 隨機選擇。每次從提問池中隨機選擇一部用戶需要標記的電影。

(2) 選擇熱門。每次從提問池中選擇熱門的電影,熱門產品的定義為,訓練集中被看的次數最多的電影。

為評價本文提出的算法,使用RMSE[11]作為算法的評價指標,本文將最大的迭代次數選為8,8次迭代過后,模型對新用戶的推薦基本趨向平穩。為了更好地反映結果,對每個實驗都進行重復實驗,最后結果取平均值,有:

[RMSE=1cu∈Ui∈I(rui-rui)2] (8)

由圖4可以得出以下結論,選擇熱門產品的方案最差,雖然流行度高的電影普及度最廣,但是其對于個性化的推薦模型建立并不能做出很大的貢獻,其RMSE下降速度最慢。

隨機選擇策略接近于被動學習中,被動累積數據的情況,本文提出的方法在實驗初期,RMSE的數值下降速度最快,明顯加快了冷啟動速度,隨著提問次數增加,RMSE和隨機選擇方法效果接近。本文提出的算法在每次提問時,僅需維護一個記錄累計評分改變的矩陣,為每一個新用戶選擇評分改變最大的物品,算法復雜度較小,也易于理解。

4 結 語

本文提出了一種基于主動學習的推薦算法,以解決推薦系統中新用戶問題。該方法將預估評分的改變程度作為樣本選擇策略,認為預估評分改變較大的樣例是模型最不能確定的,所含信息量較大。實驗證明,該方法確實能有效減緩用戶的冷啟動。但是本文中的實驗是基于用戶總能回答任何問題的假設前提,這在現實中是不成立的,因此,將用戶標記樣本的能力結合樣例選擇策略將是今后的研究重點。

參考文獻

[1] 項亮.推薦系統實踐[M].北京:人民郵電出版社,2012.

[2] 王國霞,劉賀平.個性化推薦系統綜述[J].計算機工程與應用, 2012,48(7):66?76.

[3] Lemire D, Maclachlan A. Slope one predictors for online rating?based collaborative filtering [C]// Proceedings of SIAM Data Mining. Newport Beach, California: SDM, 2005, 5: 1?5.

[4] YEHUDA Koren. Factor in the neighbors: scalable and accurate collaborative filtering [J]. ACM Transactions on Knowledge Discovery from Data, 2010, 4(1): 1?10.

[5] 劉劍波,楊健.基于SVD++與行為分析的社交推薦[J].計算機應用,2013,33(1):82?86.

[6] RUBENS Neil, KAPLAN Dain, SUGIYAMA Masashi. Active learning in recommender systems [M]// Anon. Recommender Systems Handbook. US: Springer, 2011: 736?767.

[7] KARIMI Rasoul, FREUDENTHALER Christoph, NANOPOULOS Alexandros, et al. Active learning for aspect model in recommender systems [C]// Proceedings of 2011 IEEE Symposium on Computational Intelligence and Data Mining (CIDM). [S.l.]: IEEE, 2011:162?167.

[8] JIN R, SI L. A bayesian approach toward active learning for collaborative filtering [C]// Proceedings of the 20th Conference on Uncertainty in Artificial Intelligence. [S.l.]: AUAI Press, 2004: 278?285.

[9] KARIMI Rasoul, FREUDENTHALER Christoph, NANOPOULOS Alexandros, et al. Non?myopic active learning for recommender systems based on matrix factorization [C]// Proceedings of 2011 IEEE International Conference on Information Reuse and Integration. [S.l.]: IEEE, 2011: 299?303.

[10] 孟凡棟.基于主動學習SVM的字符識別方法研究[D].南京:南京理工大學,2008.

[11] 劉建國,周濤,郭強,等.個性化推薦系統評價方法綜述[J].復雜系統與復雜性科學,2009(3):1?10.

猜你喜歡
主動學習
淺談《住宅空間設計專題》的教學改革
幼兒教育中實施素質教育的研究
成才之路(2016年36期)2016-12-12 14:17:24
小組合作學習在小學音樂課堂教學中的運用
如何在美工活動中引導幼兒主動學習
促進小學生主動學習
打造快樂體育課堂引導主動體育學習
淺談音樂課堂中的教與學做到合一
東方教育(2016年16期)2016-11-25 03:06:31
發揮家庭小實驗的功能 提高學生的實驗能力
高中生物教學中學生主動學習策略研究
人間(2016年28期)2016-11-10 22:12:11
數字電路課程的翻轉課堂教學及調研
計算機教育(2016年7期)2016-11-10 08:44:58
主站蜘蛛池模板: 日韩欧美国产精品| 日本91视频| 日本三级精品| 欧美日韩第二页| 狠狠色狠狠色综合久久第一次| 亚洲三级成人| 国产精品毛片一区视频播| 国产一区成人| 婷婷色狠狠干| 国产精品欧美日本韩免费一区二区三区不卡 | 精品国产香蕉在线播出| 狠狠色香婷婷久久亚洲精品| 日韩AV无码免费一二三区| 又大又硬又爽免费视频| 粉嫩国产白浆在线观看| 玖玖免费视频在线观看| 久久香蕉国产线看观看精品蕉| 伊人激情综合网| 色婷婷国产精品视频| 91久久青青草原精品国产| 国产欧美高清| 在线欧美a| 综合五月天网| 99视频在线精品免费观看6| 亚洲精品国产自在现线最新| 91精品啪在线观看国产| 久久99精品久久久久纯品| 久久91精品牛牛| 亚洲无码免费黄色网址| 国产精品视频a| 午夜国产精品视频| 精品一区二区三区波多野结衣| 国产成人夜色91| 在线亚洲精品自拍| 国产精品亚欧美一区二区| 国产精品19p| 国产精品内射视频| 国产一区成人| 欧美福利在线播放| 香蕉久久永久视频| 热99re99首页精品亚洲五月天| 免费国产黄线在线观看| julia中文字幕久久亚洲| 女人爽到高潮免费视频大全| 正在播放久久| 亚洲天堂自拍| 成人精品亚洲| 免费在线一区| 亚洲娇小与黑人巨大交| 亚洲国产精品无码久久一线| 91九色最新地址| 国产人人乐人人爱| 亚洲91在线精品| 无码电影在线观看| 国产精品视频久| 欧美日韩午夜| 99热亚洲精品6码| igao国产精品| 99久久99这里只有免费的精品| 三级视频中文字幕| 69av免费视频| 啪啪国产视频| 五月丁香在线视频| 久久国产黑丝袜视频| 久久精品无码专区免费| 国内精自线i品一区202| 国产99在线| 丁香综合在线| 国产资源站| 狠狠做深爱婷婷久久一区| 一级不卡毛片| 国产一区亚洲一区| 婷婷亚洲视频| 国产精品私拍在线爆乳| 九色视频一区| a级毛片免费在线观看| 久久久四虎成人永久免费网站| 国产无码性爱一区二区三区| 99人体免费视频| 91九色国产porny| 国产精品夜夜嗨视频免费视频| 国产人前露出系列视频|