999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于迭代SVD的電影推薦算法的研究

2021-07-19 09:37:16武文碩左安
電腦知識與技術 2021年15期

武文碩 左安

摘要:現有的電影推薦算法中,協同過濾算法是最常使用、操作最簡單方便的算法,但傳統的協同過濾算法存在評分矩陣稀疏、推薦精度低等問題。針對這些問題,提出了矩陣填充策略,根據矩陣填充技術的優缺點,選擇了幾種填充稀疏矩陣的方法,并且利用迭代SVD算法得到了電影推薦的局部最優解,并利用均方根誤差(RMSE)對結果進行了評價,利用R軟件對電影評分數據集進行處理,實驗結果表明,與傳統的協同過濾推薦算法相比,迭代SVD算法能有效地提高推薦的準確性,更加準確地給用戶提供想看的電影。

關鍵詞:協同過濾;矩陣填充;稀疏矩陣;電影推薦

中圖分類號:TP391.3? ? ? ? 文獻標識碼:A

文章編號:1009-3044(2021)15-0001-03

Abstract: Among the existing film recommendation algorithms, collaborative filtering algorithm is the most commonly used and easy to operate algorithm, but the traditional collaborative filtering algorithm has the problems of sparse rating matrix and low recommendation accuracy. According to the advantages and disadvantages of matrix filling technology, several methods of filling sparse matrix are selected. The local optimal solution of movie recommendation is obtained by using iterative SVD algorithm, and the results are evaluated by root mean square error (RMSE). Finally, R software is used to process the movie rating data set. The experimental results show that the proposed method is more effective than the traditional method Compared with the collaborative filtering recommendation algorithm based on SVD, the iterative SVD algorithm can effectively improve the accuracy of recommendation and provide users with more accurate movies they want to see.

Keywords: collaborative filtering; matrix filling; sparse matrix; movie recommendation

1引言

隨著互聯網科技的迅速發展,我們現在進入信息時代,信息量呈現爆炸式地增長,人們從網上搜到的數據越來越多,相比之下,有用的數據量少之又少。為了幫助人們從紛繁復雜的信息中,找到自己需要的內容,個性化推薦系統應運而生,本文介紹了電影推薦算法以及改進算法,通過對大量的數據進行處理分析、數據可視化,得出結論是通過SVD處理后,推薦精度能夠得到進一步的提升,有效克服了傳統推薦算法的缺點。

2研究方法

2.1協同過濾算法

協同過濾算法是一種較為著名和常用的推薦算法,它是通過用戶的歷史搜索記錄和瀏覽記錄等信息,對這些信息進行數據挖掘,與相似的客戶群體和物品進行對比,發現客戶的喜好,據此預測用戶可能喜好的產品進行推薦。也就是常見的“猜你喜歡”,和“購買了該商品的人也喜歡”等功能。它的主要實現由:

1) 根據和你有共同喜好的人給你推薦;

2) 根據你喜歡的物品給你推薦相似物品;

3) 根據以上條件綜合推薦。

因此可以得出常用的協同過濾算法分為兩種,基于用戶的協同過濾算法,以及基于項目的協同過濾算法。特點可以概括為“物以類聚,人以群分”,并據此進行預測和推薦。本文將使用基于用戶的協同過濾算法(UBCF) 、基于項目的協同過濾算法(IBCF) 、基于SVD的協同過濾算法,這三種基礎的協同過濾算法作為參照組進行比較。協同過濾推薦算法的基本原理是通過“用戶-項目“評分矩陣Z計算相似度,評分矩陣Z為m×n維矩陣,m為用戶的數目,n為項目的數目,每一個元素[ru,i]表示用戶u對項目i的評分。該評分矩陣一般是具有強“稀疏性”(sparsity)的大矩陣。圖1空白位置對應矩陣的數據缺失。

傳統的協同過濾推薦算法通常有以下三個缺點:稀疏性,從上圖我們可以看出來空白的地方非常大,表明數據矩陣非常稀疏,形成目標用戶的最近用戶集時,往往會造成信息缺失,從而導致推薦效果降低;冷啟動性,冷啟動又叫作第一評價問題,或新物品問題,當新項目和新用戶首次出現的時候,評價和反饋的信息都比較少,使得推薦的效果差強人意,一定程度上看成是稀疏矩陣的極端情況;最后就是可擴展性,面對每日新增的用戶和增多的電影數量,數據量急劇增長,算法面對不斷擴大的數據規模,推薦準確性下降,即可擴展性面臨挑戰。

針對以上推薦算法的不足之處,本文提出迭代奇異值分解(Singular Value Decomposition,SVD)來解決這些問題。

2.2迭代SVD算法

具體來說,對于[Z:m×n], 令[Ω?{1,…,m}×{1,…,n}]表示[Z]中觀測到的元素的索引的集合,給定這些觀測值,一個自然的思路是可對應尋找[Z]的最低秩矩陣[Z],即[Z=argminM∈Rm×nrank(M),其約束為mij=zij,(i,j)∈Ω]。

但含缺失數據的最低秩問題計算非常困難,一般無法求解。因此,更常見的求解方法是允許所得到的[M]矩陣與觀測值之間有一定誤差,即

[Zr=argminrank(M)≤r(i,j)∈Ω(zij-mij)2]

該問題是非凸優化,通常得不到最優解,但可以采用迭代算法來得到局部最優解。

步驟一:通過對[Z]進行隨機填充,初始化[Z];

步驟二:通過計算[Z]的r秩SVD求解[M]:

[Z=UDVT, M←UrDVT;]

步驟三:基于[M]對[Z]的缺失部分進行填充:

[zij←mij,(i,j)?Ω;]

步驟四:重復第2-3步,直至算法收斂。

2.3預測準確度

預測準確度是用來評價電影推薦算法的預測評分與用戶的實際評分是否接近的指標,在推薦系統中,預測準確度是很重要的參數,通過準確度的計算,我們可以知道推薦算法的有效程度。常用的預測評分準確度標準有:平均絕對誤差(MAE) 、均方根誤差(RMSE) ,定義如下:

[MAE=i=1N|ri-ri|N]? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)

[RMSE=i=1N(ri-ri)^2N]? ? ? ? ? ? ? ? ? ? ? ? ? ?(2)

其中[ri]表示的是用戶u對于項目i的真實評分,[ri]表示的是預測評分,N表示測試集的大小。從公式可以看出RMSE更復雜且偏向更高的誤差,而且用RMSE來定義損失函數是平滑可微的,因此它是許多模型的默認度量標準。我們本文選擇RMSE作為分析結果的標準,為了說明樣本的離散程度,RMSE的數值越小代表準確度越高。

3實驗分析

3.1實驗數據集

針對此次電影推薦算法的研究,選用的數據集是Movielens電影評分數據集中最小的一組數據MovieLenslastest small是最小的一組數據,此數據集是由美國明尼蘇達大學Grouplens項目從Movielens站點整理而來,廣泛應用于個性化推薦算法研究中,數據集包括600余名用戶對9000余部電影1,000,000余個評分(1~5),評分值越高表示越滿意。原始數據可從grouplens.org/datasets/movielens下載, 根據包含的數據量與評分年份的不同, 提供了不同的版本。

3.2實驗設計和結果分析

第一步利用R語言自帶的Recommender包對Movielenslastest small數據集進行處理,得到RMSE的值,這是傳統協同過濾算法得到的結果,作為標準組進行對照,結果如下表1:

從結果我們可以看出,svd算法的RMSE值最小,在基于用戶,基于項目和基于svd的協同算法中,基于svd的方法更加有效一點,具有更好的推薦效果。

第二步對傳統協同算法進行改進,將數據集隨機抽取75%左右的評分為訓練集,25%為測試集,利用上述迭代SVD算法,在Movielens數據集上進行評分填充,選取秩r為2,3,4,5,10,50,100, 分別報告評分填充在訓練集和測試集上的RMSE, 對訓練集的數據矩陣行和列進行中心化,對中心化后的訓練集數據矩陣也求解RMSE,得到的結果如下表2所示:

實驗數據表明,隨著秩r逐漸增大,RMSE逐漸減小,這表明當r越大,推薦精度越準確,訓練集和測試集的數據量不同;從圖中可以清晰地看出,測試集的RMSE明顯小于訓練集,說明數據量的大小會影響推薦算法的精確度,并不是數據越多評分準確率就會高,而是數據量少一點,推薦就會越準確因此在實際過程中可以適當減少數據量,這也會相應減少建立模型所用的時間;其次就是對訓練集數據矩陣行和列進行中心化后,能夠明顯提高推薦算法的準確性,隨著秩r的增加,中心化前后的數據矩陣推薦精度相差不大。由以上可知此算法的推薦效果較為有效。

第三步是利用R包softImpute對訓練集和測試集進行矩陣填充時得到的RMSE如表3所示:

從這種數據填充方法的結果來看,RMSE的值要比傳統推薦方法的小一點,但是和第二步得到的結果相比大得多,所以使用R語言自帶的包對矩陣進行填充能夠解決矩陣稀疏性的問題,提高推薦的準確性,但是相比之下還是本文提出的迭代SVD算法優化效果更加顯著。

4論文總結

本文介紹了幾個不同的電影推薦算法,主要是基于矩陣填充的迭代SVD協同過濾算法,通過對數據矩陣采用不同的填充方式,解決了數據的稀疏性問題,然后比較均方根誤差(RMSE)的結果。實驗結果表明,對數據矩陣進行矩陣填充之后能夠提高評分的準確度,其中對信息矩陣的行和列進行中心化最為準確。然而,我們判斷的方法也有一定的局限性,首先評判標準過于單一,數據的可信度可能不夠,此外影響推薦算法準確度的因素還有很多,比如虛假評分和用戶興趣隨時間改變的影響,會對我們的實驗結果有不利的影響。

在實驗過程中也遇到了一些問題,由于填充的數據量有些大,給內存和運算帶來了一定的挑戰,在進行迭代循環所耗費的時間也是比較長的,這也是下一步需要解決的問題。

參考文獻:

[1] 徐吉.基于協同過濾和矩陣分解的推薦系統研究與應用[D].寧波:寧波大學,2019.

[2] 吳濤.推薦系統中推薦算法研究及其應用[D].北京:北京交通大學,2019.

[3] Mazumder R,Hastie T,Tibshirani R.Spectral regularization algorithms for learning large incomplete matrices[J].Journal of Machine Learning Research,2010,11:2287-2322.

[4] Sarwar B,Karypis G,Konstan J,et al.Application of dimensionality reduction in recommender system - A case study[R].Defense Technical Information Center,2000.

[5] 袁泉,成振華,江洋.基于知識圖譜和協同過濾的電影推薦算法研究[J].計算機工程與科學,2020,42(4):714-721.

[6] 王祥德,雷玉霞,閆昱姝.基于矩陣填充的SVD協同過濾算法研究[J].微型機與應用,2017,36(19):55-57,61.

[7] 吳志鵬.基于矩陣分解的推薦算法研究[D].北京:北京郵電大學,2019.

[8] 彭石,周志彬,王國軍.基于評分矩陣預填充的協同過濾算法[J].計算機工程,2013,39(1):175-178,182.

[9] 馬宏偉,張光衛,李鵬.協同過濾推薦算法綜述[J].小型微型計算機系統,2009,30(7):1282-1288.

[10] 韓亞楠,曹菡,劉亮亮.基于評分矩陣填充與用戶興趣的協同過濾推薦算法[J].計算機工程,2016,42(1):36-40.

[11] 聶常超.一種基于矩陣分解的電影推薦算法[J].電子設計工程,2016,24(19):73-75.

[12] 郭珈辰.電影推薦算法的研究與實現[D].長春:吉林大學,2015.

[13] 陳垠芬.基于矩陣填充與圖嵌入表示的個性化推薦算法研究[D].南昌:江西師范大學,2019.

[14] 趙軍,王紅,殷方勇.一種面向稀疏和虛假評分的協同推薦方法[J].小型微型計算機系統,2017,38(3):472-477.

[15] 陳塏冰,黃榮,吳明芬,等.一種基于電影評分預測的協同過濾[J].哈爾濱師范大學自然科學學報,2018,34(6):1-5,11.

[16] 黃麗.基于SVD的協同過濾推薦算法研究[J].電腦知識與技術,2019,15(21):9-10.

[17] 張玉葉.基于協同過濾的電影推薦系統的設計與實現[J].電腦知識與技術,2019,15(6):70-73.

【通聯編輯:王力】

主站蜘蛛池模板: 中国精品自拍| 免费 国产 无码久久久| 亚洲免费黄色网| 一级全黄毛片| 97se亚洲| 国产尹人香蕉综合在线电影| 2021国产精品自拍| 国产成人盗摄精品| 色国产视频| 中文字幕永久在线看| 国产h视频免费观看| 九九香蕉视频| 国产精品亚洲αv天堂无码| 国产欧美日韩综合在线第一| 91亚洲精选| 日本三区视频| 日本欧美午夜| 99热这里只有精品国产99| 91免费国产高清观看| 国产成熟女人性满足视频| 国产十八禁在线观看免费| 日本欧美一二三区色视频| 99久久婷婷国产综合精| 五月婷婷综合网| 波多野结衣亚洲一区| 亚洲第一精品福利| 欧美精品亚洲精品日韩专| 在线观看国产精品一区| 国产性生交xxxxx免费| 欧美精品综合视频一区二区| 这里只有精品在线播放| 欧美A级V片在线观看| 黄色成年视频| 色天天综合久久久久综合片| 丰满人妻一区二区三区视频| av色爱 天堂网| 国产在线视频欧美亚综合| 91青青视频| 亚洲色图欧美在线| 国模沟沟一区二区三区| 国产乱人视频免费观看| 精品一区二区三区视频免费观看| 99热这里只有精品免费国产| 亚洲乱码在线播放| 欧美日一级片| 国产精品 欧美激情 在线播放| 国产精品视频第一专区| 欧美日本在线播放| 亚洲欧美一区二区三区麻豆| 成人va亚洲va欧美天堂| 毛片卡一卡二| 人妻丰满熟妇av五码区| 亚洲精品制服丝袜二区| JIZZ亚洲国产| 国产福利一区视频| 国产亚洲精| 中文字幕久久亚洲一区| 国产成人精品第一区二区| 亚洲—日韩aV在线| 最新国语自产精品视频在| 91麻豆精品国产高清在线| 国产黄在线观看| 亚洲毛片在线看| а∨天堂一区中文字幕| 精品亚洲欧美中文字幕在线看| 成人国产精品视频频| 一本一道波多野结衣一区二区| 国产无套粉嫩白浆| 啪啪永久免费av| 99在线观看视频免费| 一本大道无码日韩精品影视| 国产福利观看| 夜夜操国产| 亚洲精品欧美重口| 免费a级毛片视频| 国产精品七七在线播放| 在线观看无码a∨| 无码国内精品人妻少妇蜜桃视频 | 热99精品视频| 好紧好深好大乳无码中文字幕| 97视频在线观看免费视频| 亚洲天堂网在线播放|