999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于迭代SVD的電影推薦算法的研究

2021-07-19 09:37:16武文碩左安
電腦知識與技術(shù) 2021年15期

武文碩 左安

摘要:現(xiàn)有的電影推薦算法中,協(xié)同過濾算法是最常使用、操作最簡單方便的算法,但傳統(tǒng)的協(xié)同過濾算法存在評分矩陣稀疏、推薦精度低等問題。針對這些問題,提出了矩陣填充策略,根據(jù)矩陣填充技術(shù)的優(yōu)缺點,選擇了幾種填充稀疏矩陣的方法,并且利用迭代SVD算法得到了電影推薦的局部最優(yōu)解,并利用均方根誤差(RMSE)對結(jié)果進(jìn)行了評價,利用R軟件對電影評分?jǐn)?shù)據(jù)集進(jìn)行處理,實驗結(jié)果表明,與傳統(tǒng)的協(xié)同過濾推薦算法相比,迭代SVD算法能有效地提高推薦的準(zhǔn)確性,更加準(zhǔn)確地給用戶提供想看的電影。

關(guān)鍵詞:協(xié)同過濾;矩陣填充;稀疏矩陣;電影推薦

中圖分類號:TP391.3? ? ? ? 文獻(xiàn)標(biāo)識碼:A

文章編號:1009-3044(2021)15-0001-03

Abstract: Among the existing film recommendation algorithms, collaborative filtering algorithm is the most commonly used and easy to operate algorithm, but the traditional collaborative filtering algorithm has the problems of sparse rating matrix and low recommendation accuracy. According to the advantages and disadvantages of matrix filling technology, several methods of filling sparse matrix are selected. The local optimal solution of movie recommendation is obtained by using iterative SVD algorithm, and the results are evaluated by root mean square error (RMSE). Finally, R software is used to process the movie rating data set. The experimental results show that the proposed method is more effective than the traditional method Compared with the collaborative filtering recommendation algorithm based on SVD, the iterative SVD algorithm can effectively improve the accuracy of recommendation and provide users with more accurate movies they want to see.

Keywords: collaborative filtering; matrix filling; sparse matrix; movie recommendation

1引言

隨著互聯(lián)網(wǎng)科技的迅速發(fā)展,我們現(xiàn)在進(jìn)入信息時代,信息量呈現(xiàn)爆炸式地增長,人們從網(wǎng)上搜到的數(shù)據(jù)越來越多,相比之下,有用的數(shù)據(jù)量少之又少。為了幫助人們從紛繁復(fù)雜的信息中,找到自己需要的內(nèi)容,個性化推薦系統(tǒng)應(yīng)運(yùn)而生,本文介紹了電影推薦算法以及改進(jìn)算法,通過對大量的數(shù)據(jù)進(jìn)行處理分析、數(shù)據(jù)可視化,得出結(jié)論是通過SVD處理后,推薦精度能夠得到進(jìn)一步的提升,有效克服了傳統(tǒng)推薦算法的缺點。

2研究方法

2.1協(xié)同過濾算法

協(xié)同過濾算法是一種較為著名和常用的推薦算法,它是通過用戶的歷史搜索記錄和瀏覽記錄等信息,對這些信息進(jìn)行數(shù)據(jù)挖掘,與相似的客戶群體和物品進(jìn)行對比,發(fā)現(xiàn)客戶的喜好,據(jù)此預(yù)測用戶可能喜好的產(chǎn)品進(jìn)行推薦。也就是常見的“猜你喜歡”,和“購買了該商品的人也喜歡”等功能。它的主要實現(xiàn)由:

1) 根據(jù)和你有共同喜好的人給你推薦;

2) 根據(jù)你喜歡的物品給你推薦相似物品;

3) 根據(jù)以上條件綜合推薦。

因此可以得出常用的協(xié)同過濾算法分為兩種,基于用戶的協(xié)同過濾算法,以及基于項目的協(xié)同過濾算法。特點可以概括為“物以類聚,人以群分”,并據(jù)此進(jìn)行預(yù)測和推薦。本文將使用基于用戶的協(xié)同過濾算法(UBCF) 、基于項目的協(xié)同過濾算法(IBCF) 、基于SVD的協(xié)同過濾算法,這三種基礎(chǔ)的協(xié)同過濾算法作為參照組進(jìn)行比較。協(xié)同過濾推薦算法的基本原理是通過“用戶-項目“評分矩陣Z計算相似度,評分矩陣Z為m×n維矩陣,m為用戶的數(shù)目,n為項目的數(shù)目,每一個元素[ru,i]表示用戶u對項目i的評分。該評分矩陣一般是具有強(qiáng)“稀疏性”(sparsity)的大矩陣。圖1空白位置對應(yīng)矩陣的數(shù)據(jù)缺失。

傳統(tǒng)的協(xié)同過濾推薦算法通常有以下三個缺點:稀疏性,從上圖我們可以看出來空白的地方非常大,表明數(shù)據(jù)矩陣非常稀疏,形成目標(biāo)用戶的最近用戶集時,往往會造成信息缺失,從而導(dǎo)致推薦效果降低;冷啟動性,冷啟動又叫作第一評價問題,或新物品問題,當(dāng)新項目和新用戶首次出現(xiàn)的時候,評價和反饋的信息都比較少,使得推薦的效果差強(qiáng)人意,一定程度上看成是稀疏矩陣的極端情況;最后就是可擴(kuò)展性,面對每日新增的用戶和增多的電影數(shù)量,數(shù)據(jù)量急劇增長,算法面對不斷擴(kuò)大的數(shù)據(jù)規(guī)模,推薦準(zhǔn)確性下降,即可擴(kuò)展性面臨挑戰(zhàn)。

針對以上推薦算法的不足之處,本文提出迭代奇異值分解(Singular Value Decomposition,SVD)來解決這些問題。

2.2迭代SVD算法

具體來說,對于[Z:m×n], 令[Ω?{1,…,m}×{1,…,n}]表示[Z]中觀測到的元素的索引的集合,給定這些觀測值,一個自然的思路是可對應(yīng)尋找[Z]的最低秩矩陣[Z],即[Z=argminM∈Rm×nrank(M),其約束為mij=zij,(i,j)∈Ω]。

但含缺失數(shù)據(jù)的最低秩問題計算非常困難,一般無法求解。因此,更常見的求解方法是允許所得到的[M]矩陣與觀測值之間有一定誤差,即

[Zr=argminrank(M)≤r(i,j)∈Ω(zij-mij)2]

該問題是非凸優(yōu)化,通常得不到最優(yōu)解,但可以采用迭代算法來得到局部最優(yōu)解。

步驟一:通過對[Z]進(jìn)行隨機(jī)填充,初始化[Z];

步驟二:通過計算[Z]的r秩SVD求解[M]:

[Z=UDVT, M←UrDVT;]

步驟三:基于[M]對[Z]的缺失部分進(jìn)行填充:

[zij←mij,(i,j)?Ω;]

步驟四:重復(fù)第2-3步,直至算法收斂。

2.3預(yù)測準(zhǔn)確度

預(yù)測準(zhǔn)確度是用來評價電影推薦算法的預(yù)測評分與用戶的實際評分是否接近的指標(biāo),在推薦系統(tǒng)中,預(yù)測準(zhǔn)確度是很重要的參數(shù),通過準(zhǔn)確度的計算,我們可以知道推薦算法的有效程度。常用的預(yù)測評分準(zhǔn)確度標(biāo)準(zhǔn)有:平均絕對誤差(MAE) 、均方根誤差(RMSE) ,定義如下:

[MAE=i=1N|ri-ri|N]? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)

[RMSE=i=1N(ri-ri)^2N]? ? ? ? ? ? ? ? ? ? ? ? ? ?(2)

其中[ri]表示的是用戶u對于項目i的真實評分,[ri]表示的是預(yù)測評分,N表示測試集的大小。從公式可以看出RMSE更復(fù)雜且偏向更高的誤差,而且用RMSE來定義損失函數(shù)是平滑可微的,因此它是許多模型的默認(rèn)度量標(biāo)準(zhǔn)。我們本文選擇RMSE作為分析結(jié)果的標(biāo)準(zhǔn),為了說明樣本的離散程度,RMSE的數(shù)值越小代表準(zhǔn)確度越高。

3實驗分析

3.1實驗數(shù)據(jù)集

針對此次電影推薦算法的研究,選用的數(shù)據(jù)集是Movielens電影評分?jǐn)?shù)據(jù)集中最小的一組數(shù)據(jù)MovieLenslastest small是最小的一組數(shù)據(jù),此數(shù)據(jù)集是由美國明尼蘇達(dá)大學(xué)Grouplens項目從Movielens站點整理而來,廣泛應(yīng)用于個性化推薦算法研究中,數(shù)據(jù)集包括600余名用戶對9000余部電影1,000,000余個評分(1~5),評分值越高表示越滿意。原始數(shù)據(jù)可從grouplens.org/datasets/movielens下載, 根據(jù)包含的數(shù)據(jù)量與評分年份的不同, 提供了不同的版本。

3.2實驗設(shè)計和結(jié)果分析

第一步利用R語言自帶的Recommender包對Movielenslastest small數(shù)據(jù)集進(jìn)行處理,得到RMSE的值,這是傳統(tǒng)協(xié)同過濾算法得到的結(jié)果,作為標(biāo)準(zhǔn)組進(jìn)行對照,結(jié)果如下表1:

從結(jié)果我們可以看出,svd算法的RMSE值最小,在基于用戶,基于項目和基于svd的協(xié)同算法中,基于svd的方法更加有效一點,具有更好的推薦效果。

第二步對傳統(tǒng)協(xié)同算法進(jìn)行改進(jìn),將數(shù)據(jù)集隨機(jī)抽取75%左右的評分為訓(xùn)練集,25%為測試集,利用上述迭代SVD算法,在Movielens數(shù)據(jù)集上進(jìn)行評分填充,選取秩r為2,3,4,5,10,50,100, 分別報告評分填充在訓(xùn)練集和測試集上的RMSE, 對訓(xùn)練集的數(shù)據(jù)矩陣行和列進(jìn)行中心化,對中心化后的訓(xùn)練集數(shù)據(jù)矩陣也求解RMSE,得到的結(jié)果如下表2所示:

實驗數(shù)據(jù)表明,隨著秩r逐漸增大,RMSE逐漸減小,這表明當(dāng)r越大,推薦精度越準(zhǔn)確,訓(xùn)練集和測試集的數(shù)據(jù)量不同;從圖中可以清晰地看出,測試集的RMSE明顯小于訓(xùn)練集,說明數(shù)據(jù)量的大小會影響推薦算法的精確度,并不是數(shù)據(jù)越多評分準(zhǔn)確率就會高,而是數(shù)據(jù)量少一點,推薦就會越準(zhǔn)確因此在實際過程中可以適當(dāng)減少數(shù)據(jù)量,這也會相應(yīng)減少建立模型所用的時間;其次就是對訓(xùn)練集數(shù)據(jù)矩陣行和列進(jìn)行中心化后,能夠明顯提高推薦算法的準(zhǔn)確性,隨著秩r的增加,中心化前后的數(shù)據(jù)矩陣推薦精度相差不大。由以上可知此算法的推薦效果較為有效。

第三步是利用R包softImpute對訓(xùn)練集和測試集進(jìn)行矩陣填充時得到的RMSE如表3所示:

從這種數(shù)據(jù)填充方法的結(jié)果來看,RMSE的值要比傳統(tǒng)推薦方法的小一點,但是和第二步得到的結(jié)果相比大得多,所以使用R語言自帶的包對矩陣進(jìn)行填充能夠解決矩陣稀疏性的問題,提高推薦的準(zhǔn)確性,但是相比之下還是本文提出的迭代SVD算法優(yōu)化效果更加顯著。

4論文總結(jié)

本文介紹了幾個不同的電影推薦算法,主要是基于矩陣填充的迭代SVD協(xié)同過濾算法,通過對數(shù)據(jù)矩陣采用不同的填充方式,解決了數(shù)據(jù)的稀疏性問題,然后比較均方根誤差(RMSE)的結(jié)果。實驗結(jié)果表明,對數(shù)據(jù)矩陣進(jìn)行矩陣填充之后能夠提高評分的準(zhǔn)確度,其中對信息矩陣的行和列進(jìn)行中心化最為準(zhǔn)確。然而,我們判斷的方法也有一定的局限性,首先評判標(biāo)準(zhǔn)過于單一,數(shù)據(jù)的可信度可能不夠,此外影響推薦算法準(zhǔn)確度的因素還有很多,比如虛假評分和用戶興趣隨時間改變的影響,會對我們的實驗結(jié)果有不利的影響。

在實驗過程中也遇到了一些問題,由于填充的數(shù)據(jù)量有些大,給內(nèi)存和運(yùn)算帶來了一定的挑戰(zhàn),在進(jìn)行迭代循環(huán)所耗費的時間也是比較長的,這也是下一步需要解決的問題。

參考文獻(xiàn):

[1] 徐吉.基于協(xié)同過濾和矩陣分解的推薦系統(tǒng)研究與應(yīng)用[D].寧波:寧波大學(xué),2019.

[2] 吳濤.推薦系統(tǒng)中推薦算法研究及其應(yīng)用[D].北京:北京交通大學(xué),2019.

[3] Mazumder R,Hastie T,Tibshirani R.Spectral regularization algorithms for learning large incomplete matrices[J].Journal of Machine Learning Research,2010,11:2287-2322.

[4] Sarwar B,Karypis G,Konstan J,et al.Application of dimensionality reduction in recommender system - A case study[R].Defense Technical Information Center,2000.

[5] 袁泉,成振華,江洋.基于知識圖譜和協(xié)同過濾的電影推薦算法研究[J].計算機(jī)工程與科學(xué),2020,42(4):714-721.

[6] 王祥德,雷玉霞,閆昱姝.基于矩陣填充的SVD協(xié)同過濾算法研究[J].微型機(jī)與應(yīng)用,2017,36(19):55-57,61.

[7] 吳志鵬.基于矩陣分解的推薦算法研究[D].北京:北京郵電大學(xué),2019.

[8] 彭石,周志彬,王國軍.基于評分矩陣預(yù)填充的協(xié)同過濾算法[J].計算機(jī)工程,2013,39(1):175-178,182.

[9] 馬宏偉,張光衛(wèi),李鵬.協(xié)同過濾推薦算法綜述[J].小型微型計算機(jī)系統(tǒng),2009,30(7):1282-1288.

[10] 韓亞楠,曹菡,劉亮亮.基于評分矩陣填充與用戶興趣的協(xié)同過濾推薦算法[J].計算機(jī)工程,2016,42(1):36-40.

[11] 聶常超.一種基于矩陣分解的電影推薦算法[J].電子設(shè)計工程,2016,24(19):73-75.

[12] 郭珈辰.電影推薦算法的研究與實現(xiàn)[D].長春:吉林大學(xué),2015.

[13] 陳垠芬.基于矩陣填充與圖嵌入表示的個性化推薦算法研究[D].南昌:江西師范大學(xué),2019.

[14] 趙軍,王紅,殷方勇.一種面向稀疏和虛假評分的協(xié)同推薦方法[J].小型微型計算機(jī)系統(tǒng),2017,38(3):472-477.

[15] 陳塏冰,黃榮,吳明芬,等.一種基于電影評分預(yù)測的協(xié)同過濾[J].哈爾濱師范大學(xué)自然科學(xué)學(xué)報,2018,34(6):1-5,11.

[16] 黃麗.基于SVD的協(xié)同過濾推薦算法研究[J].電腦知識與技術(shù),2019,15(21):9-10.

[17] 張玉葉.基于協(xié)同過濾的電影推薦系統(tǒng)的設(shè)計與實現(xiàn)[J].電腦知識與技術(shù),2019,15(6):70-73.

【通聯(lián)編輯:王力】

主站蜘蛛池模板: 亚洲色中色| 成人国产精品网站在线看| 中文字幕亚洲无线码一区女同| 欧美三级视频网站| 嫩草国产在线| 五月激情婷婷综合| 午夜视频在线观看免费网站 | 超碰91免费人妻| 日本欧美精品| 亚洲av无码成人专区| 免费观看无遮挡www的小视频| 国产最爽的乱婬视频国语对白| 91福利一区二区三区| 国模私拍一区二区| 毛片基地视频| 狠狠综合久久久久综| 日韩无码白| 一级香蕉视频在线观看| 亚洲永久精品ww47国产| 在线另类稀缺国产呦| 一区二区日韩国产精久久| 免费国产小视频在线观看| 午夜综合网| 国产一区亚洲一区| 国产精品3p视频| 欧美成人看片一区二区三区 | 婷婷丁香在线观看| 亚洲码在线中文在线观看| 人妻中文字幕无码久久一区| 国产色婷婷视频在线观看| 91福利免费| 日韩在线欧美在线| 国产精品手机视频一区二区| 精品福利视频网| 91青青视频| 欧美天堂久久| 色悠久久综合| 伊人婷婷色香五月综合缴缴情| 精品人妻系列无码专区久久| 欧美三级不卡在线观看视频| 国产精品护士| 欧洲日本亚洲中文字幕| 精品人妻无码中字系列| 91精品国产福利| 国产无码网站在线观看| 国产精品xxx| 欧美精品成人一区二区视频一| 成人av手机在线观看| 国内丰满少妇猛烈精品播| 99视频全部免费| 欧美精品高清| 国产第一页屁屁影院| 九色综合视频网| 亚洲婷婷丁香| 国模私拍一区二区三区| 欧美中出一区二区| 国产日韩久久久久无码精品| 婷婷色狠狠干| a级高清毛片| 强奷白丝美女在线观看 | www.国产福利| 亚洲天堂777| 污污网站在线观看| 青青青草国产| 免费Aⅴ片在线观看蜜芽Tⅴ| 伊人五月丁香综合AⅤ| 99在线观看视频免费| 色偷偷男人的天堂亚洲av| 四虎精品国产永久在线观看| 超级碰免费视频91| 成年人免费国产视频| 亚洲色婷婷一区二区| 欧美成人午夜在线全部免费| 日韩专区第一页| 国产亚洲精久久久久久久91| 九九热精品视频在线| 精品国产欧美精品v| 国产成人三级| 中文字幕 欧美日韩| 日本成人精品视频| 激情综合婷婷丁香五月尤物 | 国产无人区一区二区三区|