999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Spark平臺ALS模型推薦算法的研究與優(yōu)化

2019-07-08 02:23:41李珍吳青洋
電腦知識與技術(shù) 2019年13期

李珍 吳青洋

摘要:推薦算法是推薦系統(tǒng)的重要組成部分,交替最小二乘算法ALS(Alternating Least Squares)在許多大規(guī)模數(shù)據(jù)處理過程中,經(jīng)常用于計算潛在的因子矩陣分解。對于ALS算法迭代次數(shù)多、收斂時間長的問題,該文提出了一種采用非線性共軛梯度算法NCG(nonlinear conjugate gradient )對ALS算法進(jìn)行改進(jìn),來加快ALS算法的收斂速度,并對該方法進(jìn)行了實驗研究,通過在MovieLens 10M數(shù)據(jù)集上的實驗結(jié)果表明,ALS-NCG模型推薦算法在收斂過程中,比ALS模型推薦算法迭代次數(shù)少,時間消耗少。

關(guān)鍵詞:Spark;最小二乘法;矩陣分解;推薦系統(tǒng);協(xié)同過濾

中圖分類號 ?TP311.52 ? ? ? ?文獻(xiàn)標(biāo)志碼 ?A

文章編號:1009-3044(2019)13-0019-04

Abstract: Recommendation algorithm is an important part of the recommendation system. Many large-scale data processing environments include collaborative filtering models for which the Alternating Least Squares(ALS) algorithm is used to compare latent factor matrix decompositions. To solve the problem that ALS algorithm has too many iterations and too long convergence time, in this paper, we propose an approach to accelerate the convergence of parallel ALS-based optimization methods for collaborative filtering using a nonlinear conjugate gradient(NCG) algorithm wrapper around the ALS iterations. Experimental results on the Movie Lens 10M dataset show that ALS-NCG model recommendation algorithm has less iteration times and less time consuming than ALS model recommendation algorithm in convergence process.

Key words: Spark; alternating least square (ALS); matrix decomposition; recommended system; collaborative filtering

1 背景

推薦系統(tǒng)通過分析用戶行為數(shù)據(jù),為其推薦如電影、音樂、或其他商品,并已成為在線服務(wù)中的重要組成部分。協(xié)同過濾是構(gòu)建推薦系統(tǒng)的一種策略,即通過收集許多用戶的喜好信息來進(jìn)行推薦。協(xié)同過濾方法已用于在線業(yè)務(wù),如亞馬遜[1],Netflix[2]。

基于隱語義模型推薦算法的實質(zhì)是將稀疏的用戶評分矩陣分解為若干個組成部分,用戶物品評分矩陣R中每一項表示用戶對物品的評分,快速求解低維用戶矩陣U和物品矩陣M是十分必要的,并滿足[R≈UTM]。

矩陣分解與奇異值分解(SVD)聯(lián)系緊密,但是SVD不能處理含有缺失值的矩陣。由于[R≈UTM],使R中預(yù)測評分和實際評分之間的平方差最小,是獲取用戶矩陣和物品矩陣的方法之一。通常采用隨機(jī)梯度下降(SGD)或交替最小二乘(ALS)來最小化這種差異[3]。其中,ALS可以處理含有隱式數(shù)據(jù)模型,而且也容易并行化。

盡管ALS推薦算法相對其他推薦算法而言有一定的優(yōu)勢,然而ALS推薦算法收斂過程中迭代次數(shù)多、收斂時間長,很難適用于實時推薦的場景。于是本文提出一種用來計算用戶、物品的矩陣的優(yōu)化后的ALS算法。本文使用非線性共軛梯度算法(NCG)[4]來融合 ALS算法,從而大大加快ALS算法的收斂,本文將這種組合算法稱為ALS-NCG。

本文將在Spark平臺上并行實現(xiàn)優(yōu)化后的ALS算法,其中Spark是一個大型的分布式數(shù)據(jù)處理環(huán)境。在商業(yè)環(huán)境中,Spark已經(jīng)廣泛應(yīng)用于大數(shù)據(jù)分析中。本文在文獻(xiàn)[5-6]提出在Spark平臺上并行實現(xiàn)ALS模型推薦算法的基礎(chǔ)上對ALS模型算法進(jìn)行優(yōu)化。

表3顯示了ALS算法改進(jìn)前后的RMSE對比結(jié)果, 當(dāng)正則化參數(shù)設(shè)置為10時,迭代次數(shù)為10、20、30、40,屬性數(shù)為8、10、12,進(jìn)行比較。圖1是對應(yīng)于表3的統(tǒng)計柱狀圖。由圖1可知ALS-NCG算法對應(yīng)RESE的數(shù)值要比ALS算法對應(yīng)的RMSE的數(shù)值低得多,當(dāng)?shù)螖?shù)為40并且屬性個數(shù)為10時,RMSE值降低到0.870414,RMSE值越小,表明預(yù)測的精度越高,可以看出,利用非線性共軛梯度算法融合ALS算法,不但可以加快ALS算法的收斂速度,還能使模型的評價指標(biāo)更好。

7 總結(jié)

本文介紹了ALS模型推薦算法和Spark平臺的概況,對于ALS模型推薦算法在收斂過程中,收斂時間長、迭代次數(shù)多的問題,本文采用非線性共軛梯度算法融合ALS算法,并在Spark平臺上將優(yōu)化后的ALS-NCG算法并行化實現(xiàn)了。實驗結(jié)果表明ALS-NCG算法效果顯著,有效地加快了ALS算法的收斂,提高了ALS模型推薦算法在海量數(shù)據(jù)下的執(zhí)行效率,并降低了評測指標(biāo)RMSE值。但是也存在不足之處,本文提出的ALS-NCG 推薦算法是在離線環(huán)境下進(jìn)行的,使用GroupLens提供的電影相關(guān)的數(shù)據(jù),本文進(jìn)一步的工作應(yīng)該包括:在線上環(huán)境進(jìn)行實驗和研究其他類型的數(shù)據(jù)。

參考文獻(xiàn):

[1] Linden G, Smith B, York J. Amazon. com recommendations: Item-to-item collaborative filtering[J]. 2003, 7(1): 76-80.

[2] Bell M R, Koren Y. Lessons from the Netflix prize challenge[J]. SIGKDD Explor. Newsl, 2007, 9(2): 75-79.

[3] Koren Y, Bell R, Volinsky C. Matrix factorization techniques for recommender systems[J]. Computer, 2009, 42(8): 30-37.

[4] Liu Z, Wang Y, Yang S, et al. Differential evolution with a two-stage optimization mechanism for numerical optimization[C]// IEEE Congress on Evolutionary Computation. IEEE, 2016.

[5] Zhou Y, Wilkinson D, Schreiber R, et al. Large-scale parallel collaborative filtering for the netflix prize[C]// Algorithmic Aspects in Information and Management, International Conference, Aaim 2008, Shanghai, China, 2008(6): 23-25, Proceedings. DBLP, 2008: 337-348.

[6] Koren Y, Bell R, Volinsky C. Matrix factorization techniques for recommender systems[J]. Computer, 2009, 42(8): 30-37.

[7] PILASZY I, ZIBRICZKY D. Fast als-based matrix factorization for explicit, implicit feedback datasets[C]//Proceedings of the Fourth ACM Conference on Cecommender Systems. New York: ACM Press, 2010: 71-78.

[8] Dena D, Bucicoiu M, Bardac M. A managed distributed processing pipeline with Storm and Mesos[C]. Networking in Education and Research, 2013 RoEduNet International Conference 12th Edition, Iasi, 2013: 1-6.

[9] 夏俊鴛. Spark大數(shù)據(jù)處理技術(shù)[M]. 北京: 電子工業(yè)出版社, 2015.

[10] Polak E, Ribière G. Note sur la convergence de méthodes de directions conjuguées[J]. Rev. franaise Informat. recherche Opérationnelle, 1968, 16(16): 35-43.

【通聯(lián)編輯:謝媛媛】

主站蜘蛛池模板: 丰满少妇αⅴ无码区| 特级毛片8级毛片免费观看| 色有码无码视频| 萌白酱国产一区二区| 成人伊人色一区二区三区| 久久99精品国产麻豆宅宅| 欧美.成人.综合在线| 手机在线看片不卡中文字幕| 综合色区亚洲熟妇在线| 日日碰狠狠添天天爽| 人与鲁专区| 国产尹人香蕉综合在线电影| 亚洲第一福利视频导航| 亚洲无码精彩视频在线观看| 国产香蕉97碰碰视频VA碰碰看 | 国产精品无码影视久久久久久久| 99国产在线视频| 九色91在线视频| 98超碰在线观看| 国产福利一区二区在线观看| 亚洲欧洲美色一区二区三区| 欧美日韩成人在线观看| 国产黑丝视频在线观看| 免费Aⅴ片在线观看蜜芽Tⅴ| 色天天综合久久久久综合片| 欧美一区二区丝袜高跟鞋| 欧美日韩亚洲综合在线观看| 老司机午夜精品视频你懂的| 亚洲免费黄色网| 蜜臀av性久久久久蜜臀aⅴ麻豆| 色有码无码视频| 久久这里只有精品2| 国产成人综合在线观看| 国产高潮流白浆视频| 欧美精品xx| 99精品视频播放| 亚洲动漫h| 99热这里只有精品5| 亚洲二三区| 日韩性网站| 91美女在线| 啪啪国产视频| 亚洲精品自拍区在线观看| 在线播放真实国产乱子伦| 成年午夜精品久久精品| 制服丝袜国产精品| 亚洲精品第1页| 国产欧美精品一区二区| 国产在线拍偷自揄拍精品| 午夜视频免费试看| 亚洲国产一区在线观看| 无码国产偷倩在线播放老年人| 久久久久亚洲AV成人人电影软件| 91黄色在线观看| 日韩天堂视频| 黄色三级网站免费| 国产亚洲美日韩AV中文字幕无码成人| 国产麻豆福利av在线播放| 91小视频在线播放| 国产成年无码AⅤ片在线 | 午夜日b视频| 国产玖玖视频| 国产精品永久在线| 制服丝袜无码每日更新| 国产综合欧美| 巨熟乳波霸若妻中文观看免费| 中文字幕在线永久在线视频2020| a级毛片一区二区免费视频| 亚洲不卡网| a在线观看免费| 精品国产免费观看| 国产网站免费观看| 国产在线精品美女观看| 在线精品欧美日韩| 成人一级免费视频| 激情综合婷婷丁香五月尤物 | 亚洲 欧美 中文 AⅤ在线视频| 99精品国产电影| 久久久久亚洲AV成人人电影软件| 免费高清a毛片| 久久久亚洲色| 亚洲一区国色天香|