999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Spark平臺ALS模型推薦算法的研究與優(yōu)化

2019-07-08 02:23:41李珍吳青洋
電腦知識與技術(shù) 2019年13期

李珍 吳青洋

摘要:推薦算法是推薦系統(tǒng)的重要組成部分,交替最小二乘算法ALS(Alternating Least Squares)在許多大規(guī)模數(shù)據(jù)處理過程中,經(jīng)常用于計算潛在的因子矩陣分解。對于ALS算法迭代次數(shù)多、收斂時間長的問題,該文提出了一種采用非線性共軛梯度算法NCG(nonlinear conjugate gradient )對ALS算法進行改進,來加快ALS算法的收斂速度,并對該方法進行了實驗研究,通過在MovieLens 10M數(shù)據(jù)集上的實驗結(jié)果表明,ALS-NCG模型推薦算法在收斂過程中,比ALS模型推薦算法迭代次數(shù)少,時間消耗少。

關(guān)鍵詞:Spark;最小二乘法;矩陣分解;推薦系統(tǒng);協(xié)同過濾

中圖分類號 ?TP311.52 ? ? ? ?文獻標(biāo)志碼 ?A

文章編號:1009-3044(2019)13-0019-04

Abstract: Recommendation algorithm is an important part of the recommendation system. Many large-scale data processing environments include collaborative filtering models for which the Alternating Least Squares(ALS) algorithm is used to compare latent factor matrix decompositions. To solve the problem that ALS algorithm has too many iterations and too long convergence time, in this paper, we propose an approach to accelerate the convergence of parallel ALS-based optimization methods for collaborative filtering using a nonlinear conjugate gradient(NCG) algorithm wrapper around the ALS iterations. Experimental results on the Movie Lens 10M dataset show that ALS-NCG model recommendation algorithm has less iteration times and less time consuming than ALS model recommendation algorithm in convergence process.

Key words: Spark; alternating least square (ALS); matrix decomposition; recommended system; collaborative filtering

1 背景

推薦系統(tǒng)通過分析用戶行為數(shù)據(jù),為其推薦如電影、音樂、或其他商品,并已成為在線服務(wù)中的重要組成部分。協(xié)同過濾是構(gòu)建推薦系統(tǒng)的一種策略,即通過收集許多用戶的喜好信息來進行推薦。協(xié)同過濾方法已用于在線業(yè)務(wù),如亞馬遜[1],Netflix[2]。

基于隱語義模型推薦算法的實質(zhì)是將稀疏的用戶評分矩陣分解為若干個組成部分,用戶物品評分矩陣R中每一項表示用戶對物品的評分,快速求解低維用戶矩陣U和物品矩陣M是十分必要的,并滿足[R≈UTM]。

矩陣分解與奇異值分解(SVD)聯(lián)系緊密,但是SVD不能處理含有缺失值的矩陣。由于[R≈UTM],使R中預(yù)測評分和實際評分之間的平方差最小,是獲取用戶矩陣和物品矩陣的方法之一。通常采用隨機梯度下降(SGD)或交替最小二乘(ALS)來最小化這種差異[3]。其中,ALS可以處理含有隱式數(shù)據(jù)模型,而且也容易并行化。

盡管ALS推薦算法相對其他推薦算法而言有一定的優(yōu)勢,然而ALS推薦算法收斂過程中迭代次數(shù)多、收斂時間長,很難適用于實時推薦的場景。于是本文提出一種用來計算用戶、物品的矩陣的優(yōu)化后的ALS算法。本文使用非線性共軛梯度算法(NCG)[4]來融合 ALS算法,從而大大加快ALS算法的收斂,本文將這種組合算法稱為ALS-NCG。

本文將在Spark平臺上并行實現(xiàn)優(yōu)化后的ALS算法,其中Spark是一個大型的分布式數(shù)據(jù)處理環(huán)境。在商業(yè)環(huán)境中,Spark已經(jīng)廣泛應(yīng)用于大數(shù)據(jù)分析中。本文在文獻[5-6]提出在Spark平臺上并行實現(xiàn)ALS模型推薦算法的基礎(chǔ)上對ALS模型算法進行優(yōu)化。

表3顯示了ALS算法改進前后的RMSE對比結(jié)果, 當(dāng)正則化參數(shù)設(shè)置為10時,迭代次數(shù)為10、20、30、40,屬性數(shù)為8、10、12,進行比較。圖1是對應(yīng)于表3的統(tǒng)計柱狀圖。由圖1可知ALS-NCG算法對應(yīng)RESE的數(shù)值要比ALS算法對應(yīng)的RMSE的數(shù)值低得多,當(dāng)?shù)螖?shù)為40并且屬性個數(shù)為10時,RMSE值降低到0.870414,RMSE值越小,表明預(yù)測的精度越高,可以看出,利用非線性共軛梯度算法融合ALS算法,不但可以加快ALS算法的收斂速度,還能使模型的評價指標(biāo)更好。

7 總結(jié)

本文介紹了ALS模型推薦算法和Spark平臺的概況,對于ALS模型推薦算法在收斂過程中,收斂時間長、迭代次數(shù)多的問題,本文采用非線性共軛梯度算法融合ALS算法,并在Spark平臺上將優(yōu)化后的ALS-NCG算法并行化實現(xiàn)了。實驗結(jié)果表明ALS-NCG算法效果顯著,有效地加快了ALS算法的收斂,提高了ALS模型推薦算法在海量數(shù)據(jù)下的執(zhí)行效率,并降低了評測指標(biāo)RMSE值。但是也存在不足之處,本文提出的ALS-NCG 推薦算法是在離線環(huán)境下進行的,使用GroupLens提供的電影相關(guān)的數(shù)據(jù),本文進一步的工作應(yīng)該包括:在線上環(huán)境進行實驗和研究其他類型的數(shù)據(jù)。

參考文獻:

[1] Linden G, Smith B, York J. Amazon. com recommendations: Item-to-item collaborative filtering[J]. 2003, 7(1): 76-80.

[2] Bell M R, Koren Y. Lessons from the Netflix prize challenge[J]. SIGKDD Explor. Newsl, 2007, 9(2): 75-79.

[3] Koren Y, Bell R, Volinsky C. Matrix factorization techniques for recommender systems[J]. Computer, 2009, 42(8): 30-37.

[4] Liu Z, Wang Y, Yang S, et al. Differential evolution with a two-stage optimization mechanism for numerical optimization[C]// IEEE Congress on Evolutionary Computation. IEEE, 2016.

[5] Zhou Y, Wilkinson D, Schreiber R, et al. Large-scale parallel collaborative filtering for the netflix prize[C]// Algorithmic Aspects in Information and Management, International Conference, Aaim 2008, Shanghai, China, 2008(6): 23-25, Proceedings. DBLP, 2008: 337-348.

[6] Koren Y, Bell R, Volinsky C. Matrix factorization techniques for recommender systems[J]. Computer, 2009, 42(8): 30-37.

[7] PILASZY I, ZIBRICZKY D. Fast als-based matrix factorization for explicit, implicit feedback datasets[C]//Proceedings of the Fourth ACM Conference on Cecommender Systems. New York: ACM Press, 2010: 71-78.

[8] Dena D, Bucicoiu M, Bardac M. A managed distributed processing pipeline with Storm and Mesos[C]. Networking in Education and Research, 2013 RoEduNet International Conference 12th Edition, Iasi, 2013: 1-6.

[9] 夏俊鴛. Spark大數(shù)據(jù)處理技術(shù)[M]. 北京: 電子工業(yè)出版社, 2015.

[10] Polak E, Ribière G. Note sur la convergence de méthodes de directions conjuguées[J]. Rev. franaise Informat. recherche Opérationnelle, 1968, 16(16): 35-43.

【通聯(lián)編輯:謝媛媛】

主站蜘蛛池模板: 中字无码精油按摩中出视频| 亚洲第一区欧美国产综合| 日韩在线视频网站| 亚洲国产精品国自产拍A| 国产亚洲视频免费播放| 谁有在线观看日韩亚洲最新视频 | 久久狠狠色噜噜狠狠狠狠97视色| 日韩一二三区视频精品| 最新国产高清在线| 91年精品国产福利线观看久久| 成人日韩视频| 日本在线亚洲| 亚洲无限乱码一二三四区| 国产一区二区三区免费观看| 精品欧美日韩国产日漫一区不卡| 久久国产高潮流白浆免费观看| 精品無碼一區在線觀看 | 特级毛片免费视频| 免费啪啪网址| 日韩一级二级三级| 国产成人AV男人的天堂| av大片在线无码免费| 在线免费观看AV| 亚洲欧洲天堂色AV| 手机精品福利在线观看| 久久国产精品影院| 在线观看亚洲天堂| 欧美色图久久| 91视频日本| 色综合久久88| 国产精品熟女亚洲AV麻豆| 91热爆在线| 亚洲品质国产精品无码| 国产成人艳妇AA视频在线| 波多野结衣一区二区三区AV| 91午夜福利在线观看| 伊人色综合久久天天| 国产精品无码作爱| 久久精品一品道久久精品| 这里只有精品在线| 99久久国产综合精品2020| 99视频在线观看免费| 91综合色区亚洲熟妇p| 国产精品免费露脸视频| 色亚洲成人| 日韩美毛片| 亚洲AV无码乱码在线观看代蜜桃| 亚洲国产精品无码久久一线| 亚洲区欧美区| 国产女同自拍视频| 国产乱人免费视频| 亚洲无码高清一区| 制服丝袜无码每日更新| 中文字幕自拍偷拍| 免费午夜无码18禁无码影院| 东京热av无码电影一区二区| 色成人综合| 日本免费新一区视频| 伊人无码视屏| 99久久性生片| 日本三区视频| 欧美激情成人网| 亚洲国产成人在线| 国产十八禁在线观看免费| 波多野结衣在线一区二区| 麻豆精品久久久久久久99蜜桃| 亚洲无线观看| 欧美日韩一区二区三| 手机精品福利在线观看| 午夜a级毛片| 国产精品性| 亚洲综合片| 无码精油按摩潮喷在线播放| 99国产精品国产高清一区二区| 免费一极毛片| 国产欧美另类| 日本国产在线| 又大又硬又爽免费视频| 亚洲av无码久久无遮挡| 中国丰满人妻无码束缚啪啪| 欧美激情第一区| 精品自窥自偷在线看|