蘇凡軍,唐啟桂
(上海理工大學 光電信息與計算機工程學院,上海 200000)
SBHCF:基于奇異值分解的混合協同過濾推薦算法
蘇凡軍,唐啟桂
(上海理工大學 光電信息與計算機工程學院,上海200000)
摘要針對傳統協同過濾中的最近鄰查找不夠合理導致推薦的準確率較低的困境。提出一個基于矩陣分解的混合相似度算法。該方法融合了基于模型的奇異值矩陣分解算法和基于近鄰的協同過濾算法皮爾遜相關系數,并引入閾值和杰卡德系數對相似度進行修正。在公共有效數據集上的實驗表明,所提出算法的平均絕對誤差比傳統的推薦算法至少降低了7.7%,有效提高了推薦準確率。
關鍵詞協同過濾;奇異值矩陣分解;杰卡德系數;皮爾遜系數
SU Fanjun,TANG Qigui
(School of Optical-Electrical and Computer Engineering,University of Shanghai for
Science and Technology,Shanghai 200000,China)
AbstractThe traditional CF recommendation algorithms are poor in accuracy because of its irrational neighbor-retrieve.In this paper,an SVD-based hybrid collaborative filtering algorithm is proposed to solve the challenge.The method combines SVD model-based CF algorithm and PCC memory-based CF algorithm.Several parameters and JACCARD are introduced to revise the similarity.The experiment in the public data set proves that the SBHCF algorithm effectively improves the recommendation accuracy with a reduced MAE by at least 7.7% than the traditional CF algorithm.
Keywordscollaborative filtering;singular value matrix factorization;Jaccard coefficient;Pearson coefficient
大數據時代的用戶數目和物品數目增長至高維狀態,實際應用過程中用戶的評分數據又相當稀疏,這使得單純從數據集和中度量用戶相似性的準確率不高,進而導致推薦的準確率低下和用戶體驗性差[1-2]。為應對這個挑戰,研究者進行了大量研究[3-6]。盡管這些工作有了較大成果,但依然存在不足,文獻[3]和文獻[4]主要的思想是基于鄰域的協同過濾,在數據集中直接尋找相似用戶,效率相對低下;文獻[5]和文獻[6]主要是基于模型的協同過濾,性能和擴展性好,能有效解決評分稀疏性問題,然而基于模型的協同過濾使用低階矩陣近似原矩陣有一定數據消耗,準確率不高;更重要的是,上述方法沒有考慮到有些目標用戶其實沒有相似用戶,若一個用戶并沒有相似用戶,算法也會產生這個目標用戶的相似用戶,這實際是降低了推薦的準確率。……