丁小煥 彭甫镕 王瓊 陸建峰



摘 要:針對三元組數據內在關聯性復雜的特點,提出了基于平行因子分解(PARAFAC)的協同聚類推薦算法。該算法利用PARAFAC算法對張量進行分解,挖掘多維數據實體之間的相關聯系和潛在主題。首先,利用PARAFAC分解算法對三元組張量數據進行聚類;然后,基于協同聚類算法提出了三種不同方案的推薦模型,并通過實驗對三種方案進行了比較,得到了最優的推薦模型;最后,將提出的協同聚類模型與基于高階奇異值分解(HOSVD)的推薦模型進行比較。在last.fm數據集上,PARAFAC協同聚類算法比HOSVD張量分解算法在召回率和精確度上平均提高了9.8個百分點和3.7個百分點,在delicious數據集上平均提高了11.6個百分點和3.9個百分點。實驗結果表明所提算法能更有效地挖掘出張量中的潛在信息和內在聯系,實現高準確率和高召回率的推薦。
關鍵詞:標簽;張量分解;協同聚類;推薦系統;平行因子分解
中圖分類號: TP311.1TP391 文獻標志碼:A英文標題