
【中圖分類號】TP391.3【文獻標志碼】A
【文章編號】1673-1069(2025)04-0086-04
1引言
在當今數字化浪潮下,海量信息與產品充斥著用戶的視野,如何精準地為用戶推薦其真正感興趣的內容或產品,成為互聯網領域、電子商務等眾多行業亟待解決的關鍵問題。推薦系統作為解決信息過載、提升用戶體驗與業務轉化率的核心工具,其重要性日益凸顯。
傳統的推薦方法往往側重于單一維度的考量,如僅依據用戶的歷史行為或項目熱門度進行推薦。這種方式忽視了用戶群體存在的內在差異,以及項目在不同用戶社群中所呈現出的獨特屬性。事實上,不同用戶群體對項目熱門度的感知與項目質量的評價存在顯著差異,在某個用戶群體中備受青睞的熱門優質項目,在另一群體中可能反響平平。
因此,充分挖掘項目在特定用戶群組內的局部熱門度與局部質量,對于提升推薦系統的精準度與有效性至關重要。融合局部熱門度和局部質量的推薦方法,旨在打破傳統推薦的局限性,深人洞察用戶群組的細分特征與項目的局部特性,從而為用戶提供更具針對性、個性化的推薦服務,助力各行業在信息洪流中精準觸達用戶需求,提升用戶滿意度與業務價值。
2研究現狀與不足
協同過濾推薦技術依靠用戶歷史行為數據計算相似性,但存在未顯式建模項目固有屬性對用戶決策影響的局限。在電商場景下,項目質量是影響用戶選擇的關鍵隱性因素。目前估計項目質量的方法有以下幾類:
① 均值估計法:侯銀秀利用余弦相似度匹配用戶偏好與項目質量;Guan等人用項目平均得分估計項目質量并修正用戶評分;卜旭松用偏好相似用戶平均評分度量項目質量。
② 離散系數估計法:Gong等人提出考慮結構和數值相似度的協同過濾法;陸航等人結合用戶和項目質量優化相似度;王巖等人改進Jaccard和Pearson相似度;鄭瀟等人將項目質量等作為隱含特征輸人深度網絡;鄭小楠融合項目質量和用戶影響因子修正余弦相似度。
③ 其他方法:焦富森等人用改進概率公式計算項目質量;林紅弟[用粗糙集理論決策規則過濾低質商品;何佶星[融合平均次數和相對評價次數等度量項目質量。這些方法雖有成效,但存在未考慮用戶專業層次對項目局部特性評估誤差、均值度量項目質量時未考慮用戶評分標準影響等問題。本文通過劃分用戶群計算局部質量和局部熱門度,并用改進協同過濾方法推薦。
3融合項目局部熱門度和局部質量的推薦方法
3.1用戶-項目類型偏好的構建
獲取用戶對項目類型的偏好有兩類途徑: ① 注冊時系統提供選項,用戶直接挑選并填寫信息,此方法簡單且能明確獲取偏好,但非注冊用戶無法這樣操作。而且用戶可能隨意或不填寫,導致系統無法獲取真實偏好,此外當偏好改變時系統也無法更新。 ② 通過分析用戶歷史行為信息來推斷,日志記錄是常見方式,它能記錄用戶在網站的日常行為活動(如評分、轉發、查閱等)并存儲在分布式數據倉庫中。
項目的類型可概括其主要內容,如電視劇《狂飆》類型可為犯罪、都市和警匪。本文通過用戶對隸屬于某一項目類型的項目的評分頻率來衡量用戶對該項目類型的偏好程度。一般來說,某一用戶對隸屬于某一項目類型的項目的評分頻率越高,則表示該用戶對該項目類型的評分頻率越高,該用戶越偏好該項目類型。假設 G 為用戶進行過評分的項目類型集合, ?g 為某一項目類型, g∈G ,則用戶對項目類型偏好度的計算方式如式(1)所示:

式中, Pug 為用戶 u 對項目類型 g 的偏好度, Nug 為用戶 Ωu 對隸屬于項目類型 g 的項目的總評分次數, Nu 為用戶 u 對所有項目的總評分次數。
3.2局部熱門度和局部質量
專家們對項目熱門度的研究多針對整體用戶,未考慮不同用戶群中項目熱門度差異對推薦結果的影響。以《推薦系統》為例,其在個性化推薦和機器視覺領域的項目熱門度不同。直接用所有用戶行為數據衡量項目熱門度會使推薦結果失準,分別衡量《推薦系統》在不同研究領域的項目熱門度,能提高推薦精度。
定義一:局部熱門度。在用戶群A中,對項目i進行過評分的用戶數與該用戶群中總用戶數的比值即為項目i在該用戶群中的局部熱門度。假設用戶群A中的項目集合為 IA ,用戶集合為 UA ,則項目 i 對應的局部熱門度 HiA 的具體計算公式如式(2):

式中, UiA 為在用戶群 A 中,對項目 i 進行過評分的用戶集合。
3.3局部質量
推薦系統為用戶推薦的項目均未被用戶接觸過,所以用戶對項目質量未知,需參考其他用戶的反饋來判斷。由于用戶個人偏好和認知差異,對同一項目的反饋存在偏差。因此,本文先按用戶歷史行為數據聚類,同一用戶群的用戶偏好相似,他們對項目的反饋更能準確反映該項目在該群中的局部質量。
定義二:局部質量。在用戶群 A 中,用戶對項目i的平均評分與用戶對所有項目的平均評分的比值即為項目i在該用戶群中的局部質量。項目 i 在用戶群 A 中對應的局部質量 Qi4 計算公式如式(3):

其中, Rui 為用戶 u 對項目 i 的評分。
3.4項目權重
實際生活中,用戶常依項目熱門度或項目質量選擇項目。但熱門項目的項目質量未必高,且項目質量依用戶反饋(如評分)衡量,存在偏差。例如,100位用戶中50位評項目a ,項目質量0.8;僅1位評項目b,項目質量1。若單以項目質量度量項目權重,像項目 b 這樣偶然性大,會降低推薦效果。融合項目熱門度與項目質量度量項目權重(如項目 αa 權重0.4,項目 b 權重0.01),可解釋性更高,能降低結果偶然性。
定義三:項目權重。在用戶群 A 中,項目 i 對應的項目權重即為在該用戶群中,項目i對應的局部熱門度和局部質量的乘積。項目 i 在用戶群 A 中對應的項目權重 WiA 計算公式如式(4):
Wi1=Hi1×Qi4
其中, HiA?QiA 分別為項目在用戶群 A 中的項目局部熱門度、局部質量。
3.5評分預測
基于余弦相似度的度量結果選取與目標用戶最相似的K 個近鄰,根據近鄰的評分預測目標用戶對未評分項目的評分,然后向目標用戶推薦預測評分最高的 N 個項目。

其中,
分別為用戶
的對項目 i 的評分、用戶 u 對項目 i 的預測評分;
分別為用戶 u 、用戶 v 的平均評分;WiA 為項目在用戶群 A 中的項目權重, sin(u,v) 為用戶 Ωu 與用戶 v 的用戶相似度, Nu 為用戶 u 的近鄰集合。
4實驗結果及分析
4.1數據集及評估指標
本文實驗采用美國明尼蘇達大學GroupLens項目組提供的MovieLens100K 數據集和MovieLens1M數據集,記為 M1 和 M2° 每位用戶至少對20部電影進行過評分。隨機抽取80% 作為訓練集,剩余 20% 作為測試集進行實驗,且本文采用準確率(Precisioin)、召回率(Recall)和調和值( F1 值)作為所提方法的評估指標。
4.2參數設置與分析
本文方法主要涉及2個參數對實驗結果的影響,分別是近鄰數 K 和推薦項目數 N 首先對這兩個參數進行優化實驗,然后進行相應的對比實驗。
4.2.1近鄰數 K 對實驗結果的影響
為驗證近鄰數 K 對實驗結果的影響,本文將近鄰數的取值范圍設置為[5,30],步長5,在項目推薦數 N=5 時進行相關實驗,圖1、圖2分別展示了近鄰數 K 在數據集 M1,M2 上的結果。Precision隨著近鄰數 K 的增加呈現先增大后減小的趨勢。當 K 的取值偏小時,其對近鄰用戶的選取力度偏小,誤將近鄰用戶歸為非近鄰用戶,導致Precision值偏小;當 K 的取值偏大時,其對近鄰用戶的選取力度偏大,誤將非近鄰用戶歸為近鄰用戶,亦導致Precision值偏小。Recall和 F1 也隨著近鄰數的增加呈現先增大后減少的趨勢,但他們的波動幅度小于Precision的波動幅度,這是因為項目的推薦數 N 穩定不動,隨著近鄰數 K 的增大,推薦列表中的項目具有較高的重復率,降低了他們的波動幅度。

圖1 M1"數據集中近鄰數 K 對實驗結果的影響

4.2.2推薦項目數 N 對實驗結果的影響
為驗證推薦項目數 N 對實驗結果的影響,本文將近鄰數的取值范圍設置為[5,25],步長5,在近鄰數 K 取最優值時進行相關實驗,圖3、圖4分別展示了推薦項目數 N 在數據集M1,M2 上的結果。Precision隨著推薦項目數 N 的增加而減小。當 N 的取值偏大時,對于非優質項目的懲罰力度偏小,導致Precision的值偏小。Recall和 F1 隨著推薦項目數 N 的增加而增加,這是因為隨著推薦項目數 N 的增加,推薦列表中符合用戶需求的項目也在不斷增加。


4.2.3對照實驗及結果分析
為進一步驗證所提方法的性能,將本文方法即融合項目局部熱門度和局部質量的推薦方法與基于用戶的協同過濾推薦(UBCF)基于項目的協同過濾算法(IBCF)和結合熱門度權重的用戶協同過濾推薦算法(W-UBCF)進行比較。圖5、圖6、圖7展示了各數據集中不同方法的Precision、Recall、F1 的比較結果。從圖中可以看出,本文方法在Precision、Recall和 F1 指標上優于對比方法,進一步驗證了本文方法的有效性。



5結語
針對項目熱門度和質量的群組偏差問題,提出融合局部熱門度與質量的推薦方法。實驗表明該方法可提高Top-N推薦的Precision和Recall,提升項目度量準確性。但不足在于劃分用戶群組及度量時未考慮時間因素。鑒于用戶偏好動態變化會影響群組結構,未來研究將融入時間要素,構建動態分析模型,捕捉偏好波動,建立時間序列下群組動態劃分機制,結合項目熱度與質量的時間衰減和周期性規律,完善評估體系。
【參考文獻】
【1]侯銀秀.基于在線評論情感分析的圖書個性化推薦研究[D].武漢:華中師范大學,2018.
【2]Guan Y,Cai S,Shang M.Recommendation Algorithm based on Item Quality and User Rating Preferences [J].Frontiers of Computer Science,2014,8(2):289-297.
【3】卜旭松.基于物品協同過濾的個性化視頻推薦算法改進研究[D]銀川:寧夏大學,2015.
【4]Gong L,Wang J.Research on Collaborative Filtering RecommendationAlgorithm forImprovingUserSimilarity Calculation[C]//Proceedingsofthe 2021 1stInternational Conference on Control and Intelligent Robotics,2021:331-336.
【5】陸航,師智斌,劉忠寶.融合用戶興趣和評分差異的協同過濾算法[J]計算機工程與應用,2020,56(07):24-29.
【6】王巖,張杰,許合利.結合用戶興趣和改進的協同過濾算法[J].小型微型計算機系統,2020,41(08):1665-1669.
【7]鄭瀟,李樹青,張志旺.基于評分數值分析的用戶項目質量測度及其在深度推薦模型中的應用[J].數據分析與知識發現,2022.6(04):39-48.
【8】鄭小楠.基于用戶偏好的個性化協同過濾算法研究[D].重慶:重慶郵電大學,2020.
【9】焦富森,李樹青.基于物品質量和用戶評分修正的協同過濾算法[J]數據分析與知識發現,2019,3(08):62-67.
【10】林紅弟.電子商務中基于個性化推薦的商品質量和隱私保護相關問題研究[D].青島:山東科技大學,2018.
【11】何佶星.基于平均偏好權重的混合推薦算法研究[D].成都:西南石油大學,2018.
【12]Zhao X,Niu Z,Chen W.Opinion-based Collaborative Filtering to Solve Popularity Bias in Recommender Systems[C]//Proceedings of International Conference on Databaseand Expert Systems Applications.Berlin:Springer-Verlag,2013:426-433.