999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶行為數據的非負矩陣分解音樂軟件推薦算法研究

2025-06-19 00:00:00金龍
現代信息科技 2025年8期
關鍵詞:特征用戶模型

中圖分類號:TP391.4 文獻標識碼:A 文章編號:2096-4706(2025)08-0111-06

Abstract: With the popularity of intermet music services,how to accurately recommend music for users has become an importantresearch topic.This paperaimsattheshortcomingsof theexistingmusicrecommendationsystemindealingwith problemssuchascold-startanddatasparsity.AmusicrecommendationalgorithmbasedonNon-NegativeMatrixFactorization (NMF) is proposedThe studyusesadataset fromacolaborationproject with NetEaseCloud Music,whichcontains more than 57 millon music interactionrecordsofmore than2millonusers.Byintroducinguserbehavior weightsandsparseconstraints, weighted NMFand sparse NMF models are constructed respectively.The experimental results show that the weighted NMF performs best when dealing with high-frequency interactive users,and the F1 score reaches .The sparse NMF has more advantages in dealing withcold-start users.Forusers with fewer than1O interactions,therecommendation accuracy is 1 5 % higher than that of the basic NMF.The research results provide new solutions for the optimization of the music recommendation system.

Keywords:Machine Learning; music recommendation model; NMl

0 引言

隨著互聯網和信息技術的快速發展,數字音樂產業得到了迅猛擴展。用戶通過流媒體平臺能夠隨時隨地獲取數百萬首歌曲的服務。然而,隨著音樂庫規模的增加,用戶面臨的信息過載問題日益嚴重,如何為用戶推薦其可能感興趣的音樂成為一個重要的研究課題[]。推薦系統作為解決此類信息過載問題的核心技術,已經在電子商務、電影、新聞等多個領域得到了廣泛應用[2]。

本研究的主要目標是通過研究基于用戶行為數據的NMF算法,探討其在音樂推薦系統中的應用效果。通過對比加權NMF和稀疏NMF兩種算法的性能,揭示它們在處理不同用戶行為數據時的適用場景和優勢,旨在為提升音樂推薦系統的精度與個性化提供有效的解決方案[3]。

1文獻綜述

推薦系統自20世紀90年代以來,逐漸發展成為解決信息過載問題的核心技術。最早的推薦系統主要基于內容過濾(Content-based Filtering)[4],然而,內容過濾在處理冷啟動和數據稀疏性問題上存在一定的局限性[5]。為了克服這些問題,協同過濾(CollaborativeFiltering)逐漸成為主流方法之一,主要分為基于用戶的協同過濾和基于項目的協同過濾[7]。近年來,基于深度學習的推薦系統也逐漸嶄露頭角,通過結合神經網絡和矩陣分解,進一步提高了推薦精度[8]。

在音樂推薦領域,非負矩陣分解(NMF)已被證明能夠有效處理用戶的隱式反饋數據,如點擊、收藏、播放行為等。傳統的奇異值分解(SVD)盡管能夠有效分解用戶和物品的交互矩陣,但由于分解結果中存在負值,導致結果的可解釋性較差[]。Hu等人提出了基于NMF的隱式反饋矩陣分解方法,通過引入置信度參數來處理用戶隱式行為的不同權重,從而提高推薦精度[1]。NMF強制分解矩陣中的元素為非負值,保證了結果的可解釋性,從而在推薦系統中得到了更廣泛的應用。此外,NMF通過提取用戶和物品的隱含特征,能夠處理更復雜的用戶行為數據,如用戶的隱式反饋[12]。

盡管NMF在推薦系統中取得了良好的效果,但其在處理稀疏性和冷啟動問題上仍存在一定局限性。研究人員提出了多種改進模型,如加權NMF和稀疏NMF,以適應不同的推薦場景。加權NMF通過對用戶行為數據賦予不同的權重,增強了模型對關鍵行為的捕捉能力[13]。稀疏NMF 則通過引入L1正則化項,控制分解矩陣的稀疏性,在處理維度高、數據稀疏性強的數據集時表現出色[14]。近年來,結合加權NMF和稀疏NMF的方法逐漸受到關注。這些方法在保證稀疏性的同時,對用戶行為數據進行加權處理,從而提高推薦精度和結果的可解釋性。

2 研究方法與設計

本章詳細介紹了研究的整體方法論設計、數據處理過程以及模型構建方案,為實現音樂推薦系統的優化奠定了理論和技術基礎。

2.1 研究方法概述

本研究采用定量分析方法,以非負矩陣分解(NMF)為基礎構建音樂推薦系統。研究重點關注兩種改進的NMF模型:加權NMF和稀疏NMF。這兩種模型分別針對用戶行為權重差異化和數據稀疏性問題進行了優化,通過系統的對比分析驗證了其在提升推薦系統準確性和個性化程度方面的效果。

遵循數據完整性、特征顯著性、模型可解釋性和實驗可重復性四項原則,確保研究的科學性和可靠性。本研究采用“數據收集一預處理一建模一驗證一優化”的技術路線,如圖1所示。

數據收集→數據預處理→模型構建 模型驗證 模型優化

2.2 數據集介紹與描述

在開展具體的模型研究之前,首先需要對研究所使用的數據集進行全面的了解和分析,以確保后續建模的科學性和可靠性。

2.2.1數據來源與基本情況

本研究所使用的數據集來源于INFORMS與網易云音樂的合作項目,具有全面且豐富的數據特征。在時間維度上,數據收集覆蓋了2019年11月1日至30日的完整月度周期,保證了數據的時間連續性和完整性。在用戶規模方面,數據集包含了2085533名活躍用戶的行為記錄,涵蓋范圍廣泛且具有代表性。數據總量達到5700多萬條音樂內容卡片的展示記錄,包括點擊、點贊、收藏、分享等多種用戶行為類型。

每條數據記錄都包含用戶ID、音樂ID、行為類型、時間戳等完整信息。經過初步清洗后,已去除明顯異常和重復數據,確保了數據質量的可靠性。數據集中各類用戶行為的具體分布情況如表1所示,這種多樣化的行為數據為后續的特征工程和模型構建提供了堅實的基礎。

表1用戶行為類型分布統計

2.2.2 數據特征分析

通過深入分析,發現數據集包含三類主要特征,分別從不同角度描述用戶的行為模式。在用戶基礎特征方面,包含了用戶的人口統計學特征(如年齡段、性別等)、用戶的注冊信息(如注冊時長、賬號狀態等),以及反映用戶活躍程度的指標(如月均訪問頻次、使用時長等)。這些基礎特征為理解用戶的基本屬性提供了重要參考。

在內容交互特征方面,收集了用戶的顯式反饋(如評分、評論等)、隱式反饋(如播放時長、跳過次數等),以及社交行為(如分享、推薦等)。這些交互特征直接反映了用戶對音樂內容的偏好和興趣程度。在時序特征方面,關注用戶的行為時間分布(包括每日、每周的活躍模式)、行為的連續性指標(如訪問間隔、行為序列等),以及時間衰減特征(體現近期行為的權重)。

通過對數據的初步分析,發現了幾個重要的特征規律:首先,用戶行為呈現明顯的長尾分布特征,如圖2所示;其次,不同類型的用戶行為之間存在顯著的相關性;第三,用戶的活躍度與其行為的多樣性呈現正相關關系;最后,時間特征對于預測用戶興趣具有重要影響。這些發現為后續的模型設計提供了重要的指導。

圖2用戶行為分布統計圖

2.3數據預處理與特征工程

基于對數據集的深入理解,本研究設計了系統的數據預處理流程和特征工程方案,以提升數據質量并構建有效的特征表示。

2.3.1 數據預處理方法

數據預處理主要包括以下幾個步驟:本研究采用了多階段的數據處理策略,確保數據質量滿足建模需求。在數據清洗階段,首先對完全重復的記錄進行刪除,隨后使用四分位距(IQR)方法識別和處理異常值,特別是對播放時長等連續型特征進行重點處理。計算式為:

其中, 分別為第一和第三四分位數,IQR為四分位距。

針對缺失值處理,研究對不同類型的特征采用了差異化的處理策略。對于連續型特征,采用中位數進行填充,這種方法能夠保持數據的分布特征;對于類別型特征,則使用眾數填充,保證填充值的合理性;對于時序特征,采用臨近時間點的數據進行插值,維持數據的時間連續性;對于具有關聯性的特征,則基于特征間的相關性進行推斷填充,提高填充的準確性。

在數據標準化階段,對不同類型的特征采用了相應的標準化方法。對于數值型特征,采用Min-Max標準化使其范圍統一到[0,1]區間;對于類別型特征,通過獨熱編碼轉換為數值表示;對于時序特征,則進行時間窗口化處理,便于后續建模使用。

2.3.2 特征工程

特征工程階段重點構建了三個層面的特征系統:用戶行為權重特征、時間相關特征和內容交互特征。行為權重特征包括基于行為類型的靜態權重(詳細權重設計如表2所示)和時間衰減的動態權重;時間相關特征包含全局時間特征、周期性特征和序列特征;內容交互特征則涵蓋基礎統計特征和行為類型的交叉特征。時間衰減特征的計算采用了指數衰減函數,其計算式為:

其中, ω 為衰減系數, k 為潛在特征維度, 為時間間隔。

表2用戶行為權重設計

2.4模型設計與實現

在完成數據準備和特征工程后,本研究進入核心的模型設計與實現階段,重點關注基礎NMF模型的改進和優化。

2.4.1 基礎NMF模型

基礎NMF模型為研究奠定了理論基礎,其核心是通過分解用戶-物品交互矩陣來發現隱含的特征模式。模型的目標函數設計充分考慮了非負約束的特點,通過最小化重構誤差來優化模型參數。具體的目標函數為:

其中, X 為用戶-物品交互矩陣, W 為用戶特征矩陣, W ? 0 , H 為物品特征矩陣, H ? 0 , 為Frobenius范數。

2.4.2 加權NMF模型

在基礎NMF模型的基礎上,加權NMF模型引入了權重矩陣 V 來區分不同用戶行為的重要程度。權重設計綜合考慮了三個關鍵因素:首先是基于行為類型的基礎權重,反映不同行為的內在重要性;其次是考慮行為時效性的時間衰減權重;最后是根據用戶參與度設計的活躍度權重。這種多維度的權重設計使模型能夠更準確地刻畫用戶偏好。模型的目標函數為:

其中, V 為權重矩陣, ? 為Hadamard積(逐元素相乘)。權重矩陣的設計基于表2中的行為權重系數。

2. 4.3 稀疏NMF模型

稀疏NMF模型通過引入 正則化項來增強模型的泛化能力。模型設計遵循三個主要原則:首先是通過參數λ靈活控制模型的稀疏程度;其次是利用正則化實現自動的特征選擇;最后是通過適當的正則化強度來防止模型過擬合。這種設計既保持了模型的表達能力,又提高了其在實際應用中的穩定性。模型的目標函數為:

其中,λ為正則化參數,用于控制模型的稀疏程度, 范數。

2.4.4 模型優化與訓練

模型訓練采用多階段優化策略。在參數初始化階段,首先采用均勻分布對 W 和 矩陣進行初始化,并引入Xavier初始化方法以提高模型的收斂速度。同時,通過實驗選取了合適的初始學習率,為后續優化過程奠定基礎。

在優化過程中,本研究采用交替最小二乘法(AltermatingLeastSquares,ALS)作為核心優化算法。為了提高優化效果,結合Adam優化器進行梯度更新,這種優化器能夠自適應地調整學習率,有效提升了模型的訓練效果。此外,采用批量訓練的方式進行模型訓練,通過合理設置批量大小,顯著提高了計算效率。

在收斂控制方面,設置了多重控制機制以確保模型訓練的穩定性和效果。具體而言,設定最大迭代次數為1000輪,同時引入早停策略,即當連續5次驗證集損失沒有得到改善時,自動停止訓練過程。另外,設置了相對重構誤差閾值為 ,當模型達到這一精度時即認為收斂完成。這些策略的組合使用,既保證了模型能夠充分訓練,又避免了過度擬合的風險。

實驗觀察表明,加權NMF模型在處理用戶行為差異性方面表現出色,顯著提升了推薦的準確度。同時,稀疏NMF模型通過正則化約束有效緩解了數據稀疏性帶來的影響。不同模型在訓練過程中展現出各自的優勢特點,這為實際應用中的模型選擇提供了重要參考。

模型在不同參數配置下的性能對比如圖3所示。

圖3不同NMF模型性能對比圖

3 實驗結果及分析

本章系統地展示了模型的實驗過程和評估結果,通過多個維度的分析驗證了所提出模型的有效性

3.1實驗設置與評估指標

為了全面評估模型性能,本研究設計了完整的實驗評估體系。

3.1.1評估指標

本研究采用多個標準指標對模型性能進行評估。F1值用于綜合評估推薦的準確性和完整性,能夠平衡精確率和召回率之間的關系;均方根誤差 (RMSE)和平均絕對誤差(MAE)分別從不同角度衡量預測評分的準確程度;歸一化折扣累計增益(NDCG)則專門用于評估推薦結果的排序質量。此外,考慮到實際應用中的效率需求,還對模型的訓練時間進行了記錄和分析。

3.1.2 數據集劃分

實驗采用了標準的訓練集、驗證集和測試集劃分方式,按照8:1:1的比例進行劃分。具體而言,訓練集包含1668426名用戶的45600000條交互記錄,驗證集和測試集各包含約20萬用戶的570萬條記錄。這種劃分方式既確保了訓練數據的充足性,又保證了驗證和測試的可靠性。特別注意的是,劃分過程中確保了每個用戶在各個數據集中都有對應的行為記錄,避免了數據泄露問題,如表3所示。

表3數據集劃分統計

3.2模型訓練與收斂性分析

對三種NMF模型的訓練過程進行了詳細追蹤和分析,重點關注其收斂特性和性能表現。

3.2.1 訓練過程分析

實驗記錄顯示,加權NMF在前20輪迭代中就達到了較好效果,展現出快速收斂特性;稀疏NMF因引入正則化約束,收斂較慢但更穩定;基礎NMF在后期出現輕微震蕩。三種模型在測試集上各具特色:加權NMF獲得最高的F1值(0.9976)和NDCG值(0.6150),表明其在整體推薦質量上具有明顯優勢;稀疏NMF的F1值達到0.9954,展現出良好的泛化能力;基礎NMF作為對照組提供了有效基準。不同NMF模型訓練過程中損失函數變化趨勢如圖4所示。

3.2.2 模型性能對比

在測試集上的實驗結果顯示,三種模型各具特色:加權NMF獲得了最高的F1值(0.9976)和NDCG值(0.6150),同時具有最小的RMSE(0.1217)和MAE(0.0158),表明其在整體推薦質量上具有明顯優勢;稀疏NMF雖然在某些指標上略遜于加權NMF,但其F1值仍達到0.9954,展現出良好的泛化能力;基礎NMF作為對照組,在各項指標上均表現穩定,為改進模型提供了有效的基準。三種模型在測試集上的性能對比如表4所示。

圖4不同NMF模型訓練過程中損失函數變化趨勢
表4模型性能對比

3.3用戶行為影響分析

基于用戶行為權重設計的實驗結果表明,不同類型的用戶行為對推薦效果具有顯著不同的影響。收藏行為(權重3.0)對推薦準確性的貢獻最為顯著,這與其代表用戶強烈興趣的特性相符。分享行為雖然被賦予了較高權重(4.0),但由于數據的稀疏性,其實際影響相對有限。點擊行為雖然單次權重較低(1.0),但由于其高頻特性,累積效應顯著提升了推薦效果。圖5展示了各類行為對推薦準確性的貢獻度。

圖5不同類型用戶行為對推薦準確性的貢獻度

3.4冷啟動問題分析

在解決冷啟動問題方面,不同模型展現出明顯的性能差異。稀疏NMF在處理交互次數少于10次的新用戶時表現最為出色,這得益于其在數據稀疏情況下的良好泛化能力。加權NMF則在用戶交互次數超過20次后表現優異,說明隨著用戶行為數據的積累,權重機制的優勢得到充分發揮。基礎NMF對數據量要求較高,需要較多的用戶交互才能達到理想的推薦效果。不同模型在處理新用戶時的表現如圖6所示。

圖6不同交互數量下的推薦效果對比
表5不同用戶組的推薦性能

3.5 應用場景分析

基于實驗結果,可以針對不同應用場景推薦最適合的模型配置。在高頻互動場景(如音樂APP主頁推薦)中,加權NMF因其能夠精準捕捉用戶實時偏好而成為最佳選擇。對于冷啟動場景(如新用戶推薦),稀疏NMF憑借其處理數據稀疏問題的優勢,展現出更好的適用性。

這些發現為實際系統的模型選擇和部署提供了重要的參考依據,也為后續的模型優化指明了方向。

4結論

本文通過分析加權NMF和稀疏NMF在音樂推薦系統中的應用,探討了不同NMF模型在處理用戶行為數據時的表現和適用場景。研究結果表明,加權NMF由于賦予不同行為權重,能夠更好地捕捉用戶的實際偏好,在處理交互頻繁的用戶時表現優異;而稀疏NMF則通過 正則化控制模型復雜度,適合處理稀疏性較高的用戶行為數據,尤其在冷啟動情境中具備優勢。

總體來看,結合用戶行為特點和數據規模,選擇合適的NMF模型可以顯著提升音樂推薦系統的性能。加權NMF更適合處理頻繁交互數據,而稀疏NMF更適合用戶行為較少、數據稀疏的場景。通過實驗評估,本文驗證了兩種模型在不同應用場景下的有效性,為實際推薦系統的優化提供了借鑒。

盡管本研究取得了一定的成果,但仍然存在一些局限性。首先,NMF模型的性能在用戶行為極其稀疏的數據集上有所下降。雖然稀疏NMF可以通過正則化改善部分表現,但在處理新用戶或交互極少的用戶時,推薦效果仍然不夠理想。此外,研究僅考察了加權NMF和稀疏NMF兩種模型,未來還可以結合其他推薦技術(如深度學習模型)進一步優

化系統性能。

另一個局限性在于權重的設定。加權NMF模型對行為的權重設置依賴于人為經驗,未能自動調節權重,可能會導致在某些行為下權重設置不合理,影響模型的推薦效果。因此,未來研究可以探索如何自動化權重分配,從而提升推薦系統的智能化水平。

參考文獻:

[1]BOBADILLAJ,ORTEGAF,HERNANDOA,etal.Recommender Systems Survey[J].Knowledge-Based Systems,2013,46:109-132.

[2]SHIY,LARSONM,HANJALICA.CollaborativeFilteringBeyondtheUser-ItemMatrix:ASurveyoftheStateof the Art and Future Challenges[J].ACM Computing Surveys(CSUR),2014,47(1):1-45.

[3]VARGHESEK,MKOLHEKARMM,HANDES.Denoising ofFacial Images UsingNon-Negative MatrixFactorization with Sparseness Constraint [C]//20183rdInternational Conference for Convergence in Technology (I2CT).Pune:IEEE,2004:1-4.

[4]RICCIF,ROKACHL,SHAPIRAB,etal.Recommender Systems Handbook[M].New York:Springer,2011.

[5]KORENY,BELLR,VOLINSKYC.MatrixFactorization Techniques for Recommender Systems [J].Computer,2009,42(8):30-37.

[6]SUXY,KHOSHGOFTAARTM.A SurveyofCollaborative Filtering Techniques [J].Advances in ArtificialIntelligence,2009,2009(1):1-19.

[7] SCHAFERJB,KONSTANJA,RIEDLJ. E-CommerceRecommendation Applications[J].Data Miningand KnowledgeDiscovery,2001,5(1):115-153. [8] ZHANG S,YAO L,SUNA,et al.Deep LearningBasedRecommender System:A Survey and New Perspectives [J].ACMComputing Surveys,2019,52(1):5.1-5.38.

[9]KIMJ,PARK H.FastNonnegative MatrixFactorization:An Active-Set-Like Method and Comparisons[J].SIAM Journal on Scientific Computing,2011,36(6):3261-3281.

[10]MNIHA,SALAKHUTDINOVRR.ProbabilisticMatrix Factorization [C]//Advancesin Neural InformationProcessing Systems15:Proceedingsof the 2002 Conference.Vancouver:MITPress,2003:1-7.

[11]HUYF,KORENY,VOLINSKYC.CollaborativeFilteringforImplicitFeedbackDatasets[C]//20o8EighthIEEEInternational Conference on Data Mining.Pisa:IEEE,2008:263-272.

[12]ZENGW,FANG,SUNS,etal.CollaborativeFilteringViaMulti-LayerNeuralNetworks[J/OL].Applied SoftComputing,2021,109:107516[2024-10-05].https://doi.org/10.1016/j.as0c.2021.107516.

[13]FANGH,LIA,XUHX,etal.Sparsity-ConstrainedDeepNonnegative Matrix Factorization for HyperspectralUnmixing [J].IEEE Geoscience and Remote Sensing Letters,2018,15(7):1105-1109.

[14] GUO Z X,ZHANG S H. Sparse Deep NonnegativeMatrix Factorization[J/OL].arXiv:1707.09316 [cs.CV].[2024-09-26].https://doi.org/10.48550/arXiv.1707.09316.

作者簡介:金龍(2000一),男,漢族,四川廣元人,碩士研究生在讀,研究方向:數據科學、機器學習。

猜你喜歡
特征用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 精品视频在线观看你懂的一区| 亚洲成人精品在线| www.亚洲一区| 一级毛片在线播放免费观看| hezyo加勒比一区二区三区| 四虎在线高清无码| 91成人精品视频| 亚洲性视频网站| 精品国产免费第一区二区三区日韩| 最新国产精品第1页| 丁香婷婷久久| 国产91视频免费| 日本人妻丰满熟妇区| 欧美成人a∨视频免费观看 | 亚洲精品无码人妻无码| 情侣午夜国产在线一区无码| 中文字幕资源站| 91啪在线| 国产精品国产三级国产专业不 | 亚洲综合日韩精品| 亚洲资源站av无码网址| 毛片免费观看视频| 九九热在线视频| 日韩高清欧美| 国产打屁股免费区网站| 欧美精品一二三区| 久久精品波多野结衣| 一区二区午夜| 熟妇无码人妻| 亚洲一级毛片免费看| 在线亚洲小视频| 日韩国产一区二区三区无码| 日本尹人综合香蕉在线观看| 久久久黄色片| 欧美中文字幕在线二区| 欧美日韩国产在线播放| 天天摸夜夜操| 色噜噜久久| 国产成人精品视频一区二区电影 | 亚洲精品无码不卡在线播放| 女人毛片a级大学毛片免费 | 久久久久国色AV免费观看性色| 日日拍夜夜操| 国产精品片在线观看手机版| 999福利激情视频| 伊人蕉久影院| 欧美色99| 永久天堂网Av| 狠狠色香婷婷久久亚洲精品| 亚洲精品国产精品乱码不卞| 在线视频精品一区| 久久99国产综合精品1| 天堂网亚洲系列亚洲系列| 色哟哟国产精品| 欧美精品亚洲精品日韩专区| 亚洲国产成人自拍| 成人欧美日韩| 亚洲午夜国产片在线观看| 国产成人一区在线播放| 国产av一码二码三码无码| 天天色综网| www.av男人.com| 国内99精品激情视频精品| 91精品啪在线观看国产| 在线不卡免费视频| 美女扒开下面流白浆在线试听 | 国产免费福利网站| 在线国产91| 波多野结衣二区| 色综合色国产热无码一| 国产毛片不卡| 国产女人18水真多毛片18精品| 在线视频亚洲色图| 久久国产精品影院| 久青草国产高清在线视频| 国产白丝av| 国产99在线观看| 无码日韩视频| 制服丝袜亚洲| 国产黄色片在线看| 久996视频精品免费观看| 91精品久久久久久无码人妻|