摘要:為解決短視頻行業蓬勃發展所帶來的“信息過載”問題,本文提出一種融合3D卷積神經網絡(3DCNN)、長短時記憶網絡(LSTM)和負反饋機制的多維短視頻推薦模型。文中詳細闡述了模型的構建流程,包括短視頻標簽與特征提取、用戶信息及行為數據的提取,以及利用負反饋機制開展視頻推薦的具體方法,并從數據處理、模型優化和訓練過程三個方面提出了優化思路。該模型有望提升推薦的準確性和個性化程度,為后續實證分析和對比研究提供理論基礎,推動短視頻推薦算法朝著更高效、更智能的方向發展。
關鍵詞:短視頻推薦;深度學習;3D卷積神經網絡;LSTM;負反饋;個性化推薦
中圖分類號:TP18文獻標識碼:A
文章編號:1009-3044(2025)14-0025-04
0引言
《中國網絡視聽發展研究報告(2025)》(以下簡稱《報告》)數據顯示,截至2024年12月,我國短視頻用戶規模達到10.40億,使用率達93.8%,連續6年穩居網絡視聽應用細分領域榜首。作為最具吸引力的互聯網應用之一,短視頻平臺憑借龐大的用戶基礎和豐富的短視頻內容,貢獻了互聯網的主要流量增量和使用時長,不僅豐富了消費者的日常生活,也改變了他們的信息獲取方式和網絡消費行為,成為信息傳播的支柱性媒介。
《報告》提到,每日全國上線短視頻突破1.3億條,海量內容如潮水般不斷涌入用戶視野。如此龐大的內容產出與傳播,不可避免地加劇了“信息過載”難題。相關統計表明,每年全球因信息過載造成的直接或間接損失保守估計達6500億美元[1]。
海量信息與用戶個性化需求相互掣肘,推薦算法和個性化分發順勢誕生。當用戶完成單條短視頻觀看后,推薦算法會根據多維度數據構建的用戶畫像篩選匹配內容。在短視頻行業持續擴張、內容呈指數級增長的背景下,如何有效應對“信息過載”,成為亟待解決的緊迫課題。文章借助深度學習算法構建多維短視頻推薦模型,旨在快速推送契合用戶興趣偏好的新視頻,實現瀏覽過程的無縫銜接,提升信息獲取效率。
1短視頻推薦算法研究現狀
短視頻推薦算法發展經歷了從基于簡單標簽匹配的初級方法,逐步演進到運用復雜的機器學習算法,并最終邁向多元化深度學習模型的構建。本文概述部分相關推薦算法,并進行對比。
1.1基于內容的推薦方法
基于內容的推薦模式主要借助短視頻特征與用戶畫像實現精準推送。短視頻特征涵蓋人工添加的各類標簽數據,用戶畫像則包括用戶屬性層面和用戶行為層面的數據。基于內容的推薦方法通常通過自然語言處理和計算機視覺等技術提取視頻的多模態關鍵特征,進行匹配和推薦。
劉宇東等[2]參考用戶年齡、性別等信息,基于相似用戶的興趣偏好,構建出一種融合多特征內容相似度的個性化微博推薦模型。
1.2協同過濾推薦算法
協同過濾算法的核心思想在于假設具有相似興趣愛好的用戶,在面對新內容時也會有相似的行為和評價。算法通過收集大量用戶對短視頻的行為數據,構建用戶與短視頻之間的關聯矩陣,訓練出用戶興趣模型來推薦短視頻。
許智宏等[3]在傳統協同過濾算法中引入知識圖譜,運用路徑排序技術深入挖掘實體之間的關聯,并將語義相似性計算融入其中,結合用戶行為的相似特征,實現視頻的精準推薦。何濤[4]采用超圖的雙向物質擴散推薦算法,將用戶對標簽的興趣度及標簽對視頻的相關度進行內積融合,并考慮用戶負反饋行為,獲得用戶對未交互視頻的預測評分。
1.3基于深度學習的推薦算法
深度學習具有強大的特征自動提取能力,能從海量、高維的短視頻數據和用戶行為數據中挖掘出隱藏的深層特征模式。其核心在于構建深度神經網絡模型,通過對大量數據的學習,自動捕獲用戶與短視頻之間復雜關聯關系,已成為當前的研究熱點。
徐繽榮[5]運用圖卷積神經網絡方法,針對用戶長期與短期喜好建模分析,通過目標短視頻與用戶所瀏覽短視頻的特征計算兩者相似度及用戶對目標短視頻的喜好度,實現短視頻的智能推薦。馮勇[6]提出了一種用RNN(循環神經網絡)模型將長短期興趣融合的實時短視頻推薦方法。
上述方法均具有各自的優勢與局限,如表1所示。本文將在前人研究基礎上,開展基于深度學習的短視頻推薦模型構建工作,該模型主要由三部分組成:3DCNN、LSTM和負反饋機制,如圖1所示。
2基于深度學習的短視頻個性化推薦模型構建
2.1短視頻標簽和特征提取
短視頻標簽和特征提取利用視頻的文本信息(標題、描述、字幕等)、視覺信息(圖像、視頻幀)和音頻信息(聲音、語音、背景音樂等),通過融合多種模態特征,實現更準確、全面的標簽提取。3D卷積神經網絡主要依靠卷積層、池化層及全連接層,實現對圖像特征的提取與轉換操作。
2.3通過負反饋進行視頻推薦
負反饋一方面能夠幫助快速過濾候選推薦列表中用戶不喜歡的視頻項目,縮小計算范圍;另一方面,可以明確指示用戶偏好,使推薦結果更加個性化。因此,用戶的“舉報”行為、“不感興趣”點擊行為、過短的瀏覽時間、較低的視頻關鍵指標(如完播率、點贊量、評論量、轉發量、關注量)、彈幕評論的情感分析等,均可作為負反饋。
1)預處理階段
將這些負反饋數據與上述的視頻特征提取及用戶行為數據分析進行關聯,對數據進行歸一化等預處理操作。
2)訓練階段
訓練過程中,一方面在原有損失函數基礎上,加入針對負反饋的懲罰項,引入權重因子ω(ωgt;1),使調整后的損失函數更加關注負反饋樣本。假設原始損失函數為L0,針對負反饋單獨計算的損失為J,引入權重因子ω(ωgt;1)后,新的損失函數變為L1=L0+ω?J。由于ω大于1,負反饋帶來的損失被放大。另一方面,在梯度下降時,可將學習率α乘以系數β(βgt;1),以減少此類樣本的預測誤差。
3)預測階段
在將視頻特征和用戶行為輸入3D卷積和LSTM模型之前,先對負反饋信息進行編碼,轉化為特征向量F。然后將F與視頻的3D卷積特征A以及LSTM輸入的用戶行為特征O進行融合,得到新的特征向量G=[A;O;F],作為模型的輸入。這樣,模型在預測時能夠直接考慮負反饋對用戶偏好的影響。若某視頻的負反饋率較高,可在模型預測的喜好概率P上乘以調整因子γ(0lt;γlt;1),降低該視頻被推薦的可能性;也可以設定閾值θ,當Plt;θ時,將該視頻從推薦列表中排除。
3基于深度學習的短視頻推薦模型的優化建議
3.1數據處理方面
運用學習算法進行短視頻推薦時,既要保證數據量充足,又要確保收集渠道的合法性。數據收集過程中,務必向用戶明確告知數據的目的、范圍及使用方式,并取得用戶同意。涉及與合作伙伴、內容提供商、廣告商的數據共享,以及使用公開數據時,均須嚴格遵守版權規定。
在數據處理環節,首先應采取數據脫敏措施,對敏感信息進行加密和變形,防止信息泄露;其次,應構建基于最小權限原則的嚴格訪問控制機制,杜絕越權訪問;第三,要建立隱私合規審查機制,全面把控數據收集、存儲、使用及共享等環節;最后,應定期開展審計,排查潛在風險,筑牢隱私與數據安全防線。
3.2模型優化方面
3.2.1模型結構優化
短視頻特征提取時,應充分識別視頻中的關鍵物體和音頻特效,提升模型對各類短視頻數據的泛化能力。在3D卷積神經網絡部分,可嘗試引入殘差連接或密集連接結構。
殘差連接能夠幫助模型更好地捕捉長期依賴關系。例如,在分析用戶一段時間內的連續觀看行為時,早期層提取的基礎特征可通過殘差連接直接傳遞至較深層,與后續提取的高級特征融合,促進模型更全面地理解用戶興趣的演變,從而提升推薦準確性。密集連接則能豐富特征的多樣性。例如,淺層可能提取視頻的基礎視覺特征,中層提取用戶的短期興趣特征,深層提取長期興趣特征。通過密集連接,這些特征得以充分交互,模型能夠從多維度綜合考量各種信息,精準捕捉用戶對不同短視頻的潛在喜好,進而為用戶推薦更貼合興趣的視頻內容,提高推薦系統的召回率和精準度。
3.2.2負反饋優化
負反饋優化著重于進一步細化負反饋的類型和程度。以視頻觀看時長為例,觀看不足視頻時長10%視為強負反饋,10%至30%視為中等負反饋,依此類推。針對不同強度的負反饋,在損失函數中設置差異化權重,以強化模型對嚴重不感興趣內容的學習。此外,應定期分析負反饋數據,挖掘其中的共性特征,并將這些特征作為額外輸入或約束條件融入模型,提高模型的負反饋處理能力。
3.3訓練過程優化
目前采用的3D卷積神經網絡和LSTM算法均具備一定的自學習能力。為提升模型對數據特征的學習效果,常采用學習率衰減策略。訓練初期,使用較大學習率以快速搜索較優解區域;隨著訓練進行,逐步減小學習率,使模型在最優解附近精細調整參數。具體方法可采用階梯衰減(StepDecay)、指數衰減(Ex?ponentialDecay等,以提升訓練效果與可操作性)或自適應算法。(如Adam、RMSProp)此外,合理平衡批量大小與硬件資源至關重要,直接影響訓練效率、穩定性及硬件負載。對于超大模型或數據集,可將數據分割成多個小批次計算梯度,然后累加更新參數,模擬大批量效果,同時控制顯存占用。
4結束語
本文提出了一種融合3D卷積神經網絡、LSTM及負反饋機制的短視頻推薦模型,旨在解決精準推薦問題,避免“信息繭房”現象。3D卷積神經網絡具備強大的時空特征提取能力,能夠有效捕捉短視頻中的動態場景與視覺信息,為精準推薦提供內容基礎。LSTM擅長處理用戶行為序列,能夠深入學習用戶的長短期興趣模式,提升推薦的個性化程度,使推薦結果更貼合用戶需求。負反饋機制通過收集用戶跳過、快速關閉等負面反饋行為,使模型能夠及時調整推薦策略,減少不感興趣內容的推送,進一步優化推薦效果。基于該模型,本文從數據處理、模型優化和訓練過程三個方面提出優化建議。未來可在大規模真實短視頻平臺上驗證模型性能,并與其他深度學習推薦體系進行對比測試,以進一步完善和優化該模型。
參考文獻:
[1]張海.面對海量信息帶來的認知過載,怎么辦[N].環球網,2024-05-08(7).
[2]劉宇東,孫豪,蔣運承.融合內容相似度與多特征計算的個性化微博推薦模型[J].計算機科學,2020,47(10):97-101.
[3]許智宏,趙杏,董永峰,等.基于知識圖譜知識推理的視頻推薦算法[J].計算機工程與設計,2020,41(3):710-715.
[4]何濤.基于圖網絡和負反饋的視頻推薦系統研究與實現[D].南京:南京郵電大學,2023.
[5]徐繽榮.基于深度學習的短視頻智能推薦算法技術[J].信息技術,2024,48(2):143-147,153.
[6]馮勇,孫宇,徐紅艷,等.基于知識圖譜的短視頻實時推薦方法研究[J].遼寧大學學報(自然科學版),2023,50(4):302-311.
【通聯編輯:唐一東】