陽甫軍 李博



摘?要:隨著三網融合的不斷發展,傳統廣電媒體更需要建立一套完善的影視營銷推薦系統,將海量的影視資源精準有效的推薦給每一位用戶。在推薦系統中,協同過濾算法是應用較為廣泛的一種推薦方法。討論了傳統協同過濾算法在影視營銷中的應用,提出一種加權混合推薦算法,并將算法應用在影視營銷推薦場景中,推薦算法的精準度得到了一定提升。
關鍵詞:協同過濾;推薦算法;皮爾遜相似度
中圖分類號:F27?????文獻標識碼:A??????doi:10.19311/j.cnki.1672-3198.2019.17.024
隨著互聯網技術的不斷發展,三網融合為傳統廣播電視媒介帶來了新的發展機遇。影視行業也受到大眾的關注和喜愛,海量的影視資源爆炸性增長。傳統廣電媒體更需要建立合理的推薦系統,將海量的影視資源精準的推薦給用戶,用戶也能在平臺上快速找到自己喜歡的電影,提高用戶對廣電媒體平臺的依懶性,最終使得個性化的影視產品營銷服務成為現實。
本文的主要工作是建立用戶影視評價體系、得到用戶與影視產品的評價矩陣,結合協同過濾的個性化推薦思想,綜合考慮推薦系統中的矩陣稀疏性問題、冷啟動問題,對協同過濾算法進行改進,設計出一種混合推薦算法,并運用到實際推薦系統中,提高個性化影視資源推薦的精準度。
1?數據分析
本文的影視產品數據包含561288條用戶收視信息數據,這些數據來自1329位用戶和41876部影視。本文對這些數據進行數據清洗、數據規約之后,得到了部分用戶收視信息情況如圖1。
2?構建用戶影視評價體系
本系統采用隱式評分的方式構建評價體系,即根據用戶的收視行為數據進行模型構建,具體模型如下:
其中,Spij表示用戶i第p次觀看影視產品j的時長,λ表示用戶i觀看影視產品j的總次數。Tj表示影視產品j的總時長。ξij表示最終評分,式(3)表示將得到的ξij進行標準化處理。
同時,將隱式評分的等級分為5個等級,具體如表1所示。
根據上述的隱式評價模型,我們可以得到一個關于用戶與影視作品的評價矩陣,其散點圖如圖2所示。
3?協同過濾算法設計
協同過濾算法又稱社會過濾,其在不同的場景具有不同的運用,故算法種類較多。而在實踐中較為廣泛利用的協同過濾推薦算法主要有兩種,下文將具體分析。
3.1?基于內存的協同過濾算法
基于內存的協同過濾算法第一步是計算用戶之間的相似度,相似度可以衡量兩個用戶對影視作品之間的興趣程度。常用的相似性度量標準有余弦相似度、改進余弦相似度、皮爾遜相似度。其中ξi表示用戶對所有影視作品j的評分均值,ξi,j表示用戶i對影視作品j的評分值, Sik=Si∩Sk表示用戶i和用戶k都評價過的電影集合。其公式分別如下:
然后,將最大目標用戶相似度的用戶作為最鄰近用戶集合,鄰居用戶對目標影視作品未評分的進行預測評分。采用中心加權平均方法來計算目標用戶i對影視作品j的預測評分,評分r^i,j可表示為:
最后,根據評分高低得到推薦結果,基于內存的協同過濾算法流程圖如圖3。
3.2?基于模型的協同過濾算法
基于模型的協同過濾算法在實踐中運用廣泛,它可以通過矩陣分解、關聯算法、神經網絡、聚類算法等方法來進行實現。本文綜合考慮用戶與影視作品數據的稀疏性、算法的計算效率、影視作品冷啟動等問題,采用矩陣分解方法(SVD)完成協同過濾算法。
因此,需要將誤差平方和SSE降到最小即可。在本文推薦系統中,為了P和Q中所有值都全部更新,故選取常用的梯度下降法對其進行訓練。
3.3?混合推薦算法
上述兩種推薦算法都各自具有優缺點,但在實際過程中,不同的推薦算法往往適用于不同的場景,采用混合推薦算法更加精準。為了發揮不同推薦算法的優缺點,本文將上述兩種算法組合,對其推薦結果進行線性加權平均得到最終推薦結果,公式如下:
4?結果對比
4.1?評價標準
均方根誤差是衡量結果精準度的常用評價標準之一,其通過計算實際值與預測評值之間的誤差來判斷推薦結果的精準度。在本文場景中,RMSE (均方根誤差)公式見式(13)。均方根誤差越小,推薦系統的精準度越高。
4.2?評價分析
本文隨機采取5組評分數據對以上3種方法推薦結果精準度檢驗,將方法一記作UB- CF,方法二記作SVD,混合推薦算法記作P-CF。三種推薦算法最終實驗結果如圖4。
由圖可以看出,隨著測試次數的增加,混合推薦算法精準度更高。
5?結論
本文首先構建了用戶隱式評分模型,對于基于內存、模型兩種協同過濾算法進行了討論。針對這兩種算法的不足,提出了一種加權混合推薦算法,通過最后結果分析,混合推薦算法提高了算法的精準度和可適應性,更能滿足廣電媒體的個性化推薦影視作品的要求。
參考文獻
[1]劉青文.基于協同過濾的推薦算法研究[D].北京:中國科學技術大學,2013.
[2]尹航,常桂然,王興偉.采用聚類算法優化的K近鄰協同過濾算法[J].小型微型計算機系統,2013,34(4):806-809.
[3]顧軍華,官磊,張建.基于Hadoop的IPTV隱式評分模型[J].計算機應用,2017,(11):156-161.
[4]劉文佳,張駿.改進的協同過濾算法在電影推薦系統中的應用[J].現代商貿工業,2018,39(17):63-66.
[5]楊文娟,金子馨.基于聚類的協同過濾算法的研究[J].電腦知識與技術,2018,14(16):190-193.