999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的電影評分預測研究

2021-11-08 14:13:16李香君肖小玲
電腦知識與技術 2021年27期

李香君 肖小玲

摘要:本文依據電影是人們日常生活中重要的娛樂方式之一,用戶在選擇觀看一部電影前,通常會想通過已觀看過用戶對電影的評分或是評論來了解這部電影的是否值得觀看的需求。評分預測(rating prediction)在個性化推薦研究領域中可以被理解為:被用來作為預測用戶對那些尚沒有評價過的電影的評分的研究問題。本文工作首先對電影數據集進行數據預處理,隨后重點研究了支持向量機(SVM)回歸預測對電影評分進行預測,實驗結果MAE的值表明支持向量機(SVM)回歸預測在電影評分預測中取得較好的預測。

關鍵詞:支持向量機;MAE;回歸預測

中圖分類號:TP311文獻標識碼:A

文章編號:1009-3044(2021)27-0109-03

Abstract: In this paper, the film is one of the important ways of entertainment in people's daily life. Before people choose to watch a film, they usually want to know the quality of a film through film rating or comments. In the field of personalized recommendation research, rating prediction can be understood as a research problem that is used to predict users' ratings of movies that have not been evaluated. This paper first preprocesses the movie data set, and then focuses on the support vector machine (SVM) regression prediction to predict the movie score. The experimental results show that the MAE value of support vector machine (SVM) regression prediction achieves better prediction in the movie score prediction.

Key words: Support vector machine; MAE;Regression prediction

1引言

現如今隨著影音、書籍等垂直網站的快速發展,已經購買或觀看過的用戶對產品或服務的評分評價,已經逐漸發展成了一種重要的信息載體的趨勢,據有關視頻網站上的數據表明,借助社交媒體平臺表達自己觀點和想法的用戶數量有呈指數增長的趨勢,并且越來越多的用戶會在觀看電影前都會先關注電影的評分以及其他用戶對此電影的評價,以此來作為是否觀看電影的有力依據。通過對電影評分的直觀查閱,這是一種可以幫助用戶在是否觀看此電影的決策過程中提供其他用戶意見的一種快速有效的方式。

由于電影的評分預測相對來說難度較大,缺乏一套成熟并科學的預測方法。在為了實現對電影評分的準確預測需求上,本文在進行了相關電影推薦學習中評分預測研究的基礎上,結合影響用戶評分的特征實際情況與基于機器學習算法進行建模預測-基于支持向量機(SVM)回歸預測模型,主要目的是構建預測效果較好的分類模型來預測用戶對電影的評分。

2相關技術

本文基于機器學習算法進行建模預測-基于支持向量機(SVM)回歸預測模型。首先我們對SVR模型進行初始化,將訓練組數據輸入到帶有貝葉斯調參的10折交叉驗證程序中進行訓練,再將得到的最優超調參數帶入到處理過的預測組數據輸入進行預測,計算其MAE值。

2.1余弦相似度

余弦相似度,實現過程如下:先計算兩個向量夾角的余弦值,然后用計算的夾角余弦值對這兩個向量的相似度進行評估。在數據挖掘的研究中,余弦相似度通常會被作為集群內部凝聚力的一種度量。

應用在文本中,首先需要將兩段文本進行分詞的操作,再依據這兩個文本中的詞建立兩個向量,然后計算這兩個向量的夾角余弦值,通過余弦值得到這兩個文本在統計學方法中的相似度情況。依據余弦值范圍來判斷相似度:若求取的范圍落在[-1,1]之間:余弦值如果越趨近于1,則是代表這兩個向量的方向呈現越吻合,表現為越相似;余弦值如果越趨近于-1,這兩個向量的方向就呈現越相反;若接近于0,則表示這兩個向量近乎于正交。

2.2 SVR

SVR支持向量回歸,這是一種“寬容的回歸模型”,寬容的支持向量回歸(SVR)模型[1]的模型函數是一個線性函數:y=ωx+b。

SVR支持向量回歸,算法的實現是通過在線性函數的兩側制造一個“間隔帶”,是否將樣本計入損失函數與樣本與間隔帶的關系有關,若樣本是落入間隔帶中間將不會被計入損失函數;若樣本落入間隔帶之外則會被計入損失函數。最優化模型問題,是通過最小化間隔帶的寬度和總損失解決的。在落在隔離帶邊緣之外的,或者是落在隔離帶邊緣上的,才會被計入最后的損失中。

3支持向量回歸的電影評分預測實驗

3.1數據源

本文采用movies、ratings、tags等數據集。由于數據集過大,本論文中只選取前10000條進行研究。調用pandas庫讀取三個數據文件并保存為CSV文件。采用用隨機分配的方式對測試集和訓練集進行劃分,確定訓練集與測試集的比例為7:3。通過pandas中read_table函數讀取數據文件,并為其關鍵字命名。其中數據文件包括ratings.dat、tags.dat、movies.dat。

主站蜘蛛池模板: 99精品在线看| 日韩无码一二三区| 美女无遮挡免费视频网站| 亚洲婷婷六月| 亚洲日韩精品综合在线一区二区| 欧美日韩导航| 国产成人a在线观看视频| 国产在线观看一区二区三区| 亚洲天堂免费| 亚洲成人在线免费| 国产成人8x视频一区二区| 国产精品2| 曰韩免费无码AV一区二区| 熟妇丰满人妻| 欧美一区精品| 亚洲国产清纯| 国产成人综合亚洲欧美在| 国产精品无码作爱| 亚洲精品午夜无码电影网| 最新国产网站| 欧美高清视频一区二区三区| 四虎亚洲精品| 久久精品亚洲专区| 在线人成精品免费视频| 一本大道在线一本久道| AV无码一区二区三区四区| 成年人免费国产视频| 一级黄色欧美| 黄色网在线| 人妻无码AⅤ中文字| 亚洲视频欧美不卡| 怡红院美国分院一区二区| 成人午夜久久| 国产成人1024精品| 国产精品亚洲αv天堂无码| 中文字幕在线永久在线视频2020| 亚洲AⅤ波多系列中文字幕| 女人18毛片一级毛片在线 | 亚洲有码在线播放| 国产精品冒白浆免费视频| 欧美福利在线播放| 国产成人精彩在线视频50| 亚洲三级电影在线播放| 丁香五月激情图片| 亚洲人成人无码www| 国产经典免费播放视频| 无码专区第一页| 精品国产免费观看一区| 黄色一及毛片| 青青久久91| 91高清在线视频| 日韩一区二区三免费高清| 伊人中文网| 免费观看国产小粉嫩喷水| 国产亚洲视频播放9000| 91精品情国产情侣高潮对白蜜| 婷婷六月在线| 亚洲AⅤ波多系列中文字幕| 原味小视频在线www国产| 亚洲日本精品一区二区| 国产aaaaa一级毛片| 亚洲综合狠狠| 成人午夜天| www.99在线观看| 日韩国产亚洲一区二区在线观看| 老色鬼久久亚洲AV综合| 国产精品私拍99pans大尺度| 精品国产成人国产在线| 中国国产一级毛片| 亚洲品质国产精品无码| 亚洲第一视频免费在线| 亚洲中文字幕国产av| 亚洲av无码久久无遮挡| 亚洲综合色区在线播放2019| 日本一区二区三区精品AⅤ| 国产一区二区在线视频观看| 中文字幕第4页| 久久这里只精品国产99热8| 日韩欧美中文字幕在线精品| 黄色网站在线观看无码| 性喷潮久久久久久久久| 欧美国产精品不卡在线观看 |