999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的電影評分預測研究

2021-11-08 14:13:16李香君肖小玲
電腦知識與技術 2021年27期

李香君 肖小玲

摘要:本文依據電影是人們日常生活中重要的娛樂方式之一,用戶在選擇觀看一部電影前,通常會想通過已觀看過用戶對電影的評分或是評論來了解這部電影的是否值得觀看的需求。評分預測(rating prediction)在個性化推薦研究領域中可以被理解為:被用來作為預測用戶對那些尚沒有評價過的電影的評分的研究問題。本文工作首先對電影數據集進行數據預處理,隨后重點研究了支持向量機(SVM)回歸預測對電影評分進行預測,實驗結果MAE的值表明支持向量機(SVM)回歸預測在電影評分預測中取得較好的預測。

關鍵詞:支持向量機;MAE;回歸預測

中圖分類號:TP311文獻標識碼:A

文章編號:1009-3044(2021)27-0109-03

Abstract: In this paper, the film is one of the important ways of entertainment in people's daily life. Before people choose to watch a film, they usually want to know the quality of a film through film rating or comments. In the field of personalized recommendation research, rating prediction can be understood as a research problem that is used to predict users' ratings of movies that have not been evaluated. This paper first preprocesses the movie data set, and then focuses on the support vector machine (SVM) regression prediction to predict the movie score. The experimental results show that the MAE value of support vector machine (SVM) regression prediction achieves better prediction in the movie score prediction.

Key words: Support vector machine; MAE;Regression prediction

1引言

現如今隨著影音、書籍等垂直網站的快速發展,已經購買或觀看過的用戶對產品或服務的評分評價,已經逐漸發展成了一種重要的信息載體的趨勢,據有關視頻網站上的數據表明,借助社交媒體平臺表達自己觀點和想法的用戶數量有呈指數增長的趨勢,并且越來越多的用戶會在觀看電影前都會先關注電影的評分以及其他用戶對此電影的評價,以此來作為是否觀看電影的有力依據。通過對電影評分的直觀查閱,這是一種可以幫助用戶在是否觀看此電影的決策過程中提供其他用戶意見的一種快速有效的方式。

由于電影的評分預測相對來說難度較大,缺乏一套成熟并科學的預測方法。在為了實現對電影評分的準確預測需求上,本文在進行了相關電影推薦學習中評分預測研究的基礎上,結合影響用戶評分的特征實際情況與基于機器學習算法進行建模預測-基于支持向量機(SVM)回歸預測模型,主要目的是構建預測效果較好的分類模型來預測用戶對電影的評分。

2相關技術

本文基于機器學習算法進行建模預測-基于支持向量機(SVM)回歸預測模型。首先我們對SVR模型進行初始化,將訓練組數據輸入到帶有貝葉斯調參的10折交叉驗證程序中進行訓練,再將得到的最優超調參數帶入到處理過的預測組數據輸入進行預測,計算其MAE值。

2.1余弦相似度

余弦相似度,實現過程如下:先計算兩個向量夾角的余弦值,然后用計算的夾角余弦值對這兩個向量的相似度進行評估。在數據挖掘的研究中,余弦相似度通常會被作為集群內部凝聚力的一種度量。

應用在文本中,首先需要將兩段文本進行分詞的操作,再依據這兩個文本中的詞建立兩個向量,然后計算這兩個向量的夾角余弦值,通過余弦值得到這兩個文本在統計學方法中的相似度情況。依據余弦值范圍來判斷相似度:若求取的范圍落在[-1,1]之間:余弦值如果越趨近于1,則是代表這兩個向量的方向呈現越吻合,表現為越相似;余弦值如果越趨近于-1,這兩個向量的方向就呈現越相反;若接近于0,則表示這兩個向量近乎于正交。

2.2 SVR

SVR支持向量回歸,這是一種“寬容的回歸模型”,寬容的支持向量回歸(SVR)模型[1]的模型函數是一個線性函數:y=ωx+b。

SVR支持向量回歸,算法的實現是通過在線性函數的兩側制造一個“間隔帶”,是否將樣本計入損失函數與樣本與間隔帶的關系有關,若樣本是落入間隔帶中間將不會被計入損失函數;若樣本落入間隔帶之外則會被計入損失函數。最優化模型問題,是通過最小化間隔帶的寬度和總損失解決的。在落在隔離帶邊緣之外的,或者是落在隔離帶邊緣上的,才會被計入最后的損失中。

3支持向量回歸的電影評分預測實驗

3.1數據源

本文采用movies、ratings、tags等數據集。由于數據集過大,本論文中只選取前10000條進行研究。調用pandas庫讀取三個數據文件并保存為CSV文件。采用用隨機分配的方式對測試集和訓練集進行劃分,確定訓練集與測試集的比例為7:3。通過pandas中read_table函數讀取數據文件,并為其關鍵字命名。其中數據文件包括ratings.dat、tags.dat、movies.dat。

主站蜘蛛池模板: 亚洲视频一区在线| 中文字幕资源站| 亚洲综合九九| 999精品免费视频| 免费无码一区二区| 亚洲中文无码av永久伊人| 日韩第一页在线| 精品国产中文一级毛片在线看| 在线免费观看AV| 青青草原国产av福利网站| 日本影院一区| 国产精品久久久精品三级| 中国美女**毛片录像在线| 亚洲成人黄色在线观看| 国产一级二级三级毛片| 欧美精品影院| 中文字幕2区| 国产三级毛片| 亚洲天堂区| 福利视频99| 亚洲色婷婷一区二区| 手机精品视频在线观看免费| 在线亚洲小视频| 免费播放毛片| 99热这里都是国产精品| 丝袜久久剧情精品国产| 国产嫖妓91东北老熟女久久一| 日韩人妻无码制服丝袜视频| 欧美精品亚洲精品日韩专区| 亚洲开心婷婷中文字幕| 国产簧片免费在线播放| 亚洲狼网站狼狼鲁亚洲下载| 无码福利日韩神码福利片| 欧美黄网在线| 久久久精品久久久久三级| 99热这里只有精品5| 视频二区亚洲精品| 青青草原国产精品啪啪视频| 欧美笫一页| 91色爱欧美精品www| 日本道中文字幕久久一区| 成人日韩精品| 香蕉国产精品视频| 欧美有码在线观看| 97久久免费视频| AV在线麻免费观看网站| 国产区在线看| 最新国产你懂的在线网址| 亚洲色图另类| 国产国产人在线成免费视频狼人色| 国产日韩欧美视频| 婷婷六月综合网| 亚洲综合色婷婷中文字幕| 亚洲啪啪网| 国产一区二区丝袜高跟鞋| 中文字幕 91| 国产精品久久久久无码网站| 国产精品三级av及在线观看| 天天色综合4| jizz国产视频| 国产丝袜无码精品| 亚洲精品无码AV电影在线播放| 毛片免费高清免费| 亚洲视频一区| 美女免费黄网站| 亚洲欧州色色免费AV| 黄色污网站在线观看| 99热这里只有精品久久免费| 无码高潮喷水专区久久| 天天综合色网| 18禁黄无遮挡免费动漫网站| 亚洲成a人片在线观看88| 亚洲精品日产精品乱码不卡| 97青草最新免费精品视频| 在线观看国产网址你懂的| 亚洲日本一本dvd高清| 一本无码在线观看| 一本视频精品中文字幕| 在线精品欧美日韩| 中文无码精品A∨在线观看不卡| 精品一区二区三区自慰喷水| 亚国产欧美在线人成|