999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種適用于農村電影放映的訂購推薦算法研究

2021-08-01 12:48:26王曉西
現代電影技術 2021年7期
關鍵詞:用戶實驗

王曉西

(中央宣傳部電影數字節目管理中心,北京 100866)

1 引言

農村電影放映服務是我國公共文化體系建設的重要組成部分,讓更多農民群眾能看到高質量、高水平的數字電影一直是公益電影工作者的追求。當前,農村電影市場年均供應影片超4000部、年均供應新片超600部。與其它電子商務系統類似,農村院線進行影片訂購時面臨著選片基數大的問題。因此,向各農村院線提供個性化影片訂購推薦服務是非常有必要的。

研究者們在推薦算法的精準性、實時性方面進行了大量的努力,但推薦算法的實際運用還需要結合目標系統的運營特點進行針對性優化。農村電影放映有其獨有特點,主要體現在幾個方面:一是區域性,農村電影放映主要面向廣大農村地區,不同地域的人民群眾受環境、語言、民族、文化等影響對電影的喜好不盡相同;二是引導性,院線在訂購影片過程中會受到包括“主題影片推薦活動”在內的影片訂購指導,“好片”“熱片”會出現扎堆訂購的情況;三是計劃性,院線訂購放映除受到政策、季節、氣候因素影響外,也受服務群體的影響,如給學校、景區等地放映的院線訂購影片相對集中。正是由于農村電影放映工作的獨特性,給各院線提供訂購推薦服務需要結合這些特點開展。

2 傳統基于用戶的協同過濾推薦算法

2.1 推薦算法的選擇

目前應用相對廣泛的推薦技術包括基于內容過濾的推薦技術、基于協同過濾的推薦技術、基于深度學習的推薦技術等。基于用戶的協同過濾推薦是基于協同過濾的推薦技術中的一種,其算法思想是通過發現近鄰用戶來完成推薦,比較適合于用戶數量不多、歷史行為豐富的使用場景。推薦算法都存在自身優缺點,在不同使用場景、不同數據源情況下推薦效果也存在差異,要結合在用系統的特點選擇合適的推薦算法。

根據“電影數字節目交易平臺”數據,2017年至2019年,全國農村院線年訂購影片場次均超過千萬場,年活躍訂購院線穩定在270余條,年可訂購影片均超過4000部,實際訂購影片超過90%。2018年至2019年,兩年合計在檔影片5110部,兩年都在檔影片3667部,年均新簽約影片超過600部,影片片種包括故事片、科教片、戲曲片、紀錄片及美術片。通過以上數據并結合上節內容可以看出:

(1)農村院線數量相對較少且固定;

(2)每年可訂購影片數量相對較多,影片有過檔下線及新片上映等情況;

(3)院線年訂購影片覆蓋面較廣,訂購場次基數較大且區分度較高。

綜上,在院線用戶數量固定、有豐富的歷史訂購行為數據、整體數據規模穩定等特征的農村電影放映場景下,適宜采用基于用戶的協同過濾推薦算法。

2.2 基于用戶的協同過濾推薦算法

傳統基于用戶的協同過濾推薦算法的應用思路是先計算查找與各院線有相似訂購偏好的近鄰院線,再從這些近鄰院線的歷史訂購影片中找到目標院線最可能會訂購的影片集合,最后按照對影片預測評分高低形成目標院線的影片推薦列表。在傳統算法應用過程中影響最終推薦質量的環節包括近鄰用戶的計算查找和推薦列表的形成。

2.2.1 近鄰用戶的計算查找

有高相似性偏好的兩個用戶稱為近鄰用戶,用戶之間的相似性可以通過他們對相同物品 (影片)的評分(訂購場次)來計算得到。在推薦算法中,用戶對物品的評分可以用向量來表示,向量間的距離越近相似性越高。

度量用戶間相似性方法有多種,比較常見的有:歐式相似性、余弦相似性及皮爾森相似性。其中,歐式相似性是通過多維向量空間中點間的絕對距離表示,余弦相似性是通過計算多維向量空間中用戶間向量夾角的余弦值來體現,皮爾森相似性是在用戶有共同評分的物品集 (訂購相同影片集)的基礎上衡量用戶間相關程度,其值介于-1 與1之間。相似性度量是算法的核心,直接影響近鄰用戶計算查找的準確性。

2.2.2 推薦列表的形成

得到用戶的近鄰用戶后,根據近鄰用戶對物品的實際評分預測用戶對該物品的評分。參考一定數量的近鄰用戶,綜合物品預測評分的高低產生推薦列表。假定N (u)為用戶u的參考近鄰用戶集合,那么用戶u對物品i的預測評分P計算公式如下:

參考近鄰用戶越多,計算復雜度越高。通常做法是在整個用戶集中,選擇與用戶相似性最高的前k個用戶作為近鄰集合,再根據公式 (1)計算預測評分,將分值較高的前N 個物品形成推薦列表推薦給用戶。

3 算法改進

本文在傳統基于用戶的協同過濾推薦算法基礎上,針對農村電影放映工作特點,提出了一種改進的協同過濾推薦算法。

3.1 評分預測模型修正

傳統協同過濾算法中評分預測計算公式如式(1)所示,可以簡化為:

公式中∑相似度*評分值給出了所有加權評分的總和,同時為了修正一個受到更多用戶評分的物品對結果產生更大的影響,將評分總和除以所有對這個物品有評分的用戶的相似度之和,進而得到最終針對某個物品的預測評分。

對于農村電影放映來說,由于存在院線訂片引導性問題,各類推薦影片會被院線廣泛訂購,擁有較大評分基礎。這些影片在做評分預測時不應該被削弱影響,而應擁有更多的貢獻權重。為解決這一問題,本文提出基于農村電影放映場景下的影片評分預測模型為:

影片預測評分=∑(院線相似度*院線評分值)

3.2 近鄰計算加權干預

協同過濾算法中近似鄰居的查找是通過計算用戶間相似性得到,不去考慮用戶對物品的評分行為。在農村電影放映工作中院線計劃性不同其訂購需求也是不同的,有些院線訂購影片相對集中、訂購場次相對均衡,也有院線訂購影片基數較大,訂購較為分散。如圖1,2018年至2019年間,在所示訂購影片部數區間里的院線數量整體呈正態分布趨勢,其中有超過50條院線訂購影片超過500部,也有超過70條院線訂購影片不足100部。

圖1 院線訂購影片部數分布

針對上述實際情況,本文引入加權參數lon表示兩條院線之間最小共同訂購影片的部數,院線相似性計算公式定義如下:

引入參數lon后,在計算院線相似性時將綜合院線訂購影片場次和院線訂購影片部數兩方面因素,可以減少訂購影片部數少的院線對訂購影片部數多的院線的干擾,提高近鄰院線的判定標準。參數lon取值與院線訂購影片部數len相關,lon計算公式定義如下:

式中,A,B表示院線訂購影片部數區間,C 為常數,α為加權因子。

3.3 優化推薦影片排序

傳統協同過濾推薦列表是根據對物品的預測評分高低排序形成,但在農村電影放映工作中需要考慮地域性觀影習慣的問題。如A 省觀眾喜愛觀看戲曲片,而B地院線幾乎不會訂購戲曲片,當A 省院線與B地院線經計算有較強相似性時,就可能會給B地院線推薦戲曲片,但顯然這不是一個高質量的推薦。為此,本文提出在形成推薦影片清單后,引入影片片種加權參數t,重新對推薦清單計算排序,形成最終推薦列表。加權系數t計算公式定義如下:

式中,R表示院線訂購影片片種場次比例,β為加權因子。

改進后推薦算法流程如圖2示。

圖2 改進算法流程圖

4 實驗設計與結果分析

4.1 實驗數據集

本文采用“電影數字節目交易平臺”2018 至2019兩年真實交易訂購數據集進行實驗,此數據集包括272條院線、4650部電影、90526條交易記錄。數據集統計信息如表1示,在設計算法時將數據集按80%:20%的比例劃分訓練集和測試集,訓練集用來構造測試模型,測試集用來評價算法質量。在實現算法時將級差標準化后的訂購場次值按0.1為刻度線性轉化為電影評分,評分范圍為1~10。本文所用數據集稀疏度為92.84%,屬于高稀疏度矩陣。

表1 實驗數據集分析

4.2 算法評價指標

本實驗中采用MAE (平均絕對誤差)、準確率和召回率對算法質量進行評估。在農村電影放映工作場景下,更加注重預測準確率和召回率指標。

算法評價指標中,MAE 用于度量推薦算法的預測評分與真實值之間的差異,MAE 值越小,預測準確性越高,推薦質量越高;準確率用于度量推薦列表中是否都是用戶喜歡的物品,即算法推薦成功的比率;召回率用于度量推薦列表中是否包含了用戶喜歡的全部物品,召回率反映了待推薦物品被推薦的比率。

4.3 實驗方案及結果分析

為驗證本文所提改進算法的推薦效果,設計了兩組實驗,首先是對不同相似性度量方法進行實驗,確定最佳的院線相似性度量方法;再在最佳的院線相似性度量方法基礎上按本文第3節提出的各項加權參數調優對比,以期得出在農村電影放映場景應用下,本文提出的各項優化方案確有實效且改進后的協同過濾算法在推薦效果上能明顯優于傳統推薦算法。

4.3.1 實驗一:確定最佳相似性度量方法

以皮爾森相似性、余弦相似性和歐式相似性三種相似性度量方法分別對數據集進行實驗,計算其MAE及準確率、召回率。協同過濾算法中近鄰數量k的值會影響算法性能,k 值取得過小參考項目不完整,影響推薦效果,k 值取得過大會增加系統計算復雜度,無關項目增多也會影響推薦結果。本文設定在推薦影片數量N=10的條件下,k的值從5增加到100,間隔增加為5,以此確定哪種相似性度量方法最優。實驗結果如圖3示。

從圖3結果能看出,皮爾森相似性相對于余弦相似及歐式相似性在MAE、推薦準確率及召回率方面有最優表現,且當近鄰院線數量k=5時,推薦效果最佳,準確率=12.3%,召回率=2.3%。如此,后續實驗將在皮爾森相似性度量方法基礎上進行。

圖3 不同相似性度量方法推薦效果對比

4.3.2 實驗二:算法改進和參數調優

(1)評分預測模型修正

按3.1節描述,將傳統協同過濾推薦中評分預測模型進行修正,放大熱門影片的預測評分貢獻。設定推薦影片數量N=10的條件下,k的值從5增加到50,間隔增加為5,對比評分預測模型修正前后的推薦效果,實驗結果如圖4示。

圖4 評分預測模型修正前后推薦效果對比

實驗結果表明,修正評分預測模型后推薦算法性能明顯優于傳統推薦算法。隨著近鄰院線數量k的增加,修正后推薦算法的推薦準確率和召回率整體呈現逐漸增高的趨勢,并在k>35時,增加趨勢變緩。如此,本文將近鄰院線數量k設定為35,后面的所有實驗都將在k=35的條件下進行。

(2)近鄰計算加權干預

按3.2節描述,引入參數lon對近鄰院線計算加權干預,減少訂購集中的院線對訂購廣泛的院線的干擾。公式(3)A、B的值與院線訂購影片部數分布相關,如圖1示,訂購影片部數 [0,120]區間內的院線有89條,訂購影片部數[120,350]區間內的院線有102條,訂購影片部數[350+]區間內的院線有81條,三個區間院線數量大體相同,設定區間A、B的值分別為120、350。常數C 為訂購影片超過350部的院線間相同訂購閾值,設定最小可參考相似性鄰居數量不低于80%,通過計算得到C值約為80。設定推薦影片數量N=10、近鄰院線數量k=35的條件下,加權因子α的值從0.5增加到0.95,間隔增加為0.05,對比近鄰計算加權前后的推薦效果,實驗結果如圖5示。

圖5 近鄰計算加權干預前后推薦效果對比

實驗結果表明,隨著近鄰計算加權因子的變化,加權后算法的推薦準確率和召回率整體呈現先增再減的趨勢,在加權因子α=0.75時效果最好,準確率達到36.5%,比未加權提高4.8%;召回率達到8.3%,比未加權提高4.7%。此時在區間 [120,350]內的院線采用其訂購影片部數的25%作為相同訂購閾值計算近鄰院線。后續實驗將在α=0.75的條件下進行。

(3)推薦列表優化排序

按3.3節描述,引入影片片種加權參數t平衡各地區群眾觀影習慣,優化推薦影片排序。設定推薦影片數量N=10、近鄰院線數量k=35、加權因子α=0.75的條件下,加權因子β的值從0增加到0.4,間隔增加為0.05,對比參數t引入前后的推薦效果,實驗結果如圖6示。

圖6 推薦影片排序優化前后推薦效果對比

實驗結果表明,隨著影片片種加權因子的變化,推薦準確率先增再減,推薦召回率呈逐漸減少趨勢。在加權因子β=0.15時準確率最高,達到37.3%,比未加權提高2.3%;召回率為8.5%,比未加權提高2.2%。

綜合上述兩組實驗結果可知,在傳統基于用戶的協同過濾推薦基礎上,通過修正評分預測模型、干預近鄰計算、優化推薦影片排序后,推薦算法準確率能達到37.3%,較優化前提升2倍,算法召回率能達到8.5%,較優化前提升約2.7倍,算法改進有效。

5 結語

本文通過對農村電影院線在影片訂購區域性、引導性、計劃性上的深入分析,不斷改進和優化傳統推薦算法,提出了一種適用于農村電影放映場景下的影片訂購推薦算法,實驗結果表明算法改進效果達到預期。但本文方法是在離線環境下計算并完成推薦,在線推薦還需要考慮影片檔期和計算時效性等問題,并且方法中對影片類型細分顆粒度還不夠,這些問題將在下一步研究工作中予以優化。

猜你喜歡
用戶實驗
記一次有趣的實驗
微型實驗里看“燃燒”
做個怪怪長實驗
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 精品国产91爱| 亚洲综合亚洲国产尤物| 99热免费在线| 国产精品密蕾丝视频| 2022精品国偷自产免费观看| 国产毛片高清一级国语| 五月激激激综合网色播免费| a级毛片毛片免费观看久潮| 久久semm亚洲国产| 久久久波多野结衣av一区二区| 亚洲一区二区三区中文字幕5566| 国产91丝袜在线播放动漫 | 国产成人91精品免费网址在线| 亚洲综合色婷婷中文字幕| 精品国产网| 亚洲码在线中文在线观看| 在线观看无码a∨| 午夜成人在线视频| 伊人激情综合网| 国产成人无码Av在线播放无广告| 久久久久人妻一区精品色奶水| 99热这里只有精品免费国产| 美女一级免费毛片| 国产av一码二码三码无码| 久久久91人妻无码精品蜜桃HD | 自偷自拍三级全三级视频 | 91免费国产在线观看尤物| 欧美日韩在线亚洲国产人| 色香蕉影院| 97av视频在线观看| 先锋资源久久| 久久亚洲高清国产| 国产主播在线观看| 久久精品波多野结衣| 国产一区成人| 亚洲精品无码久久毛片波多野吉| 青青青草国产| 波多野结衣中文字幕久久| 成人精品视频一区二区在线| 亚洲欧洲一区二区三区| 尤物午夜福利视频| 特级精品毛片免费观看| 欧美影院久久| 91福利在线看| 一级全黄毛片| 操美女免费网站| 玖玖精品在线| 欧美性久久久久| 无码高潮喷水在线观看| 999精品在线视频| 特级毛片免费视频| 大学生久久香蕉国产线观看 | 国产精品亚洲αv天堂无码| 国产成人一区| 国产在线麻豆波多野结衣| 国产va欧美va在线观看| 999国产精品| 人妻丰满熟妇啪啪| 国产高清自拍视频| 青青青国产在线播放| 欧美啪啪一区| 久久夜夜视频| 欧洲在线免费视频| 国产欧美日韩精品第二区| 国产成人久久综合一区| 免费一级成人毛片| 少妇精品网站| 色色中文字幕| 欧美三級片黃色三級片黃色1| 国产18在线| 亚洲欧美日韩成人在线| 亚洲一区二区日韩欧美gif| 2021国产精品自拍| 69免费在线视频| 色婷婷综合激情视频免费看| 一级黄色网站在线免费看| 亚洲精品成人片在线播放| 久久精品只有这里有| 一区二区三区四区日韩| 国产高清不卡视频| 欧美成人影院亚洲综合图| 88av在线|