999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于時(shí)間序列預(yù)測(cè)模型的電視劇收視率預(yù)測(cè)

2018-01-26 04:58:04紹興市第一中學(xué)陸文昊
電子世界 2018年1期
關(guān)鍵詞:模型

紹興市第一中學(xué) 陸文昊

1.前言

電視劇的熱度是對(duì)其影響力和關(guān)注度的綜合衡量指標(biāo)。為了在目前“多屏模式”下找到電視劇熱度的影響因素,并且提出更綜合、客觀的衡量指標(biāo),國(guó)內(nèi)外專家學(xué)者進(jìn)行了很多針對(duì)性的研究。主要可以分為兩類:

(1)單一預(yù)測(cè)模型,如:梁招娣等基于RBF神經(jīng)網(wǎng)絡(luò)對(duì)電視收視率進(jìn)行預(yù)測(cè)[1],汪洋等基于BP神經(jīng)網(wǎng)絡(luò)建立收視率預(yù)測(cè)模型[2],張春燕等利用ARMA模型對(duì)在線電視劇流行度進(jìn)行預(yù)測(cè)[3],毋世曉等人利用移動(dòng)平均法預(yù)測(cè)網(wǎng)站電視劇視頻點(diǎn)擊量[4]等等。

(2)組合預(yù)測(cè)模型,如:張茜等基于TEI@I方法,提出了對(duì)綜藝節(jié)目收視率預(yù)測(cè)的研究框架,引入了新的解釋變量百度指數(shù)和新浪微指數(shù),并采用模型集成技術(shù)顯著提高了預(yù)測(cè)精度[5]。黃玲莉等基于ARIMA與BP神經(jīng)網(wǎng)絡(luò),建立了收視率組合預(yù)測(cè)模型[6]。

對(duì)比前人的研究成果,我們發(fā)現(xiàn)組合模型的效果比單一模型更加出色。因此,本文在前人已有研究的基礎(chǔ)上,綜合運(yùn)用了多種機(jī)器學(xué)習(xí)模型,對(duì)影響電視劇熱度的因素進(jìn)行了系統(tǒng)的研究。

2.收視率單一時(shí)序預(yù)測(cè)模型的構(gòu)建和優(yōu)化

2.1 數(shù)據(jù)收集和預(yù)處理

本研究選取了2015年到2017年期間首播的共23部完結(jié)的電視劇作為研究對(duì)象,這些電視劇包含了不同種類的收視率變化模式,均屬于該種類中較為典型的電視劇,可以比較全面的反應(yīng)不同的收視率變化情況,確保了模型的廣泛性與合理性。

研究中所有的收視率數(shù)據(jù)均為索福瑞CSM52城收視率統(tǒng)計(jì)值,電視劇的基本信息(如首播日期、播出衛(wèi)視、每天播放集數(shù))等信息來(lái)源于百度百科,所有的原始數(shù)據(jù)都存儲(chǔ)在補(bǔ)充材料的excel表格中。

2.2 建立AR(2)模型進(jìn)行預(yù)測(cè)

首先,本文使用二階自回歸的時(shí)序預(yù)測(cè)模型,利用電視劇前 集的收視率數(shù)據(jù)來(lái)預(yù)測(cè)最后三集的收視率。其中該模型的基本假設(shè)為:

(1)電視劇收視率變化平穩(wěn),不會(huì)因?yàn)橥饨缫蛩氐呐R時(shí)干擾而發(fā)生突變;

(2)不同時(shí)間的電視劇收視率統(tǒng)計(jì)方法一致,能夠反映電視劇的受關(guān)注程度。

本文基于以上的模型假設(shè),建立了二階自回歸模型,即AR(2)模型。若假設(shè) 代表第 集電視劇的收視率,那么該模型的表達(dá)式為:

利用excel自帶的數(shù)據(jù)分析工具進(jìn)行擬合,此處以2017年收視率榜首電視劇《人民的名義》為例進(jìn)行模型的訓(xùn)練和求解。其中訓(xùn)練集和測(cè)試集分別為:

(1)訓(xùn)練集:《人民的名義》前29天、共47集的收視率作為訓(xùn)練集。

(2)測(cè)試集:《人民的名義》最后3天、共5集的收視率作為測(cè)試集。

經(jīng)過(guò)excel的擬合分析,得到《人民的名義》二階自回歸擬合的表達(dá)式為:

用同樣的方法,對(duì)其余的22部電視劇建立AR(2)模型,分別作出收視率的預(yù)測(cè)分析。結(jié)果發(fā)現(xiàn),對(duì)于部分電視劇來(lái)說(shuō),該模型的預(yù)測(cè)性能比較好,如《平凡的世界》RMSE=0.056,《北上廣不相信眼淚》RMSE=0.051,《外科風(fēng)云》RMSE=0.077。

而對(duì)于另外一些電視劇,該模型的預(yù)測(cè)性能比較差,例如《孤芳不自賞》RMSE=0.534,《于成龍》RMSE=0.583,《親愛(ài)的翻譯官》RMSE=0.683。

由此可見(jiàn),最簡(jiǎn)單的AR(2)時(shí)序預(yù)測(cè)模型僅能實(shí)現(xiàn)一定程度的預(yù)測(cè)功能,其局限性主要體現(xiàn)在以下兩個(gè)方面:

(1)只能描述數(shù)據(jù)分布規(guī)律中的線性特征,而難以刻畫數(shù)據(jù)分布的非線性關(guān)系。這就使該模型對(duì)于基本符合線性增長(zhǎng)趨勢(shì)的電視劇收視率與測(cè)量好,而對(duì)于波動(dòng)性較大的電視劇收視率難以精準(zhǔn)預(yù)測(cè);

(2)部分模型存在過(guò)擬合的問(wèn)題,將數(shù)據(jù)中的噪聲當(dāng)做了信號(hào)進(jìn)行處理,有些參數(shù)的p-value不能通過(guò)0.05顯著性水平檢測(cè)。

2.3 對(duì)數(shù)據(jù)和模型進(jìn)行優(yōu)化處理

2.3.1 對(duì)收視率數(shù)據(jù)異常點(diǎn)的處理

通過(guò)對(duì)部分電視劇測(cè)試結(jié)果的深入研究,發(fā)現(xiàn)部分預(yù)測(cè)收視率與真實(shí)收視率差距較大的電視劇,都存在兩種不一樣的播放模式。例如《武媚娘傳奇》有單集播放的、也有三集連播的;《人民的名義》有單機(jī)播放的、也有兩集連播的。

為確定“收視率異常下降”與“當(dāng)日單集播放”之間的關(guān)系,我們對(duì)23部電視劇中有不同播放模式的17部電視劇進(jìn)行了統(tǒng)計(jì)分析,得到了如表格1所示的結(jié)論。此處,“收視率異常下降”定義為“該天的收視率明顯小于本電視劇收視率的線性增長(zhǎng)趨勢(shì)”。

表1 對(duì)17部電視劇“收視率異常下降”天數(shù)特征的統(tǒng)計(jì)分析

由表格1可以非常明顯地看出,在所有的考察對(duì)象的單集播放日中,“收視率異常下降”事件出現(xiàn)的概率遠(yuǎn)遠(yuǎn)高于所有播放日的平均概率。所以我們認(rèn)為,“單集播放”是與“收視率異常下降”存在緊密的聯(lián)系。

所以,我們首先對(duì)于研究對(duì)象電視劇的所有單集播放日中“收視率異常下降”的數(shù)據(jù)進(jìn)行了修正,采用均值插值的方法,替換掉原有的收視率異常點(diǎn)。修正后的收視率等于單集播放日前后的收視率平均值。

2.3.2 將AR(2)模型優(yōu)化為ARMA(2,3)模型

在完成對(duì)單集播放日異常點(diǎn)的修正后,部分電視劇依然存在比較大的波動(dòng)性。因此,進(jìn)一步優(yōu)化模型,引入移動(dòng)平均的優(yōu)化計(jì)算,對(duì)波動(dòng)劇烈的曲線進(jìn)行平滑濾波,從而降低波動(dòng)性帶來(lái)的影響,更容易地把握住數(shù)據(jù)分布的線性趨勢(shì)。因此進(jìn)一步將AR模型優(yōu)化為ARMA模型。

在ARMA(p,q)的模型識(shí)別和定階過(guò)程中,我們以《人民的名義》電視劇為樣例,對(duì)p、q兩個(gè)參數(shù)采取逐步試探法以獲得最佳值。經(jīng)過(guò)多次嘗試,確定收視率預(yù)測(cè)的最佳模型為ARMA(2,3)。在對(duì)單集播放日的異常點(diǎn)修正后,利用matlab實(shí)現(xiàn)ARMA的預(yù)測(cè)功能,再次對(duì)表2-4中曾經(jīng)對(duì)AR(2)模型表現(xiàn)不佳的電視劇進(jìn)行預(yù)測(cè),得到新的預(yù)測(cè)結(jié)果為《孤芳不自賞》RMSE=0.235,《于成龍》RMSE=0.462,《親愛(ài)的翻譯官》RMSE=0.383.

可以看出,經(jīng)過(guò)對(duì)數(shù)據(jù)集的修正和對(duì)模型的優(yōu)化之后,原先AR(2)預(yù)測(cè)表現(xiàn)不佳的電視劇預(yù)測(cè)性能都有了一定的提升。改變最大的電視劇《親愛(ài)的翻譯官》,其均方誤差降低了44%,其他電視劇的均方誤差也有10%-30%不等的下降。

2.4 總結(jié)與討論

本章節(jié)采用單一的時(shí)序預(yù)測(cè)模型,對(duì)23部研究對(duì)象電視劇進(jìn)行了逐一的預(yù)測(cè)。在AR(2)模型的基礎(chǔ)上,一方面深入分析了異常點(diǎn)的規(guī)律和特征,對(duì)異常點(diǎn)進(jìn)行了修正;另一方面在模型中加入了移動(dòng)平均的過(guò)程,將模型優(yōu)化為ARMA(2,3)。最終可以看到,ARMA(2,3)模型在修正后的數(shù)據(jù)集上,表現(xiàn)出的預(yù)測(cè)性能比AR(2)在原數(shù)據(jù)集上的性能要優(yōu)秀很多。

雖然目前的預(yù)測(cè)模型得到了一定的優(yōu)化,例如《人民的名義》預(yù)測(cè)RMSE從0.3285降低到了0.2376,但該模型依舊存在一定的問(wèn)題。其最核心的問(wèn)題在于該模型依舊只能描述數(shù)據(jù)的線性變化趨勢(shì),對(duì)于變量之間非線性的變化關(guān)系十分無(wú)力。

為了進(jìn)一步提高預(yù)測(cè)的精確程度,我們從前人的工作中得到啟發(fā),嘗試采用組合模型來(lái)進(jìn)行預(yù)測(cè),一方面利用ARMA模型的線性描述能力,另一方面利用BP神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)能力,二者相結(jié)合地展開(kāi)后續(xù)的預(yù)測(cè)工作。

3.ARMA-BP神經(jīng)網(wǎng)絡(luò)組合預(yù)測(cè)模型

3.1 模型構(gòu)造思路

經(jīng)過(guò)前文的分析和預(yù)測(cè),我們發(fā)現(xiàn)節(jié)目的收視率會(huì)受到很多因素的影響。哪怕對(duì)一些異常點(diǎn)進(jìn)行修正和調(diào)整,節(jié)目的收視率也會(huì)有一定的波動(dòng)性和無(wú)序性。所以,僅憑線性的模型是無(wú)論如何也無(wú)法進(jìn)行精準(zhǔn)擬合的。由于基于回歸的分析方法能夠提取出數(shù)據(jù)的線性特征,而神經(jīng)網(wǎng)絡(luò)對(duì)非線性關(guān)系有很強(qiáng)的逼近能力。所以我們?cè)谇叭搜芯康膯l(fā)之下,選擇使用ARMA模型與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,進(jìn)行收視率的預(yù)測(cè)分析。

對(duì)目前要預(yù)測(cè)的收視率序列rate來(lái)說(shuō),每個(gè)數(shù)值都可以表示為:

其中Lt表示該序列中規(guī)律的線性部分,對(duì)該部分ARMA模型有很好的擬合能力;而NLt表示該序列中的非線性部分,這部分能夠使用 BP神經(jīng)網(wǎng)絡(luò)來(lái)逼近求解,因此該組合模型的整體構(gòu)造思路分以下幾步:

(1)用一個(gè)樣本電視劇確定ARMA(p,q)模型的階次,通過(guò)逐步試探的方法進(jìn)行識(shí)別、定階。在2.3.2節(jié)中,我們利用了《人民的名義》作為樣本電視劇,確定了該模型最佳的階次為 ARMA(2,3)。

(2)用ARMA(2,3)模型進(jìn)行ratet預(yù)測(cè),假設(shè)預(yù)測(cè)的結(jié)果為。這代表了第 個(gè)點(diǎn)的預(yù)測(cè)值,而代表了該點(diǎn)的預(yù)測(cè)殘差。

(4)利用ARMA(2,3)與BP神經(jīng)網(wǎng)絡(luò)兩種模型的預(yù)測(cè)結(jié)果組合后作為最終的預(yù)測(cè)結(jié)果,即在 點(diǎn)的預(yù)測(cè)結(jié)果為

整體構(gòu)造過(guò)程如圖1所示。

圖1 ARMA-BP神經(jīng)網(wǎng)絡(luò)構(gòu)造流程圖

3.2 模型求解過(guò)程

以《人民的名義》電視劇為例,利用1—26天的收視率作為訓(xùn)練集,27—29天的收視率作為測(cè)試集,檢驗(yàn)該模型的預(yù)測(cè)性能。

首先利用2.3.2節(jié)中提到的ARMA(2,3)模型,用前26天的收視率進(jìn)行訓(xùn)練。利用matlab完成模型訓(xùn)練過(guò)程,計(jì)算出第5天至第26天的真實(shí)收視率與預(yù)測(cè)收視率。之后,將22個(gè)預(yù)測(cè)殘差作為BP神經(jīng)網(wǎng)絡(luò)的期望輸出。然后將原始收視率數(shù)據(jù)以最大收視率為基準(zhǔn)進(jìn)行歸一化處理,歸一化后的數(shù)據(jù)設(shè)為 。之后對(duì)歸一化后的數(shù)據(jù)進(jìn)行相空間重構(gòu),根據(jù)實(shí)際情況,確定重構(gòu)階數(shù)為5階,即通過(guò)生成一組5維的收視率空間向量。將重構(gòu)后的數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)輸入。

利用matlab實(shí)現(xiàn)3層BP神經(jīng)網(wǎng)絡(luò),利用 newff 函數(shù)構(gòu)建網(wǎng)絡(luò),其中隱含層數(shù)目經(jīng)過(guò)多次試探驗(yàn)證設(shè)置為8。隱含層傳遞函數(shù)為tansig,輸出層的傳遞函數(shù)設(shè)為 purein,訓(xùn)練函數(shù)采用 trainm。經(jīng)過(guò)282次學(xué)習(xí)后,精度達(dá)到了預(yù)設(shè)的0.001的要求。

將訓(xùn)練后的ARMA(2,3)模型和BP神經(jīng)網(wǎng)絡(luò)模型共同用于對(duì)《人民的名義》最后三天收視率的預(yù)測(cè),結(jié)果顯示組合模型能夠的均方誤差為 ,預(yù)測(cè)性能超過(guò)之前所有的單獨(dú)預(yù)測(cè)模型。由此可見(jiàn),ARMA-BP神經(jīng)網(wǎng)絡(luò)模型通過(guò)分別擬合線性部分和非線性部分,實(shí)現(xiàn)了更加精準(zhǔn)的預(yù)測(cè)性能,更適合用于電視劇的收視率預(yù)測(cè)中。

[1]周小普,韓瑞娜,凌姝.多屏發(fā)展背景下網(wǎng)絡(luò)收視度的影響因素研究——以熱播電視劇為例[J].國(guó)際新聞界,2014,(12):114-129.

[2]侯衛(wèi)星,高建中.基于因子分析法的城市低碳經(jīng)濟(jì)實(shí)證評(píng)價(jià)——以太原市為例[J].企業(yè)經(jīng)濟(jì),2012,(06):15-19.

[3]張輝,王雯聰.基于多元統(tǒng)計(jì)分析方法研究電視劇收視特征及影響因素[J].現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào)),2011,(06):101-103+126.

[4]耿金花,高齊圣,張嗣瀛.基于層次分析法和因子分析的社區(qū)滿意度評(píng)價(jià)體系[J].系統(tǒng)管理學(xué)報(bào),2007,(06):673-677.

[5]何躍,蔡博馳.基于因子分析法的微博熱度評(píng)價(jià)模型[J].統(tǒng)計(jì)與決策,2016,(18):52-54.

[6]劉志.模糊層次分析法在電視劇評(píng)價(jià)中的應(yīng)用[J].安徽廣播電視大學(xué)學(xué)報(bào),2014,(02):57-60.

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 91小视频版在线观看www| 亚洲国产成人综合精品2020| 看国产毛片| 国产系列在线| 日韩毛片基地| 国产第一页第二页| a色毛片免费视频| 自慰网址在线观看| 色综合久久无码网| 亚洲全网成人资源在线观看| 女同国产精品一区二区| 人人看人人鲁狠狠高清| 日韩精品高清自在线| 国产午夜人做人免费视频中文| 国产日韩精品欧美一区喷| 午夜无码一区二区三区| 在线观看视频99| 国产精品永久在线| 国产性爱网站| 欧美精品另类| 欧美午夜在线视频| 高清久久精品亚洲日韩Av| 亚洲中文无码av永久伊人| 久久a毛片| 亚洲综合在线网| 亚洲AV无码乱码在线观看裸奔 | 国产午夜福利在线小视频| 91在线免费公开视频| 国产精品妖精视频| 伊人久久大香线蕉成人综合网| 国产av剧情无码精品色午夜| jijzzizz老师出水喷水喷出| 亚洲无码精彩视频在线观看| 日韩人妻无码制服丝袜视频| 日韩欧美国产中文| 国产xx在线观看| 国产美女精品在线| 日本欧美精品| 毛片视频网| 亚洲人成网站色7777| 日韩第八页| 99久久精品视香蕉蕉| 99国产精品一区二区| 新SSS无码手机在线观看| 国产主播在线观看| 中文无码毛片又爽又刺激| 国产精鲁鲁网在线视频| 成人国产精品视频频| 91极品美女高潮叫床在线观看| 国产高清免费午夜在线视频| 亚洲精选高清无码| 亚洲一区二区视频在线观看| 国产色网站| 久久精品国产免费观看频道| 久久精品丝袜| 日韩精品高清自在线| 亚洲天堂网在线播放| 亚洲日本中文字幕乱码中文| 国产一区二区三区在线无码| 四虎成人在线视频| 亚洲第一区在线| 国产精品人成在线播放| 亚洲成人高清无码| 日韩毛片在线视频| 风韵丰满熟妇啪啪区老熟熟女| 婷婷午夜天| 伊人久久青草青青综合| 98精品全国免费观看视频| 亚洲无线观看| 国产成人精品亚洲77美色| 国产69精品久久久久孕妇大杂乱 | 国产亚洲视频免费播放| 国产亚洲欧美在线专区| 在线观看无码a∨| 国产va在线观看免费| 国产区精品高清在线观看| 国产成人精品一区二区三区| 日韩精品一区二区深田咏美| 2022国产无码在线| 国产第二十一页| 国产91全国探花系列在线播放| 国产亚洲高清在线精品99|