999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于時(shí)間序列預(yù)測(cè)模型的電視劇收視率預(yù)測(cè)

2018-01-26 04:58:04紹興市第一中學(xué)陸文昊
電子世界 2018年1期
關(guān)鍵詞:模型

紹興市第一中學(xué) 陸文昊

1.前言

電視劇的熱度是對(duì)其影響力和關(guān)注度的綜合衡量指標(biāo)。為了在目前“多屏模式”下找到電視劇熱度的影響因素,并且提出更綜合、客觀的衡量指標(biāo),國(guó)內(nèi)外專家學(xué)者進(jìn)行了很多針對(duì)性的研究。主要可以分為兩類:

(1)單一預(yù)測(cè)模型,如:梁招娣等基于RBF神經(jīng)網(wǎng)絡(luò)對(duì)電視收視率進(jìn)行預(yù)測(cè)[1],汪洋等基于BP神經(jīng)網(wǎng)絡(luò)建立收視率預(yù)測(cè)模型[2],張春燕等利用ARMA模型對(duì)在線電視劇流行度進(jìn)行預(yù)測(cè)[3],毋世曉等人利用移動(dòng)平均法預(yù)測(cè)網(wǎng)站電視劇視頻點(diǎn)擊量[4]等等。

(2)組合預(yù)測(cè)模型,如:張茜等基于TEI@I方法,提出了對(duì)綜藝節(jié)目收視率預(yù)測(cè)的研究框架,引入了新的解釋變量百度指數(shù)和新浪微指數(shù),并采用模型集成技術(shù)顯著提高了預(yù)測(cè)精度[5]。黃玲莉等基于ARIMA與BP神經(jīng)網(wǎng)絡(luò),建立了收視率組合預(yù)測(cè)模型[6]。

對(duì)比前人的研究成果,我們發(fā)現(xiàn)組合模型的效果比單一模型更加出色。因此,本文在前人已有研究的基礎(chǔ)上,綜合運(yùn)用了多種機(jī)器學(xué)習(xí)模型,對(duì)影響電視劇熱度的因素進(jìn)行了系統(tǒng)的研究。

2.收視率單一時(shí)序預(yù)測(cè)模型的構(gòu)建和優(yōu)化

2.1 數(shù)據(jù)收集和預(yù)處理

本研究選取了2015年到2017年期間首播的共23部完結(jié)的電視劇作為研究對(duì)象,這些電視劇包含了不同種類的收視率變化模式,均屬于該種類中較為典型的電視劇,可以比較全面的反應(yīng)不同的收視率變化情況,確保了模型的廣泛性與合理性。

研究中所有的收視率數(shù)據(jù)均為索福瑞CSM52城收視率統(tǒng)計(jì)值,電視劇的基本信息(如首播日期、播出衛(wèi)視、每天播放集數(shù))等信息來(lái)源于百度百科,所有的原始數(shù)據(jù)都存儲(chǔ)在補(bǔ)充材料的excel表格中。

2.2 建立AR(2)模型進(jìn)行預(yù)測(cè)

首先,本文使用二階自回歸的時(shí)序預(yù)測(cè)模型,利用電視劇前 集的收視率數(shù)據(jù)來(lái)預(yù)測(cè)最后三集的收視率。其中該模型的基本假設(shè)為:

(1)電視劇收視率變化平穩(wěn),不會(huì)因?yàn)橥饨缫蛩氐呐R時(shí)干擾而發(fā)生突變;

(2)不同時(shí)間的電視劇收視率統(tǒng)計(jì)方法一致,能夠反映電視劇的受關(guān)注程度。

本文基于以上的模型假設(shè),建立了二階自回歸模型,即AR(2)模型。若假設(shè) 代表第 集電視劇的收視率,那么該模型的表達(dá)式為:

利用excel自帶的數(shù)據(jù)分析工具進(jìn)行擬合,此處以2017年收視率榜首電視劇《人民的名義》為例進(jìn)行模型的訓(xùn)練和求解。其中訓(xùn)練集和測(cè)試集分別為:

(1)訓(xùn)練集:《人民的名義》前29天、共47集的收視率作為訓(xùn)練集。

(2)測(cè)試集:《人民的名義》最后3天、共5集的收視率作為測(cè)試集。

經(jīng)過(guò)excel的擬合分析,得到《人民的名義》二階自回歸擬合的表達(dá)式為:

用同樣的方法,對(duì)其余的22部電視劇建立AR(2)模型,分別作出收視率的預(yù)測(cè)分析。結(jié)果發(fā)現(xiàn),對(duì)于部分電視劇來(lái)說(shuō),該模型的預(yù)測(cè)性能比較好,如《平凡的世界》RMSE=0.056,《北上廣不相信眼淚》RMSE=0.051,《外科風(fēng)云》RMSE=0.077。

而對(duì)于另外一些電視劇,該模型的預(yù)測(cè)性能比較差,例如《孤芳不自賞》RMSE=0.534,《于成龍》RMSE=0.583,《親愛(ài)的翻譯官》RMSE=0.683。

由此可見(jiàn),最簡(jiǎn)單的AR(2)時(shí)序預(yù)測(cè)模型僅能實(shí)現(xiàn)一定程度的預(yù)測(cè)功能,其局限性主要體現(xiàn)在以下兩個(gè)方面:

(1)只能描述數(shù)據(jù)分布規(guī)律中的線性特征,而難以刻畫數(shù)據(jù)分布的非線性關(guān)系。這就使該模型對(duì)于基本符合線性增長(zhǎng)趨勢(shì)的電視劇收視率與測(cè)量好,而對(duì)于波動(dòng)性較大的電視劇收視率難以精準(zhǔn)預(yù)測(cè);

(2)部分模型存在過(guò)擬合的問(wèn)題,將數(shù)據(jù)中的噪聲當(dāng)做了信號(hào)進(jìn)行處理,有些參數(shù)的p-value不能通過(guò)0.05顯著性水平檢測(cè)。

2.3 對(duì)數(shù)據(jù)和模型進(jìn)行優(yōu)化處理

2.3.1 對(duì)收視率數(shù)據(jù)異常點(diǎn)的處理

通過(guò)對(duì)部分電視劇測(cè)試結(jié)果的深入研究,發(fā)現(xiàn)部分預(yù)測(cè)收視率與真實(shí)收視率差距較大的電視劇,都存在兩種不一樣的播放模式。例如《武媚娘傳奇》有單集播放的、也有三集連播的;《人民的名義》有單機(jī)播放的、也有兩集連播的。

為確定“收視率異常下降”與“當(dāng)日單集播放”之間的關(guān)系,我們對(duì)23部電視劇中有不同播放模式的17部電視劇進(jìn)行了統(tǒng)計(jì)分析,得到了如表格1所示的結(jié)論。此處,“收視率異常下降”定義為“該天的收視率明顯小于本電視劇收視率的線性增長(zhǎng)趨勢(shì)”。

表1 對(duì)17部電視劇“收視率異常下降”天數(shù)特征的統(tǒng)計(jì)分析

由表格1可以非常明顯地看出,在所有的考察對(duì)象的單集播放日中,“收視率異常下降”事件出現(xiàn)的概率遠(yuǎn)遠(yuǎn)高于所有播放日的平均概率。所以我們認(rèn)為,“單集播放”是與“收視率異常下降”存在緊密的聯(lián)系。

所以,我們首先對(duì)于研究對(duì)象電視劇的所有單集播放日中“收視率異常下降”的數(shù)據(jù)進(jìn)行了修正,采用均值插值的方法,替換掉原有的收視率異常點(diǎn)。修正后的收視率等于單集播放日前后的收視率平均值。

2.3.2 將AR(2)模型優(yōu)化為ARMA(2,3)模型

在完成對(duì)單集播放日異常點(diǎn)的修正后,部分電視劇依然存在比較大的波動(dòng)性。因此,進(jìn)一步優(yōu)化模型,引入移動(dòng)平均的優(yōu)化計(jì)算,對(duì)波動(dòng)劇烈的曲線進(jìn)行平滑濾波,從而降低波動(dòng)性帶來(lái)的影響,更容易地把握住數(shù)據(jù)分布的線性趨勢(shì)。因此進(jìn)一步將AR模型優(yōu)化為ARMA模型。

在ARMA(p,q)的模型識(shí)別和定階過(guò)程中,我們以《人民的名義》電視劇為樣例,對(duì)p、q兩個(gè)參數(shù)采取逐步試探法以獲得最佳值。經(jīng)過(guò)多次嘗試,確定收視率預(yù)測(cè)的最佳模型為ARMA(2,3)。在對(duì)單集播放日的異常點(diǎn)修正后,利用matlab實(shí)現(xiàn)ARMA的預(yù)測(cè)功能,再次對(duì)表2-4中曾經(jīng)對(duì)AR(2)模型表現(xiàn)不佳的電視劇進(jìn)行預(yù)測(cè),得到新的預(yù)測(cè)結(jié)果為《孤芳不自賞》RMSE=0.235,《于成龍》RMSE=0.462,《親愛(ài)的翻譯官》RMSE=0.383.

可以看出,經(jīng)過(guò)對(duì)數(shù)據(jù)集的修正和對(duì)模型的優(yōu)化之后,原先AR(2)預(yù)測(cè)表現(xiàn)不佳的電視劇預(yù)測(cè)性能都有了一定的提升。改變最大的電視劇《親愛(ài)的翻譯官》,其均方誤差降低了44%,其他電視劇的均方誤差也有10%-30%不等的下降。

2.4 總結(jié)與討論

本章節(jié)采用單一的時(shí)序預(yù)測(cè)模型,對(duì)23部研究對(duì)象電視劇進(jìn)行了逐一的預(yù)測(cè)。在AR(2)模型的基礎(chǔ)上,一方面深入分析了異常點(diǎn)的規(guī)律和特征,對(duì)異常點(diǎn)進(jìn)行了修正;另一方面在模型中加入了移動(dòng)平均的過(guò)程,將模型優(yōu)化為ARMA(2,3)。最終可以看到,ARMA(2,3)模型在修正后的數(shù)據(jù)集上,表現(xiàn)出的預(yù)測(cè)性能比AR(2)在原數(shù)據(jù)集上的性能要優(yōu)秀很多。

雖然目前的預(yù)測(cè)模型得到了一定的優(yōu)化,例如《人民的名義》預(yù)測(cè)RMSE從0.3285降低到了0.2376,但該模型依舊存在一定的問(wèn)題。其最核心的問(wèn)題在于該模型依舊只能描述數(shù)據(jù)的線性變化趨勢(shì),對(duì)于變量之間非線性的變化關(guān)系十分無(wú)力。

為了進(jìn)一步提高預(yù)測(cè)的精確程度,我們從前人的工作中得到啟發(fā),嘗試采用組合模型來(lái)進(jìn)行預(yù)測(cè),一方面利用ARMA模型的線性描述能力,另一方面利用BP神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)能力,二者相結(jié)合地展開(kāi)后續(xù)的預(yù)測(cè)工作。

3.ARMA-BP神經(jīng)網(wǎng)絡(luò)組合預(yù)測(cè)模型

3.1 模型構(gòu)造思路

經(jīng)過(guò)前文的分析和預(yù)測(cè),我們發(fā)現(xiàn)節(jié)目的收視率會(huì)受到很多因素的影響。哪怕對(duì)一些異常點(diǎn)進(jìn)行修正和調(diào)整,節(jié)目的收視率也會(huì)有一定的波動(dòng)性和無(wú)序性。所以,僅憑線性的模型是無(wú)論如何也無(wú)法進(jìn)行精準(zhǔn)擬合的。由于基于回歸的分析方法能夠提取出數(shù)據(jù)的線性特征,而神經(jīng)網(wǎng)絡(luò)對(duì)非線性關(guān)系有很強(qiáng)的逼近能力。所以我們?cè)谇叭搜芯康膯l(fā)之下,選擇使用ARMA模型與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,進(jìn)行收視率的預(yù)測(cè)分析。

對(duì)目前要預(yù)測(cè)的收視率序列rate來(lái)說(shuō),每個(gè)數(shù)值都可以表示為:

其中Lt表示該序列中規(guī)律的線性部分,對(duì)該部分ARMA模型有很好的擬合能力;而NLt表示該序列中的非線性部分,這部分能夠使用 BP神經(jīng)網(wǎng)絡(luò)來(lái)逼近求解,因此該組合模型的整體構(gòu)造思路分以下幾步:

(1)用一個(gè)樣本電視劇確定ARMA(p,q)模型的階次,通過(guò)逐步試探的方法進(jìn)行識(shí)別、定階。在2.3.2節(jié)中,我們利用了《人民的名義》作為樣本電視劇,確定了該模型最佳的階次為 ARMA(2,3)。

(2)用ARMA(2,3)模型進(jìn)行ratet預(yù)測(cè),假設(shè)預(yù)測(cè)的結(jié)果為。這代表了第 個(gè)點(diǎn)的預(yù)測(cè)值,而代表了該點(diǎn)的預(yù)測(cè)殘差。

(4)利用ARMA(2,3)與BP神經(jīng)網(wǎng)絡(luò)兩種模型的預(yù)測(cè)結(jié)果組合后作為最終的預(yù)測(cè)結(jié)果,即在 點(diǎn)的預(yù)測(cè)結(jié)果為

整體構(gòu)造過(guò)程如圖1所示。

圖1 ARMA-BP神經(jīng)網(wǎng)絡(luò)構(gòu)造流程圖

3.2 模型求解過(guò)程

以《人民的名義》電視劇為例,利用1—26天的收視率作為訓(xùn)練集,27—29天的收視率作為測(cè)試集,檢驗(yàn)該模型的預(yù)測(cè)性能。

首先利用2.3.2節(jié)中提到的ARMA(2,3)模型,用前26天的收視率進(jìn)行訓(xùn)練。利用matlab完成模型訓(xùn)練過(guò)程,計(jì)算出第5天至第26天的真實(shí)收視率與預(yù)測(cè)收視率。之后,將22個(gè)預(yù)測(cè)殘差作為BP神經(jīng)網(wǎng)絡(luò)的期望輸出。然后將原始收視率數(shù)據(jù)以最大收視率為基準(zhǔn)進(jìn)行歸一化處理,歸一化后的數(shù)據(jù)設(shè)為 。之后對(duì)歸一化后的數(shù)據(jù)進(jìn)行相空間重構(gòu),根據(jù)實(shí)際情況,確定重構(gòu)階數(shù)為5階,即通過(guò)生成一組5維的收視率空間向量。將重構(gòu)后的數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)輸入。

利用matlab實(shí)現(xiàn)3層BP神經(jīng)網(wǎng)絡(luò),利用 newff 函數(shù)構(gòu)建網(wǎng)絡(luò),其中隱含層數(shù)目經(jīng)過(guò)多次試探驗(yàn)證設(shè)置為8。隱含層傳遞函數(shù)為tansig,輸出層的傳遞函數(shù)設(shè)為 purein,訓(xùn)練函數(shù)采用 trainm。經(jīng)過(guò)282次學(xué)習(xí)后,精度達(dá)到了預(yù)設(shè)的0.001的要求。

將訓(xùn)練后的ARMA(2,3)模型和BP神經(jīng)網(wǎng)絡(luò)模型共同用于對(duì)《人民的名義》最后三天收視率的預(yù)測(cè),結(jié)果顯示組合模型能夠的均方誤差為 ,預(yù)測(cè)性能超過(guò)之前所有的單獨(dú)預(yù)測(cè)模型。由此可見(jiàn),ARMA-BP神經(jīng)網(wǎng)絡(luò)模型通過(guò)分別擬合線性部分和非線性部分,實(shí)現(xiàn)了更加精準(zhǔn)的預(yù)測(cè)性能,更適合用于電視劇的收視率預(yù)測(cè)中。

[1]周小普,韓瑞娜,凌姝.多屏發(fā)展背景下網(wǎng)絡(luò)收視度的影響因素研究——以熱播電視劇為例[J].國(guó)際新聞界,2014,(12):114-129.

[2]侯衛(wèi)星,高建中.基于因子分析法的城市低碳經(jīng)濟(jì)實(shí)證評(píng)價(jià)——以太原市為例[J].企業(yè)經(jīng)濟(jì),2012,(06):15-19.

[3]張輝,王雯聰.基于多元統(tǒng)計(jì)分析方法研究電視劇收視特征及影響因素[J].現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào)),2011,(06):101-103+126.

[4]耿金花,高齊圣,張嗣瀛.基于層次分析法和因子分析的社區(qū)滿意度評(píng)價(jià)體系[J].系統(tǒng)管理學(xué)報(bào),2007,(06):673-677.

[5]何躍,蔡博馳.基于因子分析法的微博熱度評(píng)價(jià)模型[J].統(tǒng)計(jì)與決策,2016,(18):52-54.

[6]劉志.模糊層次分析法在電視劇評(píng)價(jià)中的應(yīng)用[J].安徽廣播電視大學(xué)學(xué)報(bào),2014,(02):57-60.

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲人成网站在线观看播放不卡| 亚洲成人在线免费观看| 国产va在线观看| 毛片大全免费观看| 国产香蕉国产精品偷在线观看| 精品伊人久久久大香线蕉欧美 | 日日摸夜夜爽无码| 亚洲愉拍一区二区精品| 久久久久人妻一区精品色奶水 | 亚洲一区二区三区国产精品 | 国产H片无码不卡在线视频| 亚洲国产第一区二区香蕉| 欧美精品一二三区| 亚洲精品国产乱码不卡| 99激情网| 国产一区二区精品高清在线观看| 国产精品私拍99pans大尺度 | 色噜噜狠狠色综合网图区| 538国产视频| 久久这里只精品国产99热8| 五月婷婷中文字幕| 丁香六月激情综合| 成人国产免费| 免费一级无码在线网站| 亚洲一级毛片在线播放| 日本a级免费| 国产在线自乱拍播放| 亚洲人妖在线| 91欧美亚洲国产五月天| 婷婷六月在线| 亚洲人成在线精品| 日本不卡在线| 欧美国产成人在线| 国产成人91精品免费网址在线| 久久国产av麻豆| 999国产精品| 国产女人在线视频| 超碰aⅴ人人做人人爽欧美 | 天堂久久久久久中文字幕| 久久精品中文无码资源站| 日本91在线| 永久免费av网站可以直接看的 | 蜜桃臀无码内射一区二区三区| 国产黑人在线| 欧美a在线看| 国产免费久久精品99re不卡| 久久精品嫩草研究院| 久久这里只有精品2| 精品国产香蕉伊思人在线| 免费在线观看av| 3D动漫精品啪啪一区二区下载| www中文字幕在线观看| 亚洲无限乱码| 中美日韩在线网免费毛片视频| 中文字幕资源站| 欧美久久网| 欧美综合激情| 日韩欧美国产另类| 久久动漫精品| 久久综合色天堂av| 激情无码视频在线看| 91视频精品| 亚洲毛片在线看| 69综合网| 日韩天堂在线观看| 成人久久精品一区二区三区 | 狠狠色婷婷丁香综合久久韩国| 91久久天天躁狠狠躁夜夜| 国产成人精品一区二区| 国产日本一区二区三区| 国产swag在线观看| 日韩无码一二三区| 日本成人一区| 亚洲欧洲免费视频| 蜜臀av性久久久久蜜臀aⅴ麻豆| 久久一日本道色综合久久| 成人午夜免费观看| 国产一区三区二区中文在线| 久久国产拍爱| 欧美精品v| 免费看美女自慰的网站| 日本人妻丰满熟妇区|