肖啟偉,楊秀芝
(福州大學 物理與信息工程學院,福建 福州 350002)
基于NAR模型的電視頻道收視率預測
肖啟偉,楊秀芝
(福州大學 物理與信息工程學院,福建 福州 350002)
電視收視率作為電視行業中的重要指標之一,同時也作為廣告投放和節目推送的重要依據,在競爭日益激烈的視聽市場上,逐漸發揮其重要作用。基于電視收視率本身的時間序列特點,對動態神經網絡算法進行研究,提出了非參數自回歸(NAR)模型對電視頻道收視率進行預測,取得了較好的效果。
神經網絡;時間序列;NAR模型;收視率;預測
電視收視率作為電視行業評價電視節目的標準之一,在廣告投放、節目推送等應用中,起到了巨大的引導作用,因此,如何能夠較為準確地預測下一時刻的收視率,對于電視臺、廣告商、企業用戶等都有很大的經濟效益。
目前研究收視率的預測方法主要有三大類:決策樹、貝葉斯算法、神經網絡算法等,這些算法對電視收視率進行了科學的預測。但由于主客觀等因素,在預測上存在著局限性。文獻[1]中,通過對節目影響因素的分析,提出了決策樹算法,但在具體的收視率預測上不能給出確切的預測值,同時,數據量變大,決策樹又會隨之變化;文獻[2]中,基于分類規則和貝葉斯網絡進行預測,同樣無法對具體的數值進行預測;文獻[3]中,基于BP神經網絡的收視率預測,雖然給出了預測值,但是在網絡訓練時,采用了5分制對影響節目收視的因素進行評分,因不同的人對不同因素的評分存在主觀性,為此該BP神經網絡的收視率預測具有主觀局限性。
本文提出基于動態神經網絡時間序列的收視率預測,利用收視率本身的時間序列特征,動態學習收視率在長期波動中的周期規律性,并通過神經網絡對以往的收視率時間序列進行學習,搭建收視率預測模型,對未來的收視率進行預測。此方案克服了上述文獻算法存在的主觀局限性等不足。
1.1 動態神經網絡概述
動態神經網絡區別于靜態神經網絡,判斷依據為存在反饋以及記憶功能與否。動態神經網絡輸入輸出之間的變量關系并不僅僅是一種靜態方式的映射,每一時刻的輸出是基于當前時刻以前系統的動態綜合結果而得,因此具有反饋和記憶的功能。其特點是系統有若干個穩定的狀態,開始于任何狀態,最終都可進入其中的某一個穩定狀態,并且通過對各個神經元的連接權值的改變可以得到系統的穩定狀態。
動態神經網絡依據其實現動態的方法不同分為以下兩類:一類是回歸神經網絡,它由靜態神經元與網絡的輸出反饋兩部分構成,典型的網絡如NAR回歸神經網絡。另一類是通過神經元反饋形成的神經網絡,如PID神經網絡等。基于收視率的非線性及其本身的時間序列特征,本文將動態神經網絡運用到了收視率的時間序列預測中,提出了NAR動態神經網絡對收視率的時間序列數據的建模仿真及其檢測。
1.2 時間序列
時間序列是把某種統計指標的數值,根據時間順序進行排列,得到的一組數字序列。編制和分析時間序列是時間序列預測法的基本方法。時間序列分析是根據時間序列所反映出來的發展過程、方向和趨勢,進行曲線擬合以及參數的估計,然后建立相應的數學模型預測下一段時間可能達到的數值。一般應用于以下兩種情況:1)決定預測變量因素的信息較少;2)具有用于構成時間序列的足夠多的數據量。
時間序列分析是以定量預測方法為基礎的。應用的原理是根據事物發展的延續性以及隨機性來擬合分析。延續性指的是根據過去的數據,預測未來的發展趨勢;隨機性是指事物因為偶然因素而產生的不確定性,利用各種統計分析方法對歷史數據進行分析處理。
非線性自回歸(Nolinear Auto-Regressive,NAR)模型是基于動態神經網絡時間序列的預測模型。本文提出的預測模型是利用收視率非線性以及動態性特點,結合神經網絡所具有的“記憶”功能,因此基于動態神經網時間序列分析可以很好地映射出收視率預測模型。
2.1 NAR模型的建立原理
本文設計的收視率預測模型采用基于動態神經網絡時間序列原理的NAR模型。一個完整的NAR神經網絡主要由輸入層、隱藏層與輸入延時層、輸出層構成,在實際模型應用前要設定好輸入與輸出層之間的延時數,隱藏學習層的神經元個數。其具體結構示意圖如圖1所示。

圖1 NAR神經網絡結構示意圖
圖1中,左邊的y(t)代表輸入數據;右邊的y(t)代表輸出數據;1∶7代表的是輸入與輸出的延時階數;W代表連接權;b代表閾值。NAR網絡有兩種輸出模式,一種是Parallel(Close-loop)模式,在該模式下,輸出的數據被反饋到輸入端,在隱藏層中繼續學習;另一種是Series-Parallel(Open-loop)模式,該模式下,將期望輸出反饋到輸入端。NAR神經網絡模型可以表示為

式中:d代表延時層的個數。由式(1)可以看出,下一個 y(t)值的大小取決為前d個y(t)的值。NAR神經網絡詳細的結構如圖2所示。

圖2 NAR神經網絡詳細結構圖
2.2 預測模型搭建流程
NAR模型對某電視頻道的收視率進行預測中。其預測模型如圖3所示。

圖3 NAR模型預測流程圖
算法開始導入以往的歷史數據,對網絡訓練數據的訓練集、驗證集、測試集進行設置,并設置好延時層與隱藏層的個數。接著進行NAR網絡訓練,該網絡采用LM(Leven?berg-Marquardt)訓練算法進行神經網絡學習,網絡性能選用誤差平方和MSE(Mean Squared Error),接著根據誤差自相關曲線,誤差曲線判定網絡的好壞與否,決定選擇哪個網絡進行預測。最后進行網絡的預測輸出及其檢測。
2.3 相關參數配置
網絡訓練的數據可分為以下三類:訓練集,即用來訓練建立預測模型的數據;驗證集,即用來驗證此網絡是否可行;測試集,即用來評估模型預測能力的數據。本文數據設置參數分別為:訓練集70%;驗證集15%;測試集15%。
本文采用Series-Parallel模式,由于頻道的收視率以一周為單位呈現著波動規律,因此延時層設置為7,隱藏層設置為5。
3.1 網絡可行性分析
本文研究的收視率預測采用MATLAB工具進行預測網絡的模型搭建,結合動態神經網絡GUI工具箱已有的時間序列工具,根據里面的建模工具搭建收視率預測模型。NAR網絡的預測模型效果主要通過誤差圖、誤差自相關圖進行可視化分析。
圖4誤差圖中豎直方向較粗的線段表示測試目標與預測輸出之間的差值,線段越少表示NAR神經網絡預測的效果越好。同時結合圖5誤差自相關圖分析,誤差在lag為0的時候最大,其他情況下以不超過置信區間為佳。由圖可知,此模型誤差均在置信區間內,因此可以推測此NAR神經網絡預測模型預測效果較好。

圖4 誤差圖

圖5 誤差自相關圖
3.2 預測輸出與檢測
為了驗證此模型的預測效果,本文通過對2014年江蘇衛視1—3月的全天收視率進行NAR神經網絡預測模型的建立,同時對其4月份的收視率進行預測,并將預測的收視率與實際進行比較,結果如圖6所示。由圖6可知,預測模型結果能夠較好地逼近實際收視率。
如圖7所示,收視率預測與實際差值基本都位于±0.05%之間,個別值除外,預測精度較高。證實了NAR神經網絡能夠較好預測電視頻道未來的收視率。

圖6 預測與實際收視率比較圖

圖7 收視率預測與實際差值
本文采用NAR模型進行收視率預測系統的建立,接著對模型進行訓練和測試分析,通過對未來一個月的電視頻道收視率進行預測,預測結果與實際的收視率測試效果逼近,精度也高,證明了此預測模型的在預測中的應用是有效的。它可為廣電、電視臺等工作人員在對電視頻道的廣告投放和節目推廣提供很大的參考價值,更好地提高了電視臺的經濟效益。
[1]涂娟娟,劉同明.基于決策樹的電視節目收視率預測模型[J].微計算機信息,2007,23(9):227-231.
[2]張晶,白冰,蘇勇.基于貝葉斯網絡的電視節目收視率預測研究[J].科學技術與工程,2007,7(19):5099-5102
[3]鄔麗云,曲洲青.基于BP神經網絡的收視率預測[J].中國傳媒大學學報,2011,18(3):59-62
[4] YASSIN I,ZABIDI A,SALLEH M,et al.Malaysian tourism in?terest forecasting using nonlinear auto-regressive(NAR)model [C]//Proc.IEEE 3rd International Conference on System Engineer?ing and Technology.[S.l.]:IEEE Press,2013:32-36.
責任編輯:時 雯
Prediction of Audience Rating Based on Nolinear Auto-regressive(NAR)Model
XIAO Qiwei,YANG Xiuzhi
(College of Physics and Information Engineering,Fuzhou University,Fuzhou 350002,China)
Television rating is one of the important indicators in TV industry,and at the same time as the important basis of advertising and promoting programmes,gradually plays its important role in the increasingly competitive audio-visual market.This article based on the time series of TV audience ratings characteristics,the dynamic neural network algorithm is studied.The researcher applies the Nolinear Auto-Regressive(NAR) model to predict TV audience ratings and acquires better effect.
neuralnetwork;time series;NAR model;audience rating;prediction
TN948
A
10.16280/j.videoe.2015.04.021
2014-05-13
【本文獻信息】肖啟偉,楊秀芝.基于NAR模型的電視頻道收視率預測[J].電視技術,2015,39(4).