彭毅弘
【摘要】 研究了基于雙向機頂盒的用戶收視行為監測系統的功能組成與機頂盒端的實現方法,著重介紹如何在機頂盒中監測和捕獲用戶收視行為數據,實現數據的封裝和回傳。從數據采集、數據傳輸、數據保存和數據呈現四方面闡述用戶收視行為監測系統的整體架構和功能,介紹機頂盒端的數據封裝格式和回傳規則,給出軟件實現流程。整個監測過程不會對用戶產生額外的時間遲延,機頂盒通過軟件升級就能匹配前端服務器的數據類型拓展,無需增加硬件成本。
【關鍵詞】用戶收視行為 數據監測 雙向機項盒 基本數據元
隨著廣電多種增值業務的開展和推廣,雙向機頂盒在數字電視用戶中逐漸普及。雙向機頂盒具備傳統電視和互聯網媒體的特性,既可看到傳統電視上的直播節目,也可以選擇不同的欄目進行點播和回看,類似于視頻網站的點擊行為,為機頂盒端的數據回傳提供了條件,因此,應用在互聯網上的數據研究理念延伸到了數字電視領域。基于雙向機頂盒平臺的電視用戶行為的監測與調查,是數字電視技術的自然發展,也是廣電運營商非常重要的一項需求。機頂盒端提供的用戶收視行為數據可以提高收視率數據的精確性和廣告投放的準確性,對于規劃數字電視網絡頻道、管控網絡信號質量、收取節目落地費、掌握用戶偏好和提高用戶滿意度都有非常重要的作用[1-3]。本文將介紹在雙向機頂盒終端如何實現用戶收視行為數據的收集和回傳。
一、用戶收視行為數據調查系統
市面上主流的數字電視用戶收視行為數據調查系統從功能模塊看,都可以劃分成四個方面:數據采集、數據傳輸、數據保存和數據呈現[4]。
1.1 數據采集
數據采集模塊是機頂盒端程序,負責收集用戶信息、用戶觀看數據、機頂盒資源使用情況和網絡信號狀態,同時還負責展示問卷,收集用戶回答等多種有價值的用戶行為信息。通過約定協議的擴展,在機頂盒端增加對協議的解析和操作,就能拓展收集數據的類型。
1.2 數據傳輸
機頂盒通過內置CM或外接網卡與Internet網連接,把數據通過UDP協議封裝在一個包里發送到指定的服務器。為保證數據的可靠性,對所傳遞的信息使用AES加密算法進行加密。采用UDP標準協議進行傳輸,在傳輸過程中不需要三次握手,對機頂盒和網絡的總體壓力很小。
1.3 數據保存
服務器端接收到數據之后,將其解析并保存至數據庫中。服務器端實現了和廣電運營支撐系統( BOSS)的交互接口,結合BOSS系統對電視用戶的標準地址管理,可根據機頂盒序列號和MAC地址從BOSS系統中取得相應用戶的用戶信息,作為數據挖掘的依據。
1.4 數據呈現
數據的分析由數據分析服務器完成,指標計算方法可借助專業媒介研究機構的技術和經驗,對用戶收視行為特征和數據進行自動分析統計和分類展現。客戶端計算機通過互聯網,可以調用數據分析服務器輸出的各種數據指標和分析結果,如節目收視率分析數據,借以準確的評估某個時段或某個節目的廣告價值。
二、盒端收視數據檢測的實現
雙向機頂盒端的用戶收視行為數據監測涉及數據提交規則、數據格式約定和機頂盒軟件處理技術。機頂盒軟件通過創建進程來實時監控用戶的收視行為[5],一旦發生需要收集的收視行為變化,機頂盒把該行為按照約定的數據格式打包成基本數據元,累計一定數量后,再封裝成UDP數據包。緩沖區負責存儲封裝好的UDP數據包,一旦到達發送的條件,馬上發送出去,同時把負責計數的變量清零,開始新的一輪循環。
2.1 數據提交規則
數據使用UDP標準協議打包后發送,發送頻率5分鐘一次,以降低網絡操作壓力。機頂盒累計存儲5分鐘后,或者5分鐘內累計存儲達到100條基本數據元,立即發送UDP數據包[4]。發送結束后清理機頂盒的內存以防止溢出,并重新開始計數。如果機頂盒進入待機狀態,立即發送之前緩存在機頂盒中的數據,并清除內存,停止數據采集發送。
基本數據元是指檢測到的用戶行為數據按照與前端服務器約定的格式被封裝成一個數據元,每個UDP封包允許有多個基本數據元,最多不超過100個。每個數據元包含以下內容(每個內容使用“,”符號來分隔):
(1)包頭,用來標識數據元的頭部,用“<!”符號來表示;
(2)機頂盒序列號,提供給前端服務器從BOSS系統中取得相應用戶的相關信息;
(3)智能卡號,有插卡的情況下,提供該卡的卡號,沒插卡的情況默認為0;
(4)事件觸發日期,標識該數據元發生的時間,格式是年一月一日時:分:秒;
(5)用戶行為代號,標識引發該數據元的用戶行為;
(6)包尾,用來標識數據元的尾部,用“!>”符號來表示;
2.2用戶收視行為數據分類
用戶收視行為數據主要從用戶觀看節目時間段,用戶使用操作行為,用戶訂閱的內容或業務這三個方面勾勒出用戶的使用習慣和喜好,為運營決策提供可靠的數據依據[6]。數據類型的拓展相對靈活,增加數據元打包格式中的“用戶行為代號”即可。服務器端的分析軟件增加對新增用戶行為代號的解讀和分析,機頂盒端增加對新增用戶行為代號的格式打包,最后通過機頂盒軟件升級,就能實現數據類型的拓展,無需增加額外的硬件成本,能滿足不同運營商對所關注數據的不同需求。
用戶行為代號可以分為以下幾類:
2.2.1開關機行為
開機:字符串“00010000”表示
待機:字符串“00090000”表示
開關機行為數據可作為實時開機使用行為、指定時間跨度的開機狀況統計、指定時間跨度的新增用戶狀況統計和指定時間跨度的沉睡用戶挖掘等統計分析的數據基礎。
2.2.2收視點播行為
直播頻道: “Transport Stream ID+Service ID"紐合表示
VOD點播:字符串“00020000”表示
回看/時移:字符串“00030000”表示
數據廣播:字符串“00040000”表示
音頻廣播:字符串“00050000”表示
收視點播行為數據可作為直播頻道收視統計、點播節目頻道收視統計、欄目/回看收視統計、收視排名統計和收視趨勢分析等統計分析的數據基礎。
2.2.3界面瀏覽行為
主菜單:字符串“FFFOOOOO”表示
聲音條: “rrrl+Transport Stream ID+Service ID”組合表示
頻道列表:字符串“FFF20000”表示
節目搜索:字符串“FFF30000”表示
EPG列表:字符串“FFF40000”表示
界面瀏覽行為數據可作為全屏類廣告、UI嵌入類廣告和瀏覽興趣點挖掘等統計分析的數據基礎。
2.2.4機頂盒資源使用狀態
資源占用狀態: “FFFF+RAM占用百分比+CPU占用百分比”表示
機頂盒資源使用狀態數據可作為機頂盒配置發展趨勢的數據分析基礎。
2.3 數據監測流程
機頂盒啟動后,進入首貞或默認頻道,產生一個相應的用戶行為代號(如開機的行為代號“00020000”),且生成一個基本數據元,此時如果機頂盒獲取到當地網絡服務器的統一時間,則將數據元的時間字段進行補充。假如在某種狀態下無法獲得準確的同步時間,比如在開機畫面狀態機頂盒并沒有準確的同步時間,記錄這些狀態且生成數據元時,暫時只存儲這些狀態的用戶行為代號,一旦拿到時間,就將時問補充到這些狀態的數據元里。
當用戶觀看直播頻道時,機頂盒每5分鐘把直播頻道的數據元封裝一個UDP包并發送一次緩存的數據,發送后清理緩存數據。用戶換臺時,每次換臺時間間隔大于1秒才認為是有效的換臺操作。產生有效換臺操作后,機頂盒生成直播頻道的數據元,當累積100個數據元后,或者時間超過5分鐘時,這些數據元被打包成UDP數據包發送出去。
當用戶對點播節目、數據廣播或者音頻廣播感興趣且有所動作時,相應的行為數據代號會按照格式封裝成數據元,一一被記錄和存儲在數據緩沖區中。用戶在切換界面的同時,涉及到的貞面瀏覽行為,比如頻道列表、EPG列表等,也會以相同的方式被記錄下來。
用戶結束當前的觀看行為按下待機鍵時,立即發送一次待機信號以及緩存數據,此后停止采集,不再發送任何數據。
三、結語
本文介紹了基于雙向機頂盒的用戶收視行為數據調查系統的系統結構和各模塊功能,以及機頂盒端的實現方式。著重介紹了在機頂盒端的數據封裝協議、數據回傳規則和軟件監控流程。整個數據捕獲過程不會對用戶產生額外的時間消費或操作遲延。數據封裝格式簡單靈活,能快速拓展數據類別,機頂盒通過軟件升級就能匹配前端服務器的數據協議拓展。
參 考 文 獻[1]詹姆斯G伯斯.視聽率分析:受眾研究的理論與實踐(第二版)[M].華夏出版社.2004[2]吳殿義.數字電視收視監測大有可為[J].Media簡介.2010年.第1期:33-34頁[3]黃偉.SBSS用戶收視行為調查系統的創新技術[J].廣播電視信息.2009年:50-53頁[4]汪莉.數字電視用戶收視行為調查系統最大并發量研究及推廣前景[C].北京:中廣互聯.2010[5] Jean.J.Labrosse,MicroC/OS-II The Real-Time Kernel(第二版)[M].北京航空航天大學出版社.2003[6]CertusNet.iTV用戶行為分析系統[EB/OL].http://hlog.sina.com.cn/s/blOg_6al2c30h0100mxpu.html.2010年