廖文華



摘 要 近年來,為了逃避上級主管部門的監管,電視節目中的廣告常常以游字和掛角的形式出現。文章針對電視廣告監測的實際業務需求,結合電視節目中游字廣告和掛角廣告的實際特征,分別對這兩類廣告的檢測方法進行了深入研究。在此基礎上,構建了一套基于目標檢測與文字識別的電視游字和掛角廣告監測系統。應用效果表明,該方法檢出準確率高,極大地提高了監測人員的工作效率,有助于實現廣告監測的自動化與智能化。
關鍵詞 游字廣告;掛角廣告;廣告監測
中圖分類號 TP391 文獻標識碼 A 文章編號 2096-0360(2017)08-0030-02
近年來,受到商業利益的驅動,某些電視臺,尤其是地方電視臺,試圖以多種方式加大電視廣告的投放力度。由于常規廣告需要占用節目時間,而且監管部門的例行監管力度越來越大,因此為逃避監管,電視臺常常采用在節目正常播出的過程中以插播的方式來投放廣告,其中以游動字幕或掛角廣告最為常見。
為了規范游字、掛角廣告的播出情況,2009年9月10日,國家廣電總局發布了《廣播電視廣告播出管理辦法》,即61號令,對游動字幕廣告和掛角廣告的播出規范做出了兩條嚴格規定[1],概括起來即為一是掛角廣告的播出內容進行了限制,僅允許播出電影、電視劇劇場或者節(欄)幕冠名標示;二是為確保節目內容的完整性,禁止插播自行組織的游動字幕、疊加字幕、掛角廣告等廣告內容。
由此可見,為維護廣電61號令的權威性,游字和掛角廣告的監測必定是廣告監測的一項重要內容。由于游字、掛角廣告多屬于自行插播方式,占屏范圍小,播出時段規律難掌握,因此依賴傳統的人工值守監看的方式,不僅費時費力,而且靈活性不夠,重復性、穩定性差,且易受監測人員的主觀影響,隨著監測頻道內容的增加、監測業務范圍的推廣,人工監測方式已無法滿足廣播電視監測行業的需求,迫切需要借助先進的計算機技術,自動完成違規游字、掛角廣告的實時監測。
本文主要內容組織如下,首先對游字、掛角廣告的顯性特性進行闡述,然后討論了相關檢測技術的研究現狀,最后結合電視廣告監管的業務特點,本文實施搭建了一套基于視頻目標檢測與文字識別的游字與掛角廣告監測系統,實際應用效果表明該系統極大地提高了游字與掛角廣告監測的自動化程度。
1 游字與掛角廣告的顯性特征[2]
在電視節目中插播的游字或掛架廣告,為保證播出效果,都有其較為顯著的規則特征,如圖1所示。
游字廣告的顯性特征:
1)一般處于屏幕畫面的特定區域,如最下方區域(有些電視臺會將其放在屏幕的兩側邊緣區域);2)游字廣告內容在節目播出時持續滾動播出,但單條內容保持不變。
掛角廣告的顯性特征:
1)一般占用屏幕的固定區域,多處于屏幕畫面的某個邊角,如右上角、左下角或右下角;2)內容多為固定不變的靜態廣告圖片,或者是有限變動的動態圖片,持續時間通常為幾分鐘。
2 游字與掛角廣告檢測技術的研究現狀[3-5]
電視視頻節目內容中的游字與掛角廣告的檢測屬于特定圖像檢測技術的范疇,其檢測方法一般包括如下步驟:
1)抽取待檢測視頻中的關鍵幀序列;2)從關鍵幀序列中抽取視頻圖像中穩定區域;3)對所抽取的穩定區域進行跟蹤,檢測穩定區域在時序上的變化情況;4)根據時序變化情況的不同,確認并提取穩定區域中的游字或掛角廣告。
對于游字廣告,一般檢測流程如下:
1)設定感興趣的圖像區域坐標范圍,例如屏幕的下方;2)抽取關鍵幀序列,并檢測關鍵幀序列中所設定區域中是否包括靜態文字和動態文字;3)計算關鍵幀序列之間的運動向量信息,在該運動向量對應視頻關鍵幀上再次進行文字檢測,檢測出的文字與前面時刻的視頻關鍵幀文字進行交集檢測和確認,并得到視頻圖像的滾動文字區域面積;4)對滾動文字區域信號進行平滑,從而判定滾動字幕出現的時段。
對于掛角廣告,一般檢測流程如下:
1)設定感興趣的圖像區域坐標范圍,例如屏幕的左下角或右上角;2)提取關鍵幀序列,并對關鍵幀圖像的固定區域進行像素值計算,且在時序上跟蹤其變化情況,并轉換成運動向量并進行中值平均,以過濾運動向量中的檢測噪點;3)根據運動向量的信號序列分布情況,進一步判定掛角廣告的位置以及出現時段。
上述方法雖然可以監測到是否出現游字或掛角廣告,但對廣告所屬類別、廣告內容無法進行提取。
3 基于目標檢測與文字識別的電視游字和掛角廣告檢測方法
本文通過進一步收集、觀察、分析游字和掛架廣告的特點發現,無論游字還是掛角廣告由于其所處位置占比電視屏幕較小,因此為更多傳遞廣告信息多為靜止或滾動的文字信息,基于此本文提出了一種融合目標檢測與文字識別的電視游字和掛角廣告檢測方法,既可以判斷是否有違規游字或掛角廣告出現,又可以獲取違規廣告的內容,有助于進一步提升自動監管的程度,該方法的技術路線如圖2所示。
與傳統方法相比該方法不僅能夠檢測出電視節目中是否違規出現游字或掛角廣告,同時能夠對游字或掛角廣告的內容進行識別轉寫成文字。為驗證該方法的效果,我們收集了14個地方頻道的包含游字或掛角廣告的節目視頻共計30小時,并對其中出現游字廣告、掛角廣告進行人工標注,其中游字廣告違規播放143次,總字數2 536個;掛角廣告廣播違規播放52次,總字數248個。經過測試實驗結果表明該方法檢測識別的速度超過10倍實時(即10小時視頻內容1小時檢測完畢),游字廣告、掛角廣告檢測判別準確度如表1所示,內容識別準確度如表2所示。
發現檢測識別掛角廣告多為背景與掛角廣告對比度較低或其本身動態變化性較強,游字廣告錯誤的原因多為廣告播出時長較短,無法準確判定其是否具有滾動屬性。
其中,掛角廣告的識別率較游字廣告識別略低的原因主要在于,掛角廣告字體多變,且多為內容簡短(不利于利用語言模型進行糾錯)。