鄭夜星,林其偉
(華僑大學 信息科學與工程學院,福建 泉州 362021)
隨著移動通信的快速發展,移動多媒體成為移動通信發展的新熱點,第三代移動通信(3G)標準的制訂使得通過無線信道傳輸視頻信息成為可能。可分級視頻編碼(Fine Granular Scalable,FGS)可以很好地解決由于網絡的異構性帶來的帶寬波動而引起的圖像質量問題。但是,FGS獲得的所有這些特性都是以犧牲編碼效率為代價的,為了提高FGS編碼效率,筆者提出一種新的算法,在增強層中引入一種快速的AdaBoost[1]人臉檢測算法,快速準確地定位出視頻的感興趣區域,通過提升位平面,優先傳輸感興趣區域(ROI),改善視頻的主觀視覺效果。在基本層引入基于增強層的單環FGS[2],有效提高了FGS的編碼效率,而且實現了較好的ROI效果。
AdaBoost是一種分類器算法,是由Y.Freund[1]等人在1995年提出的。其核心思想是針對同一個訓練集訓練不同的分類器 (弱分類器),然后把這些弱分類器集合起來,構成一個更強的最終分類器(強分類器)。算法流程圖如圖1所示。通過AdaBoost快速人臉檢測算法,能夠準確定位出人臉的個數和人臉在視頻幀中的位置,以便在后期的編碼端能夠優先編碼,進行位平面提升,從而改善視頻的主觀質量。

圖1 AdaBoost算法流程圖
通過上述AdaBoost快速人臉檢測算法,定位出人臉區域,并把它作為感興趣區域,引入到FGS視頻編碼器當中。基于AdaBoost的FGS視頻編碼方式能充分利用人的視覺特性,與其他感興趣區域算法相比,具有自適應選擇,不易受到由于復雜背景、光線等條件的影響等優點。但由于AdaBoost人臉檢測本身復雜度較高,引入FGS后,加大整體的復雜度,編碼時間也變長。
AdaBoost人臉檢測算法僅僅針對圖像的感興趣區域來提高圖像的主觀質量,沒有從根本上提高FGS的編碼效率[3-4],針對這一缺點,筆者把基于AdaBoost的FGS與單環的FGS相結合,即把提高視頻的主觀質量與客觀質量相結合。考慮到AdaBoost的FGS編碼復雜度較高,本文采用復雜度最低的單環FGS,即把使用質量更高的擴張基本層圖像(基本層+增強層)作為基本層的參考,通過提高基本層運動補償的效率來降低基本層殘差圖像的能量,提高基本層的編碼效率。對于增強層,由于基本層殘差圖像能量的下降,殘差圖像量化前后的差值的能量也減小了,也就是說增強層需要編碼的源信息能量降低了,故增強層的編碼效率相應也得到提高。但該方法在比特率較低的情況下會產生預測漂移,故采用了根據網絡帶寬的動態調整來重建高質量參考所使用位平面個數的方法。其基本原理圖如圖2所示。

圖2 基于AdaBoost的單環FGS原理圖
之前有人提出了基于膚色的人臉區域FGS編碼[3]和基于H.264的自適應選擇增強FGS視頻編碼[4],雖然也達到了自適應的效果,但誤檢率較高,極易受到易受復雜背景、光線等條件影響。本文的方法引入了快速高效的AdaBoost人臉檢測,大大提高了檢測率,同時,將感興趣區域提升與單環算法相結合,更好地提高了視頻的客觀質量與主觀質量。
為了測試兩種算法的效果,進行了仿真實驗。實驗中選擇了Carphone和Foreman QCIF序列,基本層碼率都為60 Kbit/s。增強層碼率范圍為60~240 Kbit/s,熵編碼方法為CABAC,不考慮B幀,編碼幀類型為IPPP…,編碼30幀,幀率為30幀/秒(f/s),允許率失真優化宏塊模式判決,量化參數為38。使用重建圖像序列亮度分量的平均峰值信噪比 (PSNRY)作為視頻質量的客觀評價標準。實驗分析中對采用AdaBoost人臉選擇提升算法的FGS所定義的ROI區域與整體區域進行了比較。
實驗一:采用基于AdaBoost的FGS編碼,結果如圖3所示。

圖3 Foreman與Carphone選擇區域與整體區域PSNR的比較
由圖3可以看出,采用基于AdaBoost人臉檢測FGS視頻編碼方法,人臉區域明顯比整體區域PSNR值高,平均高出了5 dB,而且增強層碼率越高,PSNR值差距也越大。這說明了在碼率一定的情況下,人臉區域得到了選擇增強,當碼流截斷時,能優先保證人臉部分的圖像質量。但感興趣區域PSNR的提高在一定程度上降低了整體的效率,因此引入了單環算法。
實驗二:基于AdaBoost的單環FGS編碼,結果如表1所示。PSNRe表示增強層的PSNR值,PSNRch表示選擇區域的PSNR值,t表示平均每幀編碼時間。
由表1可以看出,若只進行單環算法,增強層上提高0.3~0.6 dB,而基于AdaBoost的單環FGS編碼算法,基本層提高較少,增強層提高0.1~0.2 dB,選擇區域提高0.1~0.3 dB,整個視頻質量有所提高。這說明單環算法能在一定程度上提高FGS的編碼效率,但又由于在編碼中提升了感興趣區域的位平面,導致整體編碼效率降低,因此引入單環后,各層上沒有很大程度的提高。而實驗中兩種算法的平均每幀的編碼時間相近,這表明在第一種算法中引入單環并沒有增加編碼的復雜度,同時能提高編碼的整體效率。
綜上所述,將AdaBoost的快速人臉檢測引入FGS,能夠快速有效地定位出人臉,通過對人臉區域的位平面提升,優先傳輸感興趣區域,很大程度上提高了感興趣區域的PSNR值,提高視頻的主觀效果,但在一定程度上減低了整體效率。通過引入單環算法,在幾乎不增加編碼時間的前提下提高了編碼的整體效率。實驗證明該方法對人臉視頻序列,能自適應地提高重建視頻的主觀質量,能提高FGS編碼效率,對特定領域有一定的適用性。
[1]FREUND Y,SCHAPIRE R E.A decision-theoretic generalization of on-line learning and an application to boosting[EB/OL].[2009-10-25].http://www.ee.columbia.edu/~sfchang/course/svia-F03/papers/freund 95decisiontheoretic-adaboost.pdf.
[2]MIHAELA V D S,HAYDER R.Double-loop motion compensation fine granular scalablity[EB/OL].[2009-10-20].http://www.freepatentsonline.com/EP1323316.html.
[3]周孝,林其偉.基于人臉特征的自適應選擇增強FGS視頻編碼[J].電視技術,2008,32(8):23-25.
[4]YOO W H,CHA J H,JEONG W S,et al.A new selection method for H.264-based selective fine granular scalable video coding[EB/OL].[2009-10-20].http://www.google.cn/search?hl=zh-CN&newwindow=1&q=H.264+Based+Fine+Granular+Scalable+Video+Coding&btnG=Google+%E6%90%9C%E7%B4%A2&aq=f&oq=.