邸金紅,馬鵬閣,范曼曼
(1.鄭州航空工業管理學院 電子通信工程系,河南 鄭州 450015;2.佛羅里達大學 工程學院,美國 甘斯威爾 32611)
分布式視頻編碼邊信息改進技術
邸金紅1,馬鵬閣1,范曼曼2
(1.鄭州航空工業管理學院 電子通信工程系,河南 鄭州 450015;2.佛羅里達大學 工程學院,美國 甘斯威爾 32611)
高質量的邊信息生成技術是分布式視頻編碼系統實現高壓縮效率的關鍵所在。提出一種邊信息的改進方法,對部分譯碼的Wyner-Ziv(WZ)幀中運動劇烈的區域進行空域修正,使用相鄰關鍵幀對應塊的空間預測值與實際值之間的差值來補償當前部分譯碼WZ幀中空間預測的誤差。仿真結果表明該方法提升了邊信息的質量,進而提高了DVC系統的率失真性能。
分布式視頻編碼;邊信息;空域修正
隨著“三網融合”與“物聯網”產業的不斷推進,新一代視頻壓縮編碼技術——分布式視頻編碼(Distributed Video Coding,DVC)引起了業內廣泛的關注。然而DVC與傳統的視頻編碼仍然存在一定的性能差距。如何提高DVC的率失真(Rate Distortion,RD)性能,其關鍵點之一在于如何在編碼端速率滿足適定的要求下,提高譯碼端邊信息(Side Information,SI)的質量。所謂邊信息是相對主信息而言的,主信息為編碼端生成的關于信源的信息,而邊信息是指除主信息之外一切關于當前信源的信息。在相關信源各自獨立編碼的前提下,譯碼端所獲得的邊信息質量越高,信源間的統計相關性挖掘越充分,編碼端需要傳遞的主信息越少,壓縮效率越高。
目前邊信息生成方法主要包括兩類:一類是基于相鄰幀線性預測方法[1-3],即邊信息由相鄰幀線性預測獲得,預測方法可以是前一相鄰幀和后一相鄰幀運動補償內插,或者采用相鄰幀運動補償外推;第二類是基于編碼端輔助信息生成方法[4-6],即在編碼端為待譯碼的WZ幀傳送輔助信息,用以輔助譯碼端生成更高質量的邊信息。這類方法編碼端傳遞過多的輔助信息會增加編碼復雜度,帶來系統壓縮性能的降低。而第一類方法主要受限之處在于,相鄰視頻序列中物體的運動是線性運動,通過線性預測得到插值后的圖像。線性插值法在處理慢速、簡單運動的視頻序列時效果良好,但是當處理中高速運動或者運動復雜的物體時,線性插值法的性能急劇下降,造成最后重構的WZ幀效果較差。然而,視頻幀除了在時間上具有連續性和相關性,在空間上也存在相關性,通常在運動補償時域內插(MCTI)方法中沒有利用視頻幀在空域上的相關性。為補償線性假設和高速運動的限制,本文提出了一種邊信息改進方法。對于視頻幀中運動復雜或者高速運動的區域,利用空間相關性改進邊信息質量。
本文提出一種邊信息的改進方法,首先利用時間相關性生成初始邊信息,對于運動復雜或者高速運動的區域,時間方向上預測不準確,此時利用空間上的相關性對初始邊信息的對應區域進行空域修正。DVC解碼端邊信息的生成過程如圖1所示。

圖1 使用空域相關性修正初始邊信息
邊信息改進方法如下:首先,已解碼的相鄰關鍵幀使用MCTI方法獲得初始邊信息,在運動估計過程中,記錄下運動矢量的大小,對運動矢量幅度大于某一給定閾值的塊,認為該區域的運動復雜或者速度較快,該區域的塊需要下一步的空域修正。其次,使用信道傳輸的校驗比特對初始邊信息進行初次譯碼,此時生成的WZ幀稱為部分譯碼的WZ幀。對部分譯碼的WZ幀的運動劇烈塊采用本文提出的空域修正方法進行修正,具體過程如下所述。最后,將修正后的部分譯碼的WZ幀作為邊信息,結合校驗比特進行第二次譯碼,通過重構和反DCT變換后得到最終的譯碼WZ幀。
本文提出的空域修正方法如圖2所示。

圖2 本文提出的空域修正方法
塊A是需要進行空域修正的區域。假設A相鄰位置處的其他塊a,b,c,d都不需要進行空域修正,那么A處的像素計算式為
(1)
式中:a(x,y)表示塊a位于(x,y)處的像素值,同理對于塊b, c, d,此處認為各相鄰塊在預測A塊時的權值相同;A′(x,y)表示塊A位于(x,y)處像素的預測值,該像素的實際值為A(x,y)。由于實際值A(x,y)與預測值A′(x,y)之間存在誤差dA,因此,如果能夠計算出dA,那么實際值為
A(x,y)=A′(x,y)+dA
(2)
本文提出使用相鄰的已譯碼的關鍵幀中對應塊的信息來估計部分譯碼WZ幀中的dA。圖2b是與當前WZ幀相鄰的已譯碼的關鍵幀,可以是前一關鍵幀,也可以是后一關鍵幀。圖2a中塊A是圖2b中塊B通過運動估計得到的,二者是通過運動矢量相關聯的對應塊,即A(x,y)對應B(m,n)。對塊B使用與A相同的空間預測算法得到預測塊B′,即

(3)
式中:B′(m,n)是塊B位于(m,n)處像素的預測值,a1,b1,c1,d1是塊B的相鄰塊,用來進行空間預測。對已譯碼的關鍵幀來說,實際值B(m,n)是已知的,因此實際值與預測值之間的誤差為
dB=B(m,n)-B′(m,n)
(4)
得到關鍵幀中空間預測與實際值之間的誤差dB后,使用該誤差值作為部分譯碼WZ幀空間預測誤差dA。本文使用前后兩個關鍵幀作為參考幀,假設前后兩幀與圖2中A(x,y)對應的分別是B(m,n),C(u,v),分別計算對應塊的空間預測誤差dB-before和dB-back,取二者的平均值作為dA的值,即
(5)
本文算法在實現過程中,對圖2a中塊A進行空間預測時,使用的相鄰塊都是部分譯碼WZ幀中不需要進行空域修正的塊。如果塊A的相鄰塊也需要進行空域修正,那在預測A塊時使用除該塊之外的其余不需要空域修正的塊,相應地關鍵幀中的塊B也使用同樣位置的塊進行空間預測。如果A的4個相鄰塊都需要進行空域修正,則增大塊的像素(如從8×8變為16×16),以保證空域修正的參考塊都是時間方向上預測較為準確的塊。
仿真測試序列為QCIF格式的Foreman和Coastguard序列,將本文算法用于Aaron等[7]提出的DVC系統中。DVC系統性能測試中,每組圖片(GOP)的數目是2。編碼時,偶數幀為關鍵幀,采用H.264/AVC幀內模式編碼;奇數幀為WZ幀,采用Wyner-Ziv編碼。測試序列各取100幀,幀率為30f/s(幀/秒)。仿真過程中,峰值信噪比PSNR用每一幀的亮度分量計算。RD曲線只考慮WZ幀亮度分量的平均碼率及平均PSNR值。
圖3和圖4分別給出了Foreman序列和Coastguard序列的前100幀的邊信息PSNR的仿真結果。提出的邊信息改進方法與MCTI進行對比,仿真結果表明,本文提出的基于空域修正的邊信息改進方法,更有效地提高了視頻序列邊信息的PSNR值。對Foreman序列和Coastguard序列,采用本文方法提升的PSNR的平均值分別約為0.94dB和1.68dB。本文方法主要是對運動劇烈的塊進行空域修正,因此對運動相對較快的Coastguard序列提升的性能比較大。
為了更直觀地觀察邊信息的改進質量,圖5給出Coastguard第75幀,使用MCTI和本文算法的仿真結果圖。由圖5可知,MCTI方法在大多數背景區域內插效果很好,但是由于快艇的速度很快,其上的人物受到背景的影響,輪廓非常模糊。通過本文的空域修正后,人物的輪廓變得比較清晰,提高了圖像的主觀質量。

圖3 Foreman序列邊信息PSNR值

圖4 Coastguard序列邊信息PSNR值

圖5 Coastguard主觀質量比較(第75幀)
圖6和圖7為兩個序列的率失真曲線。將本文算法與Aaron等[7]提出的方案、H.264幀內、H.264幀間做了比較。從仿真結果可以看出:本文提出的算法和Aaron算法相比PSNR性能提高了0.7~1.5 dB,也相應縮小了DVC與H.264幀間編碼率失真性能之間的差距。

圖6 Foreman序列率失真曲線

圖7 Coastguard序列率失真曲線
本文提出了一種新的邊信息改進方法,對部分譯碼的WZ幀中運動劇烈的區域進行空域修正,從而得到新的邊信息進行WZ幀譯碼。仿真結果表明,在沒有增加編碼復雜度的情況下,本文提出的算法不僅有效改善了邊信息的質量,而且提高了DVC系統的性能。
[1]CAGNAZZO M, MAUGEY T, PESQUET-POPESCU B.A differential motion estimation method for image interpolation in distributed video coding[C]//Proc.IEEE International Conference on Acoustics, Speech and Signal Processing.Taiwan: IEEE Press, 2009: 1861-1864.
[2] PETRAZZUOLI G, CAGNAZZO M,PESQUET-POPESCU B.High order motion interpolation for side information improvement in DVC[C]//Proc.IEEE International Conference on Acoustics, Speech and Signal Processing.Dallas Texas,USA: IEEE Press, 2010: 2342-2345.
[3]NATRIO L, BRITES C, ASCENSO J, et al.Extrapolating side information for low-delay pixel-domain distributed video coding[C]//Proc.The International Workshop on Very Low Bit Rate Video Coding.Sardinia,Italy: IEEE Press, 2005: 16-21.
[4]史萍,羅坤.分布式視頻編碼中邊信息的產生[J].電視技術,2010,34(11):27-29.
[5]MAUGEY T, YAACOUB C, FARAH J, et al.Side information enhancement using an adaptive hash-based genetic algorithm in a Wyner-Ziv context[C]//Proc.IEEE International Workshop on Ultimedia Signal Processing.[S.l.]: IEEE Press, 2010: 298-302.
[6]DELIGIANNIS N, JACOBS M, VERBIST F, et al.Efficient hash-driven Wyner-Ziv video coding for visual sensors[C]//Proc.IEEE International Conference on Distributed Smart Cameras.[S.l.]: IEEE Press, 2011: 1-6.
[7]AARON A, RANE S, SETTON E, et al.Transform-domain Wyner-Ziv codec for video[C]//Proc.SPIE Conference on Visual Communications and Image Processing.[S.l.]:SPIE Press, 2004: 520-528.
邸金紅(1980— ),女,博士,講師,主研多媒體通信、視頻編碼與傳輸;
馬鵬閣(1976— ),博士,副教授,主研機載目標探測與跟蹤系統、機載光電對抗系統;
范曼曼(1987— ),女,研究生,主研視頻編碼。
責任編輯:薛 京
Improvement of Side Information in Distributed Video Coding
DI Jinhong1, MA Pengge1, FAN Manman2
(1.DepartmentofElectronicandCommunicationEngineering,ZhengzhouInstituteofAeronauticalIndustryManagement,Zhengzhou450015,China; 2.TheCollegeofEngineering,UniversityofFlorida,Gainesville32611,America)
The good construction technology of side information is essential to fulfill high compression efficiency for distributed video coding system.A refinement method of side information is presented in this paper.The spatial correlation of the fast-motion blocks in the partially decoded Wyner-Ziv (WZ) frame is adopted.The difference between the predication value corresponding to the key frame and the actual value of the block is used to compensate the prediction error of the partially decoded WZ frame.Simulation results show that the proposed method can improve the quality of side information and the rate distortion performance of distributed video coding codec.
distributed video coding; side information; spatial correlation
國家自然科學基金項目(61271190);河南省教育廳重點項目(14B510029)
TN949.6
A
10.16280/j.videoe.2015.05.008
2014-01-22
【本文獻信息】邸金紅,馬鵬閣,范曼曼.分布式視頻編碼邊信息改進技術[J].電視技術,2015,39(5).