陸安江,賀 松
(貴州大學計算機科學與信息學院,貴州 貴陽 550025)
隨著因特網業務的快速增長,在速率起伏很大的IP網絡及具有不同傳輸特性的異構網絡上進行視頻傳輸的要求和應用越來越多。在此背景下,視頻分級編碼的重要性日益突出,其應用非常廣泛,且具有很高的理論研究及實際應用價值,因此受到人們的極大關注。但現有的分級編碼存在諸多的不足,如算法復雜度高、計算量大、編碼效率低等,并缺乏足夠的靈活性[1,2]。基于小波變換的分級編碼雖然具有很好的可分級性,但其算法結構復雜,與主要標準的架構差別較大,很少在實際中得到應用[3]。在AVS(Audio Video coding Standard)信源編碼標準體系中,通過設置特殊的碼流結構,對殘差數據進行分級編碼,這種分級方法并不影響在變換域中進行幀內預測,不會造成誤差積累,可以將其很好地應用于實際[4,5]。而目前流行的IPTV視頻播放系統,由于其網絡交換環境復雜多樣,傳輸視頻質量必然受到網絡環境因素的影響,特別是基于農村的終端用戶,普遍傳輸環境條件較差,于是需要從源頭上解決制約視頻在傳輸過程中的問題。為了節省成本,同時在不影響視頻質量的前提下,越來越多的目光將較差網絡環境下高質量視頻傳輸的解決方法轉移到視頻的編碼上。
在本文介紹的系統設計中,由于擬將分級編碼直接應用于適合邊遠農村信息服務體系遠程多媒體視頻架構的UT斯達康奔流系統,系統通過IP網絡傳送廣播級視頻質量的視頻及互動娛樂服務,可以為用戶提供端到端多媒體、語音等數據業務。系統整體采用分布式體系架構部署(如圖1所示),分為存儲分發平臺、內容服務平臺、網絡分發平臺、運營支撐平臺、終端服務平臺5部分。該解決方案主要包含內容存儲、加密、分發、播放等[6]。

圖1 IPTV分布式體系架構Fig.1 IPTV distributed system structure
在內容分發方面,該系統采用靈活、高效的寬帶媒體內容分發協議來實現媒體站中的流媒體內容靈活分發。其充分利用IP服務的不保證服務質量特性,采用AVS視頻分級編碼進行優化設計,支持網絡速率的容錯控制管理。內容分發由媒體服務器、媒體引擎等共同完成。其中,分發策略的定制和設置主要由媒體內容管理來完成,支持PUSH、PULL分發機制,并按照預定的策略觸發分發服務,通過媒體數據位置注冊服務器記錄整個系統中媒體內容的存儲位置信息,并保持實時更新。在內容管理器的觸發下,由媒體服務器、媒體引擎共同承擔視頻內容分發服務[7]。對于IPTV農村信息服務系統,視頻推送速度及壓縮質量也成為制約農村用戶推廣的瓶頸,而AVS分級編碼通過優化視頻的PSNR值和碼率來解決此問題。
常用視頻壓縮標準方法如文獻[4,5]中所述,將圖像劃分成4×4或8×8的小塊,首先進行幀間預測或幀內預測,然后做離散余弦變換(DCT)變換,量化后按頻譜進行分段,最后對整個圖像的每一個分段統一進行熵編碼[8]。
針對選取的系統架構,在同一頻段內,將整個圖像中所有宏塊中的每一個分塊的系數進行統一編碼。所有宏塊中的DC系數、宏塊頭、塊頭信息統一進行編碼;針對其它層的AC系數,采用游程編碼;對于DC系數,則采用DPCM進行預測編碼。開辟一個獨立的緩沖區來存放每一層編碼的碼流信息,然后將所有緩沖區聯結在一起,并且在碼流頭部加上每個緩沖區的長度[6,7]。采用這種編碼方式,解碼器就可對每個編碼層進行相應的解碼。
由于塊與塊之間具有相同的特性,為了簡化問題,可以只選取一個塊來進行計算。將一個8×8像素構成的塊記為Pix-cur[8][8],而將相應的參考塊記為Pix-ref[8][8],記 DCT變換矩陣為 T,由于DCT變換也是線性變換,于是有:

式中,T-1表示T的轉置。記Dctxi為除第i段的系數不變其它系數為零的矩陣,則有:

在編碼器端按最高質量進行編碼,因此,所有8個段的系數都要進行編碼,并需要更新所有段的DCT系數。由于DCT變換的線性特性,更新等價于在像素空間域參考圖像內進行,那么,就只需要在解碼器端設置變換域內的參考塊,不必在編碼器端設置變換域的參考塊。在編碼器端沿用通常的像素空間域的參考圖像,便于進行運動搜索[8]。
在解碼器端,由于普通像素域內的解碼器的參考圖像只能用部分DCT系數來重構,而分級編碼能夠只對部分較低頻段(n<8)上的系數求解,這時如果仍然采用空間域內的參考圖像,勢必造成編解碼的參考圖像不一致。因此需要在解碼器終端增設一個位于DCT變換域內由每一個宏塊中的相應塊的DCT在每一個頻段上的變換系數構成的參考圖像。其中,每個像素為16 bit量化長度。當只有部分頻譜的系數傳過來時,將已收到的前n個(n<8)頻段的DCT系數加到相應的參考塊的系數之上,同時需考慮運動矢量后所對應的參考塊,只將相應的DCT變換域參考塊中前面8個頻段的DCT系數進行更新。這樣,就保證了編解碼器在較低頻譜(n<8)的參考圖像的一致性。該方案有效地避免了誤差積累。接下來,通過DCT逆變換來獲得相應的解碼圖像。當收到所有頻段上的信息以后,就可以獲得一個質量較高的視頻圖像。
變換域的參考圖像也是按相同的方法來劃分,因此在作逆量化和DCT逆變換之前,先根據運動矢量信息將當前頻段的差分系數加到相應變換的參考頻段上,并更新參考圖像的頻段系數,然后組合所有分級頻段n(n<8)的系數,進行逆量化與DCT逆變換,形成視頻緩沖區[9]。在進行空間域變換過程中,如果使用通常的參考圖像而不保存變換域DCT系數的參考塊圖像,可以將該參考圖像相應的塊進行DCT變換,然后只保留前 n段的系數,并設置其它系數為0。最后將接收到的前n個段的DCT系數加到變換后得到的前n個段的DCT系數,再做DCT逆變換,得到相應的解碼圖像。
通過在AVS的參考軟件最新版本 RM52K-r1的基礎上進行設計,選取視頻圖像測試序列如表1所示。分微度(Mother-daughter)、輕度(News)、中度(Foreman)和劇烈(Bus)變化程度進行仿真實驗,得到的結果如圖2所示。

表1 測試序列特性說明Tab.1 Test sample′s characteristic

圖2 AVS-QSVC各級碼率和PSNR比較Fig.2 Comparison between AVS-QSVC per-level code rate and PSNR
從圖3(I幀后的第21幀)和圖4(I幀后的第10幀)可以看到,從第0級到第8級,峰值信噪比值逐漸增大,碼率也逐漸增加。這種能力使得編碼后的碼流具有了一定的可伸縮性,從而在帶寬受限和信道不可靠等情況下能夠進行可靠、有效的傳輸,因此可根據不同用戶的網絡帶寬,選擇相應碼率的視頻流傳送給用戶終端,從而保證了用戶在不同的網絡帶寬下都能得到相應質量的視頻服務。

圖3 Foreman序列分級結果Fig.3 Scalable coding of Foreman sequence

圖4 News序列分級結果Fig.4 Scalable coding of News sequence
針對IPTV在農村信息服務系統中存在的視頻帶寬受限問題,從實效的角度出發,在標準框架下提出了實用的視頻可分級編碼方法。該方法與基于小波變換的分級編碼方法相比,其運算復雜度大大改善,能夠很好地匹配AVS標準框架,可以與其它分級編碼方法組合使用,得到更加靈活的分級編碼方案,從而在實踐中得到較好應用。另外,本方案很容易實現8級可調,使靈活性大大提高,能較廣泛適應不同的網絡交換環境。
[1] ITU-T Recommendation H.261,Video codec for audiovisual Services at p×64 kbit/s[S].
[2] ITU-T Recommendation H.263,Video coding for low bit rate communication[S].
[3] Wang Xianghai.Research on Spatial Scalable Video Coding Based on Wavelet[J].Computer Science,2002,29(7):115-117.
[4] ISO/IEC 14492-2(MPEG-4 Visual),Coding of audiovisual objects-Part 2:Visual[S].
[5] ITU-T Recommendation H.264 and ISO/IEC 14496-10(MPEG4-AVC),Advanced video coding for generic audiovisual services[S].
[6] 賀松,陸安江,張正平.農村信息化建設中IPTV系統存儲技術研究與應用[J].貴州農業科學,2009,37(6):239-240.HE Song,LU An-jiang,ZHANG Zheng-ping.Research and Applicationof IPTV Storage Technology in Rural Information Construction[J].Guizhou Agricultural Sciences,2009,37(6):239-240.(in Chinese)
[7] 劉旭,陸安江,賀松.基于流媒體的農業信息化系統的設計及內容分發的研究[J].電腦知識與技術,2009,5(33):9496-9497.LIU Xu,LU An-jiang,HESong.The Design of Agricultural Information System and the Research of CDN Based on Streaming Media[J].Computer Knowledge and Technology,2009,5(33):9496-9497.(in Chinese)
[8] Luo L,Li J,Li S,et al.Motion compensated lifting wavelet and its application invideo coding[C]//Proceedings of International Conference on Multimedia and Expo.Tokyo,Japan:IEEE,2001:365-368.
[9] Secker,Taubman D.Lifting-based invertible motion adaptive transform(LIMAT)framework for highly scalable video compression[J].IEEE Transactions on Image Processing,2003,12(12):1530-1542.