朱曉蓉
[摘要]首先對圖像編碼標準的發展作了分析;然后介紹圖像編碼原理;最后簡單地介紹圖像編碼新標準。
[關鍵詞]圖像編碼標準 ISO/IEC ITU MPEG H.264 H.265 AVS
中圖分類號:TP3文獻標識碼:A文章編號:1671-7597(2009)0220018-03
1948年,信息論提出,奠定了圖像數據壓縮技術的基礎。直至今日,圖像編碼已走過了整60年的歷程。
一、制定圖像編碼標準的國際組織
(一)ISO/IEC
國際標準化組織(International Organization for Standardizati
on,簡稱ISO)是目前世界上最大、最具權威性的國際標準化專門機構。國際電工委員會(International Electrotechnical Commission,簡稱IEC)是世界上最早的國際性電工標準化機構。負責制定MPEG系列編碼壓縮標準。
(二)ITU
國際電信聯盟(International Telecommunication Union,簡稱ITU),是國際電信界最權威的標準修訂組織。1972年12月起,電信標準化部、無線電通信部和電信發展部承擔著ITU的實質性標準制訂工作。其中,電信標準化部門由原來的國際電報電話咨詢委員會(CCITT)和國際無線電咨詢委員會(CCIR)的標準化部門合并而成。負責制定H系列編碼壓縮標準。ISO/IEC與ITU有時又聯合一起制定編碼壓縮標準。這可從圖1中看出。
二、圖像編碼標準及所采用的技術
(一)MPEG系列標準
ISO/IEC制定了MPEG-1、MPEG-2、MPEG-4(2)以及MPEG4(10)標準。主要用于電視廣播和消費類電子產品。
(二)H系列標準
ITU制定了H.261、H.262、H.263、H.263+、H.263++、H.264標準。主要用于通信類電子產品。
(三)兩個系列標準的對應關系
表1示出了視頻編碼標準發展歷程,分別由ISO/IEC與ITU制定的編碼壓縮標準,以及由ISO/IEC與ITU聯合制定的編碼壓縮標準。
由表1可見,圖像壓縮標準可分為兩大系列:MPEG-X;H.26X。它們在數據壓縮技術和輸出碼率之間有如表2所示的對應關系。
(四)中國的AVS標準
我國是ISO/IEC組織的正式成員國,國家信標委下屬的多媒體分委員會與ISO/IEC JTC1/SC29直接對口。從2000年5月開始,我國開始跟蹤并參與JVT標準的制定工作,目前已有多項技術提案遞交到JVT標準,有些技術已經被JVT標準所接收。
基于我國專家多年參與MPEG國際標準制定的經驗,2002年6月成立的“數字音視頻編解碼技術標準工作組”聯合國內從事數字音視頻編解碼技術研發的科研機構和企業,提出了我國自主的數字音視頻編解碼技術標準AVS(Audio Video coding Standard)。于2003年年底完成的AVS 1.0標準具有四個特點:①性能高,與H.264基本相同;②算法的復雜度比H.264低;③軟件和硬件實現成本都比H.264低;④專利授權費用低。
(五)目前業界最看好的二三種主要標準的對比
1.3種編碼標準的基本功能
3種編碼標準的基本功能對比如表3。


這三種主要編碼技術各有優缺點,MPEG-4(2)發布較早,產業化程度較高,產品相對成熟,價格也較低,同時算法復雜度較低,但是編碼效率也相對較低,速率較高,對網絡要求較高。對于H.264標準,已經有多家廠商提供H.264芯片和機頂盒,產品成熟,而且因為采用了多項提高圖像質量和增加壓縮比的技術措施,在不影響視頻效果的情況下能夠比MPEG-4(2)節約39%的碼率。例如要達到標清質量,MPEG-4(2)編碼需要1.5~2Mbit/s的碼率,而H.264只需要1.2~1.5Mbit/s碼率即可;對于高清圖像質量,MPEG-4(2)編碼的視頻碼率需要6~8Mbit/s,而H.264只需要4~6Mbit/s。因此在信道總容量相同的情況下能夠覆蓋更多的用戶。同時,由于H.264是由ITU-T和ISO/IEC聯合制定的,所以對解碼兼容性有著明確的定義,具有較強的抗誤碼能力,容易獲得穩定的圖像,適用于丟包率高、干擾嚴重的信道傳輸。不過H.264的算法復雜度較高,系統開銷也比較大。
AVS是近幾年才提出的視頻標準,產業化進程落后于H.264。但是AVS的編碼效率與H.264相當,而算法復雜度比H.264明顯低,其編碼復雜度相當于H.264的30%;解碼復雜度相當于H.264的70%,軟硬件實現成本都低于H.264;由于具有自主知識產權,專利費用低,可以預期AVS標準將會是支撐國家數字音視頻產業發展的重要標準。
2.專利費用對比
3種標準對應的專利費用如表4所示。
可以看出在專利費方面AVS占有絕對的優勢。MPEG-4和H.264不僅要收軟硬件的專利費,而且還要收取節目點播費用等,中國龐大用戶群將給運營商帶來每年數以億計的巨大專利費負擔;而AVS只收取1元人民幣的象征性費用,對于運營商來講非常具有吸引力。
3.應用情況對比
從目前情況看,MPEG-4和H.264在中國市場應用較普遍,兩者已應用在中國電信和中國網通開展的手機電視試驗及商用網中。由于AVS推出較晚,還處于上下游產業鏈的完善階段,在市場的推廣和開拓方面還有待加強,真正商用有待驗證其圖像質量、是否滿足商用要求和產業鏈的逐漸成熟。目前3種標準常見的應用場景列舉如表5。
(六)截至目前為止圖像壓縮編碼所采用的技術
截至2008年國內外所有圖像信源壓縮標準都是采用混合編碼壓縮方法。它包括內插法、預測編碼、變換編碼和熵編碼等技術,統稱為混合編碼壓縮方法。所有標準都可用圖1所示的“混合型”編碼方案的框圖描述。從圖1可以看出,在編碼器的虛線框內實際上就是解碼器,所以說編碼器中包括了解碼器。
之所以有新舊標準的差異,是因為每個框圖中所采用的技術不同,較早提出的標準技術較簡單,新標準的技術較精細,帶來壓縮倍數的不斷提高。該方案中用運動補償幀間預測去除圖像在時間域的冗余度,然后用變換變換編碼去除空間域的冗余度,最后再用熵編碼去除經量化后的變換系數中所含的統計冗余度。變換系數的量化利用了人眼的視覺特性,量化器的精度還受到輸出緩存器狀態的控制。輸出緩存器是為了適應恒定碼率信道的要求,平滑變字長編碼器輸出的不均勻碼流而設置的。當緩存器接近上溢和下溢時,通過反饋控制量化器的精度調整緩存器的輸入碼流,保持輸出數碼率的恒定。但現在很多標準編碼器都不加緩存器,采用變速率輸出,有利于統計復用,提高圖像質量。圖1的信源編碼方案,是積60年圖像編碼經驗之總結。
三、圖像數據格式
(一)幾種典型數字電視設備數據格式
表6列出了幾種典型的數字電視設備的數據格式。
注:QCIF:Quarter Common Intermediate Format(四分之一公用中間隔式);CIF:Common Intermediate Format(公用中間隔式);SIF:Source Input Format(源輸入格式);VCD:Video Compact Disk(視頻光盤);DVD:Digital Video Disk(數字視頻光盤);HDTV:High Definition Television(高清晰度電視);D:Definition(分辨率)。H.264標準由于采用4×4整數變換,上表應采用(4×4)數據格式。
(二)極高清晰度成像(HRI)格式
ITU-R BT.1201建議書提出了極高清晰度成像(HRI)格式和規范。該建議的提出主要考慮到超高清晰度圖像能夠在諸如計算機圖形、印刷、醫療、數碼相機和電視電影等領域的圖像系統中使用。HRI典型空間分辨率的級別的建議如表7所示。

四、圖像編碼的未來
(一)圖像編碼壓縮遵循的規律
圖像編碼壓縮算法的壓縮比由下式決定。
壓縮技術層出不窮,圖像數據壓縮比不斷提高。著名圖像專家德國Musmann教授2006年在北京主持了“圖象編碼的過去與未來”專題討論會,并首先發言,對圖像編碼壓縮技術的過去幾十年工作作了總結,認為:達到廣播質量的視頻編碼的壓縮比大約每5年翻一番,并畫出了圖3曲線。后來被公認稱為Musmann定律。
(三)未來的圖像編碼標準
1.新標準H.265
據報導,約于2012年推出的H.265新標準也是采用“混合型”編碼方案,也可用圖2框圖來描述。壓縮比是H.264的兩倍。其技術主要在對H.264的改進和增強??筛攀鋈缦拢?/p>
(1)提高壓縮效率;具有魯棒性,提高錯誤恢復能力(如用于手機通信);
(2)減少時延(實時時延、信道獲取時間、隨機接入時延);
(3)減少復雜度等。
采用的主要算法有:
(1)自適應插值濾波器,編碼增益約提高1dB;
(2)1/8像素精度運動補償預測,可使比特率減少3~14%;
(3)運動矢量競爭機制,將預測塊的集合由原來的空間域擴展到了時間域及空時混合域??傻玫狡骄鶠?.1%的壓縮增益(對復雜運動這一增益可達20%);
(4)迭取自適應量化矩陣,對于每個宏塊基于率失真函數選擇最優的量化矩陣;
(5)空域和頻域自適應預測殘差編碼,采用這一方法,與H.264相比,在相同比特率時,PSNR可提高到0.02~1dB。
2.暢談未來
從上述可知,即使推出H.265新標準,其壓縮比也不會超過400。筆者認為,如果繼續采用圖2所示“混合型”編碼方案,壓縮比再要得到大幅度提高,很難了。必須改換一種思維、改換一種方案來考慮。幸而,已有不少學者在探討壓縮比高達1000~10000的技術,只不過目前還不能實時實現。隨著技術的進步,圖像數據壓縮編碼方法方興未艾。
參考文獻:
[1]ITU-T Rec.H.264.
[2]ITU-T VCEG H.265.
[3]余兆明等,圖像編碼標準H.264技術,人民郵電出版社.