馬思偉,羅法蕾,黃鐵軍
(1. 北京大學信息科學技術學院,北京 100871;2. 中國科學院計算技術研究所,北京 100081)
專題:視頻技術的理論與實踐
AVS2視頻編碼標準技術特色及應用
馬思偉1,羅法蕾2,黃鐵軍1
(1. 北京大學信息科學技術學院,北京 100871;2. 中國科學院計算技術研究所,北京 100081)
圍繞視頻編碼核心技術,簡單介紹AVS視頻編碼標準發展歷程,詳細介紹了最新一代AVS視頻編碼標準——AVS2(GB/T 33475.2-2016)的核心創新技術,主要包括:靈活的預測劃分方式、多假設幀間預測、優化的層次變換設計和自適應環路濾波處理技術以及面向場景視頻應用 AVS2提出的基于場景建模的高效預測編碼技術。和第一代AVS視頻編碼標準相比,AVS2編碼效率提升一倍以上;和同期HEVC/H.265國際標準相比,AVS2在場景視頻編碼方面有顯著優勢。另外簡單介紹了AVS標準在數字電視廣播等行業中的應用情況。
AVS;變換;預測;熵編碼;環路濾波
1948 年香農發表的《通信中的數學理論》開啟了編碼理論研究之門,至今即將邁入第70個年頭,其中提出的信源編碼、信道編碼理論對發展高效的通信系統已產生巨大的影響。就信源編碼來講,主要是研究文本、語音、音頻、圖像和視頻等各種媒體信息的編碼,最近幾年又出現了深度數據、點云數據和基因數據等新型數據類型的壓縮,但由于視頻數據量之大最為突出,長期以來視頻編碼一直是信源編碼領域的研究熱點。以監控視頻為例,北京市部署的監控攝像頭數量達50萬個之多,每小時產生的視頻時長就相當于中央電視臺建臺以來的所有庫存視頻。因此,從傳輸和存儲成本考慮,都需要研究壓縮效率更高的視頻編碼技術。
由于視頻壓縮的重要性,幾十年來學術界和工業界都對視頻編碼技術進行了長期而又深入的研究。國際上也一直有專門的標準組織制定視頻編碼標準,即 ISO/IEC MPEG工作組和ITU-T VCEG 工作組,制定了廣為人知的MPEG-1/MPEG-2/MPEG-4、H.261/H.263/H.264等系列標準[1,2]以及最新的HEVC/H.265標準。我國在圖像和視頻編碼技術方面有多年的研究歷史,但早期在國際標準制定中的參與度不高,標準技術幾乎全部為國外若干公司所壟斷,國內企業面臨巨大的專利風險。2002年,DVD專利收費事件發生時舉國震動,大批企業的主要利潤紛紛外流,給我國視聽產業造成很大壓力。在經濟全球化的大背景下,若沒有掌握核心技術與標準,我國數字媒體產業的健康發展以及國家利益都得不到充分保證。
正是在這種背景下,2002年,原信息產業部組織成立了數字音視頻編解碼技術標準(Audio Video coding Standard,AVS)工作組,目的是面向我國的信息產業需求,聯合國內企業和科研機構,制定數字音視頻的編解碼標準,為數字音視頻產業提供高效的編解碼技術,服務于數字電視廣播、無線寬帶多媒體通信、互聯網寬帶流媒體等重大信息產業應用。至今已成功制定AVS1/AVS+/AVS2等系列標準并獲得成功應用[3]。特別是 2016年底頒布的被列為國家標準的AVS2,其性能已優于同期 H.265/HEVC國際標準。尤其是對于場景視頻編碼,AVS2標準具有顯著優勢,能夠比HEVC/H.265節省40%左右的碼率。
本文首先回顧視頻編碼的關鍵技術演變過程,然后介紹AVS視頻編碼標準的發展歷程,并就AVS2視頻編碼標準(GB/T 33475.2-2016)介紹AVS在視頻編碼關鍵技術方面的特色創新。最后介紹AVS標準在數字電視廣播等行業中的應用情況。
視頻能夠進行壓縮的原因在于數字化后的視頻信號存在很多冗余,一般可將這些冗余歸納為空域冗余、時域冗余、統計冗余和感知冗余。空域冗余和時域冗余分別是指圖像在空間和時間上存在很大相關性,如重復或非常接近的相鄰像素值。統計冗余是指視頻數據信息存在統計上的不均勻性。視覺感知冗余是指人眼對圖像中的一些復雜細節信息感受不到,丟棄這些信息不會影響視覺感受質量。視頻編碼即要降低或消除這些冗余信息,對此研究者提出了一系列的編碼方法,主要可以分為預測編碼、變換編碼和統計編碼(熵編碼)三大類。
早期的視頻壓縮技術由于在硬件上受到計算和存儲資源的限制,主要是通過統計編碼的辦法降低數據的統計冗余,比如哈夫曼碼、哥倫布碼等編碼方法。后來隨著計算和存儲資源的提升開始提出更復雜也更有效的預測、變換編碼方法。預測編碼的基本思想來源于1952年貝爾實驗室 Culter等人[4]提出的差分脈沖編碼調制系統,即用前一信號對當前信號進行預測,然后對預測差值進行編碼傳送。經過預測后,殘差信號的能量比源信號的能量要低,從而降低了待編碼信號的碼率。同年Oliver和Harrison[5,6]將差分脈沖編碼技術應用到視頻編碼中,對空域相鄰像素進行差分預測編碼,后來提出基于塊的運動補償預測技術使得預測編碼性能獲得極大的提升[7,8]。
經過預測后的圖像像素數據之間依然存在較強的相關性,通過變換編碼進行正交變換分解去相關可以達到進一步降低空間冗余的目的。變換編碼于 20世紀 60年代后期被引入視頻編碼領域,早期的變換技術包括傅立葉變換、哈達碼變換等。70年代初期提出了離散余弦變換(discrete cosine transform,DCT)[9],并證明對空域相關性很高的圖像信號離散余弦變換是最優的變換。由于DCT具有復雜度低、去相關性能好的優點,在視頻編碼中得到廣泛應用,現今多采用從其演化出的類 DCT整數變換[10]。在最近的變換編碼研究方面,對于隨著預測距離增加相關性逐漸降低的幀內預測殘差信號,離散正弦變換(discrete sine transform,DST)比DCT更有效[11]。
70年代中期,預測編碼開始與變換編碼結合起來使用[12],到 80年代已形成了經典的預測/變換混合編碼框架[13]。基于預測/變換的視頻編碼框架如圖1所示,首先通過對圖像進行塊劃分,進行基于塊的幀內預測或幀間預測降低空時域冗余,然后通過變換進行正交分解,在消除數據相關性的同時進行能量集中,可以用一部分變換系數來近似表示原來的能量信息,隨后的量化過程即可達到這一個目的,量化將使部分高頻系數量化為零,然后進行熵編碼,從而達到壓縮的目的。由于預測、變換都是基于塊進行的,在低碼率端會出現明顯的塊效應,對重構圖像進行一些去塊濾波處理不僅能提升主觀質量,還能進一步提升編碼效率。這一編碼框架后來廣泛應用于大家所熟知的MPEG、H.26x、AVS系列編碼標準,直至今天最新一代的HEVC/H.265、AVS2標準也都是基于這一框架。此外,在這一編碼框架中環路濾波也是非常重要的模塊之一,它起源于早先主要用于提高主觀質量的后處理濾波,自 H.263+開始用于編碼標準,從 H.264/AVC開始廣為應用。環路濾波不僅能提升主觀質量,濾波后的圖像作為參考還能提升客觀編碼性能。在HEVC/H.265、AVS2標準的制定過程中,環路濾波技術進一步發展,除了去塊效應濾波還增加了樣值偏移補償(sample adaptive offset,SAO)、自適應修正濾波(adaptive leveling filter,ALF)等濾波技術[14]。

圖1 基于預測/變換的視頻編碼框架
2002—2017年的15年間AVS工作組一直致力于制定具有自主知識產權的視頻編碼標準,至今已成功地制定了面向高清數字電視、移動視頻、監控視頻等應用的高效視頻編碼標準。2012年,為了加快推進AVS在廣播電視行業中的應用,國家廣播電影電視總局科技司與工業和信息化部電子信息司聯合發文共同成立“AVS技術應用聯合推進工作組”(以下簡稱為AVS推進組),從此AVS標準發展進入快車道,并于2012年7月成功制定AVS+行業標準,如今AVS+已在數字電視廣播等應用中取得重要進展。2011年底AVS啟動了面向超高清應用的新一代視頻編碼標準 AVS2的制定工作,2015年底標準技術制定完成,2016年5月獲批為廣電行業標準 GY/T 299.1-2016,2016年12月正式獲批為國家標準 GB/T 33475.2-2016。AVS主要標準的制定發展過程見表1。

表1 AVS視頻編碼標準制定歷程
15年來AVS吸引了上百家科研院所、企業公司的參與,在視頻編碼制定過程中實現了視頻編碼核心技術的創新,比如最新一代的 AVS2標準已經在性能上優于HEVC/H.265國際標準,甚至在場景視頻編碼方面實現了大幅度超越。下面簡要介紹 AVS2標準的主要特色技術,包括靈活的預測塊劃分、多假設幀間預測、優化的層次變換、基于上下文的熵編碼、自適應環路濾波和基于背景建模的場景編碼。最后就AVS2與HEVC的性能加以比較。
3.1 靈活的預測塊劃分
從20世紀90年代的第一代MPEG-1、H.261標準,到以 H.264/AVC、AVS1/AVS+為代表的第二代編碼標準,都采用基于塊的預測變換編碼技術,即以 16×16像素的宏塊(macroblock)為基本的數據組織編碼單位,然后對宏塊進行劃分預測(如16×8像素、8×16像素或8×8像素塊等),最后進行基于塊的變換(一般是 8×8像素塊變換),由此可見劃分的形式約束較多。而最新的H.265/HEVC、AVS2標準采用了基于四叉樹遞歸劃分的編碼架構,即一幀圖像首先劃分成連續不重疊的最大編碼單元(largest coding unit,LCU),最大編碼單元按照四叉樹遞歸劃分的方式劃分成更小的編碼單元(coding unit,CU),如圖2所示。在AVS2中,最大編碼單元大小為64×64像素,最小可劃分成8×8像素的編碼單元。編碼單元的最終劃分模式一般通過率失真優化編碼決策選擇。編碼單元大小確定后,又進一步劃分成預測單元進行幀內預測或幀間預測,最后對預測殘差進行變換編碼。在AVS2中,變換編碼采用了類似編碼單元劃分的層次變換劃分以選擇最優的變換。

圖2 AVS2編碼單元(CU)四叉數劃分示例(最小塊為8×8像素)
對于預測單元劃分的形狀,AVS2也更加靈活。AVS2的幀間預測劃分方式如圖3所示,包括對稱劃分和非對稱劃分(asymmetric motion partition,AMP),其中非對稱劃分方式適用于16×16像素及以上CU大小。對于幀內預測,AVS2有方形和非方形兩種預測劃分模式,如圖4所示。相比于方形劃分,非方形劃分可以進一步縮短預測距離,從而提高預測的準確度[15]。考慮到復雜度和性能之間的折中,非方形劃分僅適用于32×32像素和16×16像素的幀內預測編碼單元。

圖3 AVS2預測單元(PU)幀間預測劃分模式

圖4 AVS2預測單元(PU)幀內預測劃分模式
3.2 多假設幀間預測
幀間預測編碼是一種有效降低時間冗余的預測方式,從MPEG-1引入的前向P幀、雙向B幀預測開始,后來的幀間預測技術陸續又有多參考幀預測、層次參考幀預測[16]以及針對靜止運動或一致性運動的跳過模式、直接模式,用于提高運動預測精度的 1/4像素精度預測,用于提高運動矢量預測編碼效率的中值預測、多運動矢量預測等編碼技術。
類似B幀有兩個方向的預測,AVS2中新增加了一種支持前向雙假設預測的圖像,稱為F幀。按照雙假設預測的來源可以分為時域雙假設和空域雙假設兩類[17,18]。時域雙假設如圖 5所示,當前塊可以利用兩個前向預測塊的加權平均作為當前塊的預測,其中只編碼運動矢量1,運動矢量2由運動矢量1根據時間距離導出。空域雙假設采用預定方向上的兩個預測子的平均結果作為預測值,如圖6所示,中心位置為初始預測子,選擇連線經過初始預測子的4種模式進行計算,其中1/2像素距離和1/4像素距離位置的4種模式分別計算,再加上初始預測值,共有9種模式供選擇。

圖5 時域前向雙假設預測模式示意

圖6 空域雙假設預測模式示意
3.3 優化的層次變換
類似編碼單元對圖像原始數據的劃分組織方式,AVS2對于殘差數據采用基于變換單元的層次變換編碼。AVS2支持4×4像素~32×32像素大小的方形進行DCT,并且對除了2N×2N和N×N幀內預測以外的其他預測殘差使用基于四叉樹的非方形 DCT(non-square quadtree transform,NSQT)[19]。與完全的方形變換相比,非方形變換可以避免因跨預測塊邊界變換而增加高頻系數,提高了熵編碼性能。為了降低變換復雜度,AVS2中采用了一套簡化的NSQT方案,只允許亮度殘差選擇方形或非方形劃分。如圖7(a)和圖7(b)所示,分別是水平和垂直劃分成4個非方形塊的變換結構。此外,對于8×8像素塊大小以上的亮度幀內預測殘差,AVS2對其DCT低頻變換系數再多進行一次4點的二次變換,如圖8所示。二次變換使得系數分布更為集中,從而提高幀內預測殘差的壓縮效率[20]。

圖7 NSQT示意

圖8 二次變換示意
3.4 基于上下文的熵編碼
前面提到早期的編碼標準主要采用哈夫曼碼對編碼系數進行熵編碼,優點是復雜度較低,缺點是哈夫曼碼對任何一個信源符號均需至少分配1 bit的碼字,特別是當實際信源概率分布跟預先設計的哈夫曼碼概率分布不一致時會降低編碼效率。算術編碼通過聯合編碼信源符號,理論上可以為每一個信源符號分配逼近信源概率分布的碼字,但由于復雜度高一直在視頻編碼中未被應用[21]。在H.264/AVC標準制定過程,提出的基于上下文的二值算術編碼很好地解決了算術編碼復雜度問題[22]。首先通過二值化實現信源符號的統一算術編碼過程,即將不同的信源符號轉換成0或1的二進制串,對不同信源符號的編碼轉換成僅對不同0或1的概率分布編碼,通過上下文選擇不同的概率進行編碼提高了信源符號編碼效率,同時通過查表實現算術編碼過程中復雜的概率更新計算過程。
在AVS2中,對高層語法如序列頭、圖像頭、條帶頭采用變長編碼(variable length coding,VLC),而對編碼樹(coding unit tree)級的其他語法元素采用高級熵編碼(advanced entropy coding,AEC)。無論是VLC還是AEC,首先都需要將各語法元素的值進行二值化,得到二進制串。對于二值化,AVS2有3種二值化方法:一元碼(unary code)、截斷一元碼(truncated unary code)和指數哥倫布碼(exp-Golomb code),可以將不同取值范圍的信源符號高效地轉換成二進制串進行編碼。

圖9 8×8像素變換塊中的Zig-Zag掃描順序以及其劃分的4個子塊CG中的系數的掃描順序
進一步,AVS2對變換系數編碼采用兩層組織編碼機制,即每個TU進一步劃分成若干個4×4像素塊系數組(coefficient group,CG)進行編碼[23]。圖9描述了一個8×8像素的塊編碼過程,即首先劃分成4個CG,然后每個CG內的系數按照Zig-Zag掃描方式進行編碼。基于CG的編碼方式有兩個優點:實現模塊化編碼,也就是不同變換塊大小的包含的子塊都可以使用的統一的方式進行編碼;與掃描整個變換塊相比,在軟件和硬件實施方面,都降低了計算復雜度。同樣,對于 16×16像素的TU劃分成16個子塊,32×32像素的TU劃分成64個子塊,如圖10所示。

圖10 兩層變換系數掃描方式
3.5 環路濾波
環路濾波是視頻編碼器的重要模塊之一。早期的濾波處理主要是作為一種視頻編碼后處理手段,處理后的圖像即送給顯示模塊進行顯示,環路濾波即體現在這些濾波處理處在編碼環路中。AV2中的環路濾波包括3個模塊,即去塊效應濾波、樣值偏移補償[24]和自適應修正濾波[25],分別用于濾波處理編碼帶來的不同類型的失真。去塊效應濾波主要是用于去除由于基于塊的編碼在快邊界所產生的塊效應失真,通過濾波平滑處理可以有效提升主觀質量。樣值偏移補償是指在去塊效應濾波之后基于像素進行的非線性濾波操作,基于量化失真的統計特性,進行基于區間或邊緣模式的失真補償操作。區間模式是指將0~255的像素值劃分成若干連續的區間,根據失真統計情況為相應區間的像素分配一個濾波偏置值,將這個偏移值疊加到相應像素位置進行濾波。邊緣模式分為水平、垂直和兩種對角模式4種,如圖 11所示。根據當前濾波后樣本的值與其相鄰的濾波后樣本的值的關系查表得到偏置值,對當前像素進行濾波。

圖11 樣值偏移補償的邊緣模式下樣本和相鄰樣本的位置關系
自適應修正濾波對樣值偏置濾波后的重建圖像進行類似維納濾波的處理,以進一步減小編碼失真,提高參考圖像質量。樣本補償濾波器形狀如圖12所示,為7×7十字加3×3方形的中心對稱濾波器,濾波器系數C0~C7的為取值范圍是[?64,63],濾波器系數C8的取值范圍是[0,127]。對于亮度分量,將圖像按照LCU對齊的規則均勻劃分為16個區域并訓練對應的16套濾波器系數,而對于色度分量(Cb/Cr)分別只訓練一套濾波器系數。對于亮度分量的16套濾波器系數,編碼端根據率失真性能進行自適應合并,得到最優的濾波器數目。亮度和色度分量通過幀級標志和最大編碼單元級標志來分別控制濾波器是否被使用。

圖12 樣本補償濾波器形狀
3.6 場景編碼
在諸如視頻監控、視頻會議等應用中,視頻內容有其自身的特性,即背景內容通常保持不變,稱此類視頻為場景視頻。和傳統影視視頻相比,場景視頻的數據冗余還可以被進一步挖掘,比如可以通過建立高效的背景視頻模型降低背景信息冗余。為此AVS提出了基于背景建模的視頻編碼方法[26],針對監控視頻、視頻會議等場景視頻內容實現編碼效率比同期國際標準提升約一倍左右。
AVS提出的基于背景建模的監控視頻編碼流程如圖13所示,首先經過背景建模、背景編碼、背景解碼后,生成高質量的重建背景圖像;然后,編碼器使用該重建背景完成對每幅圖像進行背景預測以降低背景部分的編碼代價,進而得到更優的編碼效率;最后,背景圖像碼流和視頻序列碼流都傳輸給解碼過程用于解碼。

圖13 基于背景建模的監控視頻編碼框架
3.7 性能比較
使用AVS2參考軟件RD12.0的編碼性能與第一代標準 AVS1對比結果見表 2。在隨機訪問(random access,RA)、低時延(low delay,LD)和全幀內(all intra,AI)編碼3種配置下,AVS2分別獲得了52.9%、51.0%和31.2%的亮度性能增益。與HEVC參考軟件(HM16.6)的性能對比見表3,在隨機訪問和全幀內編碼配置下,AVS2相比HEVC有0.9%和0.1%的性能提升;在低時延配置下,AVS2相比HEVC有2.1%的性能損失。
針對監控類視頻,AVS2與HEVC的性能對比見表4,在隨機訪問和低時延配置下,基于背景建模的場景編碼能分別提升39.1%和31.3%的編碼性能。

表2 AVS2與AVS1對比性能測試

表3 AVS2與HEVC對比性能測試

表4 AVS2基于背景建模的編碼與HEVC對比性能測試
由上述結果可以看出,第二代標準 AVS2比第一代標準 AVS1有突出的性能提升,與同期國際標準HEVC相比已在場景編碼方面大幅領先。
使用 AVS2快速編碼器 CAVS2的性能與HEVC開源編碼器x265對比見表 5和表6,和HEVC參考軟件的性能對比見表 7。測試中使用HEVC通測條件[27]中的5個1080P高清序列,其中x265使用2.4版本。CAVS2使用的量化參數QP設置為27、32、38、45,與AVS2通測條件保持一致,為保持兩者碼率和質量接近,HEVC測試使用的QP為24、28、33、38,對應x265使用的QP為27、31、36、41,均使用單線程進行編碼。此外,在RA配置下,相鄰的P幀之間的B幀數量為7個,其中x265的超快速檔次下的數量為3個。

表5 RA配置下AVS2快速編碼器CAVS2與x265性能對比
可以看到在超快速~平和5個檔次下,CAVS2在速度與 x265接近的情況下都具有明顯性能優勢,其中 LD配置下平均增益分別為?16.54%、?4.70%、?10.43%、?8.71%、?9.90%,RA配置下平均增益分別為?3.65%、?9.51%、?15.94%、?5.80%、?8.83%。
和HM16.6相比,在超快速~平和5個檔次下,CAVS2在 LD配置下平均性能損失分別為:107.97%、51.97%、29.20%、17.55%、11.00%,在 RA配置下平均性能損失分別為 87.51%、39.76%、18.11%、12.60%、5.31%。其中序列Cactus的RD曲線如圖14所示,5個序列的平均性能損失與編碼速度曲線如圖15所示。
AVS的出發點是實現知識產權的自主可控,讓標準回歸為產業發展服務的本位,支撐我國數字視音頻產業的健康發展。為有效推進AVS標準的發展和應用,2002年、2004年和2005年分別成立了負責組織研究制定技術標準的“AVS工作組”、負責知識產權事務管理的“AVS專利池管理委員會”和負責推動AVS產業應用的“AVS產業聯盟”,也被形象地稱為“AVS三駕馬車”。AVS的制定和推廣有賴于3個組織的協同工作。

表6 LD配置下AVS2快速編碼器CAVS2與x265性能對比

表7 AVS2快速編碼器CAVS2與HM性能對比

圖14 AVS2快速編碼器CAVS2與x265性能對比

圖15 AVS2快速編碼器CAVS2與x265速度對比
AVS 標準已成為我國自主創新實施的一個典型案例,推動了我國自主技術創新與民族產業的發展。2006年第一代AVS標準頒布為國家標準,2012年7月AVS+頒布為廣電行業標準并實施,進一步加快了自主創新AVS國家標準在廣播電視領域的應用進程。目前中央電視臺14套高清頻道已全部采用AVS+標準播出,各省衛視也已經全部切換到 AVS+標準,AVS已成為支撐我國數字視聽產業鏈“由大變強”的基礎標準。2014年11月,財政部批復《中央廣播電視節目無線覆蓋工程》,投入近50億對全國2 562個發射臺站進行數字化改造和全覆蓋,明確規定全國范圍內地面電視節目編碼方式采用 AVS+編碼。在海外,AVS在柬埔寨、老撾、斯里蘭卡、古巴、吉爾吉斯斯坦等國的數字電視領域得到廣泛應用。
2016年5 月,AVS2廣電行業標準的正式發布將更進一步推動我國數字視頻產業的蓬勃發展,特別是超高清數字電視廣播在國內的應用。目前我國已有計劃在2018年進行4K超高清試轉播世界杯賽事節目,在2019年正式開通4K頻道。AVS標準為我國的廣播電影電視行業創造了巨大的產業機會,推動了我國數字視頻產業的持續蓬勃發展。
本文簡單介紹了AVS視頻編碼標準發展歷程以及最新一代 AVS2標準的核心創新技術。和AVS1視頻編碼標準相比,AVS2編碼效率提升一倍以上,和同期HEVC/H.265國際標準相比,AVS2在場景視頻編碼方面有顯著優勢。AVS作為我國技術創新的典型已獲得廣泛應用,形成了完善的AVS產業群體,在支撐我國數字音視頻產業實現“中國制造”到“中國創造”的戰略轉型中做出了歷史性貢獻。
[1]朱秀昌. 視頻編碼新標準——H.264[J]. 電信科學, 2002, 18(12): 26-29. ZHU X C. A new video coding recommendation——H.264[J]. Telecommunications Science, 2002, 18(12): 26-29.
[2]解偉, 郭曉強, 全子一. IPTV中的視頻壓縮技術研究[J]. 電信科學, 2006, 22(3): 39-42. XIE W, GUO X Q, QUAN Z Y. Research on video compression in IPTV application[J]. Telecommunications Science, 2006, 22(3): 39-42.
[3]郭春輝, 周經野, 劉華東, 等. AVS1-P7與H.264關鍵技術及性能比較[J]. 電信科學, 2006, 22(1): 47-50. GUO C H, ZHOU J Y, LIU H D, et al. Key technologies and performance comparison of AVS1-P7 with H.264[J]. Telecommunications Science, 2006, 22(1): 47-50.
[4]CUTLER C. Differential quantization of communication signals: US patent 2605631[S]. 1952.
[5]OLIVER B. Efficient coding[J]. The Bell System Technical Journal, 1952(31): 724-750.
[6]HARRISON C. Experiments with linear prediction in television[J]. The Bell System Technical Journal, 1952, 31(7): 764-783.
[7]CANDY J, FRANKE M, HASKELL B, et al. Transmitting television as clusters of frame-to-frame differences[J]. The Bell System Technical Journal, 1971, 50(7): 1889-1917.
[8]NETRAVALI A, ROBBINS J. Motion-compensated television coding: part 1[J]. The Bell System Technical Journal, 1979, 58(3): 631-670.
[9]AHMED N, NATARAJAN T, RAO K R. Discrete cosine transform[J]. IEEE Transactions on Computers, 1974, C(32): 90-93.
[10]MALVAR H, HALLAPURO A, KARCZEWICZ M, et al. Low-complexity transform and quantization in H.264/AVC[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2003, 13(7): 598-603.
[11]NARROSCHKE M. Coding efficiency of the DCT and DST in hybrid video coding[J]. IEEE Journal of Selected Topics in Signal Processing, 2013, 7(6): 1062-1071.
[12]TESCHER A G, COX R V. An adaptive transform coding algorithm[C]//1976 IEEE International Conference on Communications, June 14-16, 1976, Philadelphia, USA. New Jersey: IEEE Press,1976.
[13]KOGA T, IINUMA K, HIRANO A, et al. Motion-compensated inter-frame coding for video conferencing: NTCG5.3.1-G 5.3.5[R]. 1981.
[14]馬思偉. AVS視頻編碼標準技術回顧及最新進展[J]. 計算機研究與發展, 2015, 52(1): 27-37. MA S W. History and recent developments of AVS video coding standards[J]. Journal of Computer Research and Development, 2015, 52(1): 27-37.
[15]余全合, 曹瀟然, 李蔚然, 等. 短距離幀內預測技術: AVS_M3171[S]. 2013. YU Q H, CAO X R, LI W R, et al. Short range intra prediction technique: AVS_M3171[S]. 2013.
[16]FLIERL M, WIEGAND T, GIROD B. Rate-constrained multi-hypothesis prediction for motion compensated video compression[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2002, 12(11): 957-969.
[17]凌勇, 虞露. F幀CE:一種前向雙假設預測圖像塊編碼技術: AVS_M3326[S]. 2014. LING Y, YU L. F frame CE: a block image coding technique based on forward two hypothesis prediction: AVS_M3326[S]. 2014.
[18]KIM I K, LEE S, PIAO Y J, et al. Directional multi-hypothesis prediction (DMH) for AVS2: AVS_M3094[S]. 2013.
[19]李蔚然, 袁媛, 曹瀟然, 等.非平方的四叉樹變換: AVS_M3153[S]. 2013. LI W R, YUAN Y, CAO X R, et al. Non-square quad-tree transform: AVS_M3153[S]. 2013.
[20]林和源, 童怡新, 王頌文. 幀內編碼二次轉換改進提案: AVS_M3296[S]. 2014. LIN H Y, TONG Y X, WANG S W. Improvement proposal of the second time transform of intraframe coding: AVS_M3296[S]. 2014.
[21]RISSANEN J. Generalized draft inequality and arithmetic coding[J]. IBM Journal of Research and Development, 1976(20): 198-203.
[22]MARPE D, SCHWARZ H, WIEGAND T. Context-based adaptive binary arithmetic coding in the H.264/AVC video compression standard[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2003, 13(7): 620-636.
[23]WANG J, WANG X, JI T, et al. Two-level transform coefficient coding:AVS_M3035[S]. 2012.
[24]LEE J S, KIM C, FU C, et al. Sample adaptive offset for AVS2:AVS_M3197[S]. 2013.
[25]ZHANG X, SI J, WANG S, et al. Adaptive loop filter for AVS2:AVS_M3292[S].2014.
[26]ZHANG X, HUANG T, TIAN Y, et al. Low-complexity and high-efficiency background modeling for surveillance video coding[C]//2012 Visual Communications and Image Processing (VCIP 2012), Nov 27-30, 2012, San Diego, USA. New Jersey: IEEE Press, 2012.
[27]BOSSEN F. Common HM test conditions and software reference con-figurations: ITU-T SG16 ContributionJCTVC-L1100[S]. 2013.
Kernel technologies and applications of AVS2 video coding standard
MA Siwei1, LUO Falei2, HUANG Tiejun1
1. School of Electronics Engineering and Computer Science, Peking University, Beijing 100871, China 2. Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100081, China
A brief introduction was given to the development history of AVS video coding standards. Then an overview of the key technologies adopted in AVS2 video coding standard (GB/T 33475.2-2016) was provided, including flexible prediction partition, multiple hypothesis prediction, optimized two-level transform, adaptive loop filter and background picture model based prediction coding for scene video. Compared to the AVS1, AVS2 can achieve more than 50% bits saving. And compared to HEVC/H.265, AVS2 can achieve significant coding efficiency improvement for scene video coding. Moreover, the applications of AVS standard in digital TV broadcasting was introduced briefly.
AVS, transform, prediction, entropy coding, loop filter
TN919.81
A
10.11959/j.issn.1000?0801.2017245

馬思偉(1979?),男,北京大學信息科學技術學院教授,主要研究方向為視頻處理與編碼。
羅法蕾(1991?),男,中國科學院計算技術研究所博士生,主要研究方向為視頻編碼。
黃鐵軍(1970?),男,北京大學信息科學技術學院教授、計算機科學技術系主任,主要研究方向為視覺信息處理與神經形態計算。
2017?07?10;
2017?08?08