趙國鋒,康戈文,孟繼成
摘 要:為了改進視頻編碼的比特率,提出基于小波變換的位平面模型和廣義有限自動機(GFA)的視頻壓縮。該算法是把一個連續畫面中(GOP)的視頻序列作為整體做小波變換,然后對小波系數的自適應量化及位平面模型。幀間,頻帶間,位平面間都類似成為相同位平面模型。這樣可以更好地使用廣義有限自動機(GFA)來壓縮位平面。最后用熵編碼方式編碼GFA描述的節點信息為可分級的比量流,它是一個高效可分級視頻編碼方案。以前多數不切實際的多媒體通信應用將可能實現。
關鍵詞:視頻壓縮;廣義有限自動機;小波變換;位平面
中圖分類號:TN91981文獻標識碼:A
文章編號:1004-373X(2009)20-063-03
Video Coding Based on Wavelet Transform and GFA Modeling
ZHAO Guofeng,KANG Gewen,MENG Jicheng
(University of Electronic Science and Technology of China,Chengdu,610054,China)
Abstract:In order to improve the video coding in bitrates,a video coding scheme based on the statistical bitplane modeling and the Generalized Finite Automata (GFA) representation of video sequences in wavelet domain is presented.In the proposed scheme,a video sequence Group of Pictures (GOP) is represented as an overall binary image by bitplane modeling the coefficients of the video sequence within subbands using a generalized Gaussian quantizer,adaptive to the coefficient statistics of the video sequence.The inter-frame (motion),interband (frequency) and inter-bitplane (spectrum) similarities are optimally explored in the bitplane model,to form a compact GFA representation of the video sequence.Finally,all the transitions (edges) and the leaf nodes in the GFA representation are entropy encoded into a scalable bitstream.It is an effective scalable video coding scheme.Numerous multimedia communication applications,previously unpractical,should be envisaged with the low bitrates.
Keywords:video compression;generalized finite automata;wavelet transform;bitplane
0 引 言
隨著互聯網的飛速發展,消費類電子、通信、影視及廣播、計算機技術日益緊密地結合起來,使得基于互聯網的多媒體產業成為本世紀初發展最快、規模最大的產業之一。在通信網絡上傳輸,數字視頻數據量的大小成為多媒體技術中非常重要的問題[1]。因此數據壓縮成為電子信息領域的重要技術,數據壓縮意味著減少表示某信息(如一幅圖像) 所需的數據量,即減少容納給定信息集合或數據采樣集合的空間;這樣一種處理技術的應用,可以有效地節省數據的存儲空間,并在一定程度上緩解因信道帶寬和容量不足給電子信息技術進步帶來的問題。
H.264/AVC標準是當前國際上最新的圖像編碼標準。它主導思想是基于塊的混合編碼方法。主要的技術有:4×4的整數變換與量化,基于空域的幀內預測,熵編碼采用CAVLC或CABAC,去塊效應濾波器等[2]。
圖1 基于小波變換和GFA的
視頻壓縮編碼的系統框圖
1 小波變換
在此以小波變換和廣義有限自動機編碼(GFA)的視頻壓縮算法[3],不像傳統的視頻壓縮算法用到I幀,P幀,B幀等概念,而是以視頻序列GoP(Group of Pictures)為單位做小波變換、量化、位平面、GFA(Generalized Finite Automata)、算術編碼。算法編碼示意圖如圖1所示。
小波變換是自1986年以來,迅速發展起來的一門新興學科。研究平穩信號的理想工具是傅里葉分析,而非平穩信號可以分解為小波的線性組合。小波分析在時域和頻域同時具有良好的局部化性質,能將圖像信號分解為與人類視覺特性相匹配的不同分辨率、不同方向特性的子帶,并使能量集中到某些子帶,為圖像的壓縮提供一個有效的手段[4]。
一維小波變換公式為:
當f(x)∈L2(R)時,
時域:
cwt(s,b)=1s∫f(x)ψx-bsdx
頻域:
CWT(s,w)=sF(w)Φ(sw)
二維小波變換公式為:
當f(x)∈L2(R)時,
時域:
cwt(s,a,b)=1s雈(x,y)ψx-as,y-bsdxdy
頻域:
CWT(s,w1,w2)=sF(w1,w2)Φ(sw1,sw2)
對于一維信號的正交小波分解和重構均可通過子帶濾波的形式實現,分別如圖2所示。
圖2 一維離散小波變換
對于二維圖像,以圖2分別在水平和垂直方向進行濾波的方法實現二維圖像小波多辨率分解[5]。圖3為經二維小波分解的頻帶劃分示意圖。
圖3 二維小波分解頻帶示意圖
小波變換本身并不直接引起比特率的減少,只是為減少比特率提供條件,還必須與量化技術結合才能達到壓縮目的。量化是通過降低整數的精度來減少存儲整數值所需位數的過程。通常對所得到的子帶,根據人類的視覺生理和心理特點分別做不同策略的量化處理,其中低頻子帶用小步長量化,高頻子帶可以用大步長進行量化,以達到更好的壓縮效果。
經過小波分解后,得到低頻子帶圖像依然保持原始圖像的概貌,但由于經過多重低頻濾波后,能量高度集中,系數之間的相關性很強。各面高頻子帶包含原圖像在水平、垂直和對角線方向的高頻分量,因而其中大部分區域變化幅度不大,且能量低。所以低頻子帶用較多層位平面表示,高頻子帶用較少層位平面表示。
所謂位平面,是這樣的一個平面概念:在這個平面上的是圖像的某個數據位上的所有比特。比如對于24位真彩圖像,它的單個像素的紅色成分用一個字節來表示,則整幅圖像的紅色成分可以用8 個位平面來表示,從高位到低位依次是第7,第6,…,第1,第0位平面,每個位平面上包含了紅色成分字節中相應數據位的比特值[6]。