摘 要:本中介紹了小波變換的基本理論,討論了小波圖像壓縮研究現(xiàn)狀和進(jìn)展,特別就目前小波圖像編碼與其它新興圖像編碼方法相結(jié)合研究熱的點(diǎn)作了初步探討,最后展望小波圖像壓縮編碼的發(fā)展前景。
關(guān)鍵詞:小波變換 圖像壓縮 小波基
中圖分類(lèi)號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1674-098X(2011)04(a)-0083-02
小波變換是20世紀(jì)80年代后期發(fā)展起來(lái)的一種新的信息處理方法,解決了很多傅里葉變換不能解決的問(wèn)題。小波變換由于在時(shí)域和頻域同時(shí)具有局域化特性,彌補(bǔ)了DCT變換的不足,可以把圖像信息定位到任何精度級(jí)上,以實(shí)現(xiàn)根據(jù)圖像信息重要性進(jìn)行優(yōu)先編碼、傳輸,并且其多分辨率特性便于與人眼視覺(jué)特性相結(jié)合,小波變換圖像編碼壓縮成為當(dāng)前研究熱點(diǎn)。小波變換與其它編碼方法相結(jié)合成為圖像壓縮算法的發(fā)展趨勢(shì)。
1 小波變換壓縮編碼的理論
小波變換的基本思想是用一組小波或基函數(shù)表示一個(gè)函數(shù)或信號(hào)。若,將任意的連續(xù)函數(shù)在小波基下進(jìn)行展開(kāi),稱(chēng)這種展開(kāi)為函數(shù)的連續(xù)小波變換(Continue WaveletTransform,簡(jiǎn)記為CWT),其表達(dá)式為:
(1)其相應(yīng)的逆變換為:
(2)若對(duì)式(1)中的進(jìn)行采樣,取,可得到離散小波變換(DWT):
(3)在對(duì)圖像進(jìn)行分析、處理的應(yīng)用中,我們主要采用離散小波變換(DWT),一般選取,此時(shí)稱(chēng)DWT為多分辨率分析。S.Mallat首先將多分辨率分析用于圖像數(shù)據(jù)的壓縮,并給出了信號(hào)分解與合成的塔式快速小波變換算法,該算法的出現(xiàn)使小波分析方法在信號(hào)處理領(lǐng)域真正得以實(shí)用化。
2 小波變換圖像壓縮編碼基本原理
1989年,Mallat提出了小波變換多分辨率分析的概念,并給出了用于信號(hào)分析和重構(gòu)的Mallat塔式算法[1]。所謂Mallat塔式算法,就是將一幅圖像經(jīng)過(guò)小波變換分解為一系列不同尺度、方向、空間域上局部變化的子帶圖像。一幅圖像經(jīng)過(guò)一次小波變換后產(chǎn)生4個(gè)子帶圖像:LL代表原圖像近似分量,反映原圖像的基本特性;HL、LH和HH分別表示水平、垂直和對(duì)角線的高頻分量,反映圖像信號(hào)水平方向、垂直方向與對(duì)角線方向的邊緣、紋理和輪廓等。其中,LL子帶集中了圖像的絕大部分信息,以后的小波變換都是在上一級(jí)變換產(chǎn)生的低頻子帶(LL)的基礎(chǔ)上再進(jìn)行小波變換。圖1、圖2是一副Women圖像分解實(shí)例[1-3]。圖1表示使用db2小波基經(jīng)過(guò)1層小波分解后Women圖像及其頻帶,圖2表示使用db2小波基經(jīng)過(guò)2層小波分解后Women圖像及其頻帶。
3 小波變換圖像壓縮研究現(xiàn)狀和進(jìn)展
小波變換應(yīng)用于圖像壓縮編碼始于1989年。首先,S.Mallat提出了小波變換多分辨率分析的概念,并給出了用于信號(hào)分析和重構(gòu)的Mallat塔式快速小波變換算法。由于小波變換的優(yōu)良特性與Mallat算法的簡(jiǎn)便易行,使得小波變換圖像編碼壓縮成為圖像壓縮領(lǐng)域的一個(gè)主要研究和發(fā)展方向。
小波變換不但能夠比較理想地消除圖像數(shù)據(jù)中的統(tǒng)計(jì)冗余,而且利用了人眼視覺(jué)的特性,所以它在靜態(tài)和動(dòng)態(tài)圖像壓縮領(lǐng)域得到廣泛的應(yīng)用,國(guó)際標(biāo)準(zhǔn)MPEG-4已經(jīng)把小波列了進(jìn)去,目前流行的靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG2000是完全采用小波變換代替余弦變換。
3.1 比較經(jīng)典的小波圖像壓縮算法
小波圖像壓縮被認(rèn)為是當(dāng)前最有發(fā)展前途的圖像壓縮算法之一,小波圖像壓縮的研究集中在對(duì)小波系數(shù)的編碼問(wèn)題上。目前3個(gè)比較經(jīng)典的小波圖像編碼分別是:嵌入式小波零樹(shù)圖像編碼(EZW),分層小波樹(shù)集合分割算法(SPIHT)和優(yōu)化截?cái)帱c(diǎn)的嵌入塊編碼算法(EBCOT)。
(1)嵌入式小波零樹(shù)圖像編碼(EZW)[4]。1992年,Shapiro提出了嵌入式小波零樹(shù)編碼(Embedded Zero-tree Wavelet,即EZW)方法。即根據(jù)相同方向,不同分辨率子帶圖像間的相似性,定義POS、NEG、IZ和ZTR四種符號(hào)進(jìn)行空間小波樹(shù)遞歸編碼,把不重要小波系數(shù)(小于某一閾值的小波系數(shù))組成為四叉樹(shù),然后用較少的比特?cái)?shù)來(lái)表示它,從而大大地提高了圖像的壓縮比特率。此算法采用漸進(jìn)式量化和嵌入式編碼模式,算法復(fù)雜度低。因此有學(xué)者認(rèn)為,EZW算法在數(shù)據(jù)壓縮史上具有里程碑意義。
(2)分層小波樹(shù)集合分割算法(SPIHT)[5]。1996年,由Said和Pearlman提出的分層小波樹(shù)集合分割算法(Set Partitioning in Hierarchical Trees,即SPIHT)是EZW算法的進(jìn)一步改進(jìn),它利用空間樹(shù)分層分割方法,將某一樹(shù)結(jié)點(diǎn)及其所有后繼結(jié)點(diǎn)劃歸為同一集合,有效地減小了比特面上編碼符號(hào)集的規(guī)模。同EZW相比,SPIHT算法構(gòu)造了兩種不同類(lèi)型的空間零樹(shù),該算法的性能較EZW有很大的提高。
(3)優(yōu)化截?cái)帱c(diǎn)的嵌入塊編碼算法(EBCOT)[6]。優(yōu)化截?cái)帱c(diǎn)的嵌入塊編碼算法(EBCOT)首先將子帶劃分成編碼塊的方式,然后對(duì)每個(gè)塊單獨(dú)進(jìn)行編碼,產(chǎn)生壓縮碼流,結(jié)果圖像的壓縮碼流不僅具有SNR可擴(kuò)展,而且具有分辨率可擴(kuò)展,還可以支持圖像機(jī)存儲(chǔ)。因此,EBCOT算法被ISO采用作為JPEG2000的基本編碼算法。
此外,1992年,Coifman和Wickerhauser提出了小波包的概念計(jì)算法。這種算法對(duì)信號(hào)的特性具有自適應(yīng)能力,它不僅對(duì)低頻部分進(jìn)行分解,而且對(duì)高頻部分也進(jìn)行二次分解。這種方法的優(yōu)點(diǎn)是可以對(duì)信號(hào)的高頻部分作更加細(xì)致的刻畫(huà),對(duì)信號(hào)的分析能力更強(qiáng)。在利用小波包實(shí)現(xiàn)圖像壓縮時(shí),存在著最佳小波包基的選擇問(wèn)題,因?yàn)椴煌〔ò鼘?duì)圖像的壓縮效果是不一樣。目前,主要是引入一個(gè)代價(jià)函數(shù)(cost-function)來(lái)確定小波包基的優(yōu)劣,并取得了一定成功,提出了一些有效算法,目前被認(rèn)為國(guó)際上比較先進(jìn)的方法之一是由K.Ramchandran和M.Vetterli提出的比特失真率優(yōu)化方法
3.2 小波變換與其他編碼方法結(jié)合
(1)與分形壓縮技術(shù)的結(jié)合
分形圖像壓縮的基本過(guò)程就是把原始圖像分割成若干個(gè)子圖像,每個(gè)子圖像尋找一個(gè)合適迭代函數(shù),子圖像以迭代函數(shù)存儲(chǔ)。解碼時(shí)只要調(diào)出每個(gè)子圖像對(duì)應(yīng)的迭代函數(shù)反復(fù)迭代,就可恢復(fù)出原來(lái)子圖像,從而得到原始圖像[7],其理論基礎(chǔ)是迭代函數(shù)系統(tǒng)定理和拼貼定理。自然圖像的自相似性不是很強(qiáng),這限制了分形圖像壓縮的廣泛應(yīng)用。但是圖像經(jīng)小波變換后,其不同分辨率子帶之間在相同方向具有較強(qiáng)的相似性的特點(diǎn),為小波變換與分形壓縮技術(shù)的結(jié)合提供了可能。目前出現(xiàn)的關(guān)于小波分形相結(jié)合壓縮算法主要有:1998年,Davis提出了小波子樹(shù)自量化方法,其主要思想是將傳統(tǒng)空域內(nèi)的分形壓縮轉(zhuǎn)化為小波域內(nèi)小波子樹(shù)的自量化編碼。2002年,Taekon Kim等人提出零樹(shù)小波分形混合圖像編碼[8],該算法是分形壓縮技術(shù)和EZW算法的結(jié)合,相比于EWZ,此算法在保證圖像質(zhì)量的前提下,進(jìn)一步提高了壓縮比。2007年,F(xiàn)u-qiang LIU等人提出一種新的小波分形壓縮算法[9],實(shí)驗(yàn)顯示,此算法在不降低SNR和復(fù)原圖像質(zhì)量情況下,提高了壓縮效率和編碼速度。
(2)與數(shù)學(xué)形態(tài)學(xué)技術(shù)結(jié)合
1999年,Servettto提出了一種小波數(shù)據(jù)形態(tài)表示圖像編碼MRWD(morphological representation of waveletdata)方法。MRWD利用了數(shù)學(xué)形態(tài)學(xué)和小波系數(shù)的統(tǒng)計(jì)特
性,直接在子帶內(nèi)生成形狀不規(guī)則的重要系數(shù)束,從而將小波系數(shù)分為4個(gè)集合,然后再對(duì)集合束進(jìn)行編碼。2006年,J.N.Ellinas和M.S.Sangriotis提出了小波變換和數(shù)學(xué)形態(tài)學(xué)結(jié)合的立體圖像編碼算法[10],此算法在處理立體圖像時(shí)復(fù)雜度低,無(wú)論從PSNR還是從視覺(jué)上效果都很好。在今后研究中,與數(shù)學(xué)形態(tài)學(xué)的融合算法將得到進(jìn)一步研究。
(3)與神經(jīng)網(wǎng)絡(luò)編碼技術(shù)結(jié)合
神經(jīng)網(wǎng)絡(luò)的基本特征是信息的分布式存儲(chǔ)和并行處理,因此神經(jīng)網(wǎng)絡(luò)這一類(lèi)似多處理機(jī)的并行系統(tǒng),對(duì)于圖像數(shù)據(jù)海量的特點(diǎn),無(wú)疑在速度上有一定優(yōu)勢(shì)。同時(shí),神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的容錯(cuò)性和魯棒性,不僅可以克服圖像數(shù)據(jù)存儲(chǔ)和傳輸過(guò)程中噪音的干擾,而且保證了圖像壓縮后質(zhì)量。不足之處:圖像壓縮前應(yīng)進(jìn)行邊緣檢測(cè)、圖像增強(qiáng)等預(yù)處理,此外壓縮比還不是很高。而與小波變換結(jié)合卻能很好的彌補(bǔ)這些缺點(diǎn)。因此神經(jīng)網(wǎng)絡(luò)與小波變換的融合算法成為了圖像壓縮新的研究熱點(diǎn)。
4 對(duì)小波變換圖像編碼研究的展望
(1)應(yīng)用小波變換時(shí)應(yīng)充分利用人類(lèi)視覺(jué)系統(tǒng)對(duì)圖像邊緣,輪廓等部分較敏感特性,將圖像中感興趣的對(duì)象分割出來(lái),對(duì)其邊緣部分、輪廓部分和對(duì)象之外的背景部分按不同的編碼算法進(jìn)行壓縮,這樣可以在保證圖像質(zhì)量的前提下,提高壓縮比。
(2)研究已經(jīng)表明:傳統(tǒng)序列圖像編碼結(jié)構(gòu)不利于小波變換優(yōu)勢(shì)的發(fā)揮。由此產(chǎn)生了三維小波變換的圖像編碼方法。小波變換應(yīng)用于運(yùn)動(dòng)圖像壓縮編碼將成為新的研究熱點(diǎn)。
(3)雖然小波分形混合壓縮算法取得了一定成功,但仍有很多方面需要進(jìn)一步研究以充分挖掘其潛力,如尋找分形集合的幾何相似性與小波變換后子帶之間的相似性之間的關(guān)系,深入研究小波變換與分形的內(nèi)在聯(lián)系,怎樣才能與人眼視覺(jué)特性充分結(jié)合等。
(4)隨著研究的不斷深入,多小波、小波包的應(yīng)用使得小波圖像壓縮研究進(jìn)入了一個(gè)新的階段。小波變換與分形壓縮方法的成功結(jié)合說(shuō)明不同壓縮方法的結(jié)合可以互相彌補(bǔ)不足,提高壓縮性能。因此,今后小波圖像壓縮研究的突破點(diǎn)在于構(gòu)造更加理想小波和其他新型壓縮方法(如數(shù)學(xué)形態(tài)學(xué)、分形、神經(jīng)網(wǎng)絡(luò)等)的有機(jī)結(jié)合。
5 結(jié)語(yǔ)
小波變換圖像編碼即擁有傳統(tǒng)編碼方法的一些優(yōu)點(diǎn)(能夠很好消除圖像數(shù)據(jù)中的統(tǒng)計(jì)冗余),又具有新型圖像壓縮編碼方法的優(yōu)點(diǎn)(利用了人眼視覺(jué)的特性機(jī)制),因而小波圖像編碼非常適應(yīng)于高壓縮比應(yīng)用領(lǐng)域的要求。不過(guò)在小波圖象編碼中,仍存在著一些有待改進(jìn)地方面。如在壓縮比特別高的時(shí)候,小波變換壓縮量化后的重建圖像也會(huì)產(chǎn)生幾何畸變。因此小波變換與其他壓縮方法相結(jié)合的混合編碼算受到了人們?cè)絹?lái)越多的重視法,這將會(huì)成為今后圖像壓縮技術(shù)的研究熱點(diǎn)和發(fā)展方向。
參考文獻(xiàn)
[1]Mallat S.A theory for multi-resolution signal decomposition:The wavelet representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1989,11(07):674-693.
[2]Daubechies I.The wavelet transform, time- frequency localization and signal analysis[J].IEEE Transactions on Information Theory, 1990,36(05):961-1006.
[3]Antonini M, Barlaud M,Mathieu P,et al. Image Coding Using Wavelet Transform[J].IEEE Trans on Image Processing,1992,38(02):244-250.
[4]Shapiro J M.Embedded image coding using zerotrees of wavelet coefficients.IEEE Trans.on Signal Processing,1993,41(12):3445-3462.
[5]Said A, Pearlman W.?A new fast and efficient image code based on set partitioning in hierarchical trees.IEEE Trans.on Circuits Syst. Video Tech.1996,6(03):243-249.
[6]Taubman D.High performance scalable image compression with EBCOT.IEEE Transactions on Image Processing,2000,9(07):1158-1170.
[7]徐林靜,孟利民,朱建軍.小波與分行在圖像壓縮中的比較及應(yīng)用[J].中國(guó)有線電視,2003,3(04):26-29.
[8]Kim T,Van R E, Miller D J.Hybrid fractal zerotree wavelet image coding[J].Signal Processing:Image Communication.2002(17):347-360.
[9]Song C L,F(xiàn)eng R,Liu F Q,et al. A novel fractal wavelet image compression approach[J].Journal of China University of Mining and Technology,2007,17(01):121-125.
[10]Ellinas J N, Sangriotis M S. Morphological wavelet-based stereo image coders[J].J.Vis.Commun.Image R,2006(17):686-700.
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文