摘要:對圖像感興趣區域ROI(Region of Interest)的的支持是新一代靜止圖像壓縮標準JPEG2000的一項重要功能。該文系統介紹了JPEG2000感興趣區域編碼技術的基本原理以及核心算法,并重點對ROI感興趣區域編碼進行了仿真與性能分析。
關鍵詞:ROI;JPEG2000;算法;仿真
中圖分類號:TP919 文獻標識碼:A 文章編號:1009-3044(2009)05-1173-02
Study of Multimedia Based on Network Transmission
AI Juan
(Changsha Vocational and Technical College,Changsha 410111,China)
Abstract: An important feature in the new still image compression standard JPEG2000 is to support ROI encoding.This paper introduces the theory and core algorithm of the coding technology of ROI in JPEG2000 standards.finally achieves simulation and function analysis of Region of Interest.
Key words: ROI;JPEG2000; algorith; simulation
1 引言
JPEG 2000 的一個重要特性是支持興趣區的編碼。感興趣區域編碼可以使圖象的一定部分以更好的質量進行編碼或解碼。用戶利用這個特性可指定感興趣的圖像區域,在壓縮時對這些圖像區指定特定的壓縮質量,或在恢復時指定特定的解壓縮要求,這給用戶帶來了極大的方便。例如,在有些情況下圖像中只有一小塊區域對用戶是有用的,對這些區域采用低壓縮比,而其他區域采用高壓縮比,在保證不丟失重要信息的同時能有效地壓縮數據量。ROI使用的是基于標度的方法,其主要思想是那些與該ROI相關的系數放置在比背景的比特高一些的位平面。然后,在嵌入編碼過程中,將最高有效位ROI位平面在圖象背景位平面之前放入位流。這樣,ROI將比圖象的其余部分先解碼,或提高其質量。有靜態和動態兩種方式。靜態方式中,ROI是在編碼器一側決定并編碼的。動態方式中,ROI則可以位流行進過程中決定和編碼。JPEG2000中推薦的ROI方法是MAXSHIFT法。
2 ROI感興趣區域編碼實現算法
2.1 ROI算法原理
一幅含有感興趣區域的靜態圖像,可以劃分成兩個部分:感興趣區域(ROI)和背景區域(BG)。感興趣區域可以有多個,而背景區域只有一個。ROI算法一般分為以下兩步:
1) 從所有的小波系數區分出ROI區域的小波系數;
2) 對ROI區域的小波系數采用一些特定的方式進行編碼,從而使它們的質量比一般的
BG 區域高。根據算法可以知道,區分出ROI區域的小波系數是整個算法中最重要的一部分。為了實現這一步,JPEG2000定義了一個ROI標志位(ROI mask),從而在進行DWT變換的時候,可以記錄下某個小波系數是屬于ROI還是BG,以及該系數屬于哪一個ROI(在定義了多個ROI的情況下)。該mask的生成算法的好壞直接影響ROI編碼的效率。
2.2 ROI mask 生成算法
ROI mask 描述的其實就是某一小波系數存在于哪一個位平面上,從而精確的重構期望的區域。因此,針對特定某一層的小波變換中,輸入的原始信號樣本x(2n)和x(2n+1)與高/低通濾波器好h(n)/ l(n)之間的運算關系,實際上就是該 mask。同樣的,針對其他濾波器的 ROI mask 也是由如此的定義產生,只不過公式不同而已。對于任意形狀的ROI,為了描述形狀,必須獲得屬于 ROI 的所有的小波系數,所以必須產生所有的 ROI mask;但是在某些特定的形狀下,由于形狀的規律性使得 ROI mask 的產生方式會簡化許多,其中具有代表性的就是矩形。
如果 ROI 區域是個矩形,那么在重構圖像的反向變換時,就不需要記錄每個像素的小波系數的值,只需要記錄區域左上和右下兩個點就可以了,所有的在這兩個點之間的樣本均屬于 ROI,需要產生 mask。這樣計算量可以大幅度減小在進行小波的分層分解時,ROT 的 mask 的范圍在不同的子帶中也會進行一定的變化,假設 ROT 區域是個矩形,在父親子帶中的(x0,y0)和(x1,y1)兩點之間,那么它在分解后的 SUB 子帶中將會處于:
其中neg_sup 和 pos_sup 取決于新的 SUB 子帶是通過高通還是低通濾波器形成的,還與高、低通濾波器組與原始區域相關的的頻率分量系數有關。它們的值可以通過h(n)和l(n)計算獲得。因此,想要還原 ROI 區域中系數x(2n)和x(2n+1),必須獲得使用的濾波器的信息。
2.3MAXSHIFT 算法
由于使用ROI時,必須確定ROI區域的范圍,所以必定要按照一定的形狀進行編碼和解碼,那么系統的復雜度會大大提高。而且,當源圖像數據量比較大的情況下進行解碼時,逐個計算小波系數的 ROI mask 非常的浪費資源,也增加了不必要的計算復雜度和內存開銷。于是,JPEG2000標準中使用 MAXSHIFT 算法來解決以上問題。MAXSH1FT算法的思想是不采用標準的逐個檢查小波系數的方法確定 ROI 區域的范圍,而是在量化編碼時,將小波系數作特定的處理,從而使ROI區域的小波系數的最小量級比背景區域(BG)的小波系數的最大的量級還大。此時,ROI區域的范圍就可以由ROI區域中最小的量化小波系數S來表示。
例如,對ROI中系數ci,進行特定變化ci=2ci,則
S=2cmin
如此,解碼時系統的負擔將會大幅度減小,這時只需要簡單的判斷該系數是否大于范圍值S即可確定是否屬于 ROI 區域,解碼系統省下來所要做的工作僅僅是按照不同的質量水平分別將兩部分系數還原即可。
3 ROI 感興趣區域編碼仿真與性能分析
采用Lena.bmp 作為測試圖像,是一張尺度為512 ×512 的灰階圖像。選擇3種測試算法:1、本文設計的基于MAXSHIFT算法的ROI解決方案;2、基于一般位移算法的ROI解決方案,具體編碼可以參考JASPER1.200程序;3、無ROI解決方案的算法;由兩個含有 ROI 解決方案的算法分別可以得到在同樣的 ROI 大小及范圍時,且總碼率又相等的情況之下各種碼率還原后的結果,第三個算法所得到的是相同總碼率時但未使用ROI 解決方案的結果,如此便能夠進行還原后圖像質量的比較。圖像質量是用PSNR(PeakSignal to Noise Ratio)來表示,單位為dB。MSE(Mean Squared Error)為均方誤差,為重建圖像中每個像素與原始圖像中每個像素的平均平方誤差和而得;而由于 Lena.bmp 是灰階圖像,其亮度值的范圍為0—255,因此求得 PSNR 的算式如下:
圖1便是在該碼率時——分別由最大位移法、一般位移法兩種含有ROI解決方案得到還原后的結果,以及未使用ROI解決方案所得到的結果。
從圖1、2和3可以發現使用最大位移法的ROI算法與使用一般位移的ROI算法這兩者一效能的比較與ROI的大小以及碼率的設定密切相關:若碼率的設定大到足以讓使用最大位移法的ROI算法在編碼時一將ROI的位平ICI編碼完成,則使用最大位移法的ROI算法與使用一般位移法的ROI算法的效能是差不多的,否則在碼率不足的情況下,使用一般位移法的ROI算法所得到的圖像質量會較使用最大位移法的ROI算法更好;當然碼率也不能刻息設定的非常小,因為如此一來兩種ROI算法都不能保障還原后的圖像質量。
4 小結
JPEG2000是一個非常有用的新一代靜止圖像的壓縮標準 。該文主要介紹了JPEG2000標準的一個重要特點:感興趣區域編碼。并分析了JPEG2000感興趣區域編碼技術的基本原理以及核心算法—Maxshift,對ROI編碼進行了仿真和性能研究。
參考文獻:
[1] 黃會雄.基于率失真優化的ROI編碼算法[J].計算機應用,2008(9):242-245.
[2] 楊子揚.基于優化JPEG2000感興趣區域編碼的研究[J].現代電子技術,2006,29(21):137-139.