姚軍財
(陜西理工學院 物理系,陜西 漢中 723000)
圖像壓縮是指對要處理的圖像源數據按一定規則進行變換和組合,從而達到以盡可能少的代碼(符號)來表示盡可能多的數據信息的一種方法。數字化圖像壓縮技術主要包括變換、量化和編碼等。國內外對數字圖像壓縮技術進行了大量研究,提出了很多變換、量化和編碼方法[1-5],早期的研究著重于改進圖像信息編碼算法,如香農編碼、算術編碼、預測編碼等;由于圖像信息的最終接受者是人,人眼對圖像的認知是非均勻和非線性的,并不是對圖像中的任何變化都能感知到,使得人觀察圖像時存在大量的心理視覺冗余,且人眼能很好地直接評價壓縮效果的好壞,所以自20世紀90年代以來,基于去除心理視覺冗余的圖像壓縮技術及其應用得到了迅猛發展[6-10]。但是如何利用人類視覺系統的感知特性,這方面的研究到目前為止比較少。本文結合人眼對比度感知特性和圖像離散余弦變換(DCT)特征[1-2],提出了一種源圖像頻譜圖的人眼最小可覺察誤差閾值的計算方法,利用該方法計算出來的閾值來量化原始圖像頻譜圖的各個8×8子塊的信息,使得編碼時變換域系數中盡可能多地出現零值系數,再通過Huffman編碼方法實現編碼。
人眼觀察圖像的目的就是獲得有用的信息,但人眼并不是對所有的視覺信息具有相同的敏感度,即人眼的分辨力是有限的;對圖像而言,則不能完全區分各種顏色或灰度級,使得產生心理視覺冗余;則利用人眼視覺特性篩選出人眼不敏感的圖像信息進行量化處理,有利于圖像數據的壓縮;同時又保證了壓縮圖像的觀測效果。對人眼視覺特性的深入研究及由此建立的各種數學模型,一直是各種圖像壓縮算法的基礎。
人眼對比度敏感是描述人眼視覺系統(HVS)空間傳遞特性的主要指標之一[6-10],其數值到目前為止無法直接測量,通常用人眼主觀上剛剛可辨別的亮度差與平均亮度的比值的倒數來描述;為了從數學模型上抽象出人眼對比度敏感視覺特性,一般采用不同條件下測量的人眼對比度敏感值與空間頻率之間的函數關系來描述,其關系函數稱之為人眼對比度敏感函數(CSF)。自20世紀50年代,國內外對人眼對比度敏感視覺特性做了大量的研究,到目前為止,人眼亮度傳遞特性得到了較好的結果,獲得了一些CSF數學模型,其中最典型的有以下3個模型:1)Movshon模型:Movshon等人依據Ratches測量的數據擬合的參數模型。2)Daly模型:Daly等人以Meeteren和Vos測量的數據為基礎擬合的參數模型。3)Barten模型:Barten等人對Van Meeteren測量的數據進行擬合的參數模型[8-13]。對比分析這幾種模型在圖像技術中的應用,早期的研究一般采用Movshon模型,但是此模型沒有考慮亮度影響因素;而Daly模型是一種多參數模型,雖然到目前為止最適合于描述人眼對比度敏感視覺特性,但是其涉及到的影響參數太多,在圖像技術中計算量太大,以致較少被采用。綜合考慮CSF模型能否較好地反映人眼視覺特性及其在圖像壓縮技術中的實用性,Barten模型是比較理想的模型。Barten模型為f為視覺空間頻率,單位為周/度,L為觀察目標光柵的平均亮度,w為每度顯示的大小。

式(1)表明人眼CSF模型受到平均亮度的影響,不同的平均亮度,CSF的曲線也會不同,圖1a和1b分別是該模型對應的二維圖像和三維圖像的示意圖。圖1表明:曲線整體表現為人眼對中頻區域較為敏感,對低頻和高頻區域,人眼對比度敏感程度急劇下降。則可以利用此特點,對圖像的高、低頻不敏感區域信息進行量化編碼,達到壓縮圖像信息的目的。

數字圖像壓縮技術主要包括變換、量化和編碼等,其中最關鍵的是量化。由于圖像具有局部自相似性,圖像的頻率變換能夠體現圖像的信息,并且能夠去掉像素間較強的相關性,讓圖像的信息主要集中在少數系數上,因此文中采取的量化方法是在頻域中對變換域系數進行修改,再對修改后的變換域系數進行離散余弦反變換,則在空間域中對應的圖像像素值發生了變化,表現為亮度和色度產生了偏差;由于人眼觀察圖像存在可見度閾值,因此只要量化誤差控制在可見度閾值范圍內,就不會影響視覺觀察的效果,從而達到實現壓縮編碼的目的。因此,要求知道圖像每一個像素的基于人眼視覺特性的可容忍的誤差(或偏差)水平。人眼對亮度光強變化的響應是非線性的,通常把人眼主觀上剛剛可辨別亮度差所需的最小光強差值稱為可見度閾值ΔL,將ΔL/L稱為人眼對比靈敏度或對比度覺察閾值。也就是說,當光強L增大時,在一定幅度內人眼感覺不出來,必須要變化到L+ΔL時,人眼才能感覺到亮度有變化,則ΔL便是圖像每一個像素的最大可容忍誤差;因此,如果恢復圖像的誤差低于ΔL,人眼就覺察不到其發生了變化,從而保證了壓縮圖像的質量,且有利于圖像數據的壓縮。因此,在壓縮過程中,先采用下面的計算方法獲得圖像8×8塊DCT變換后的每一點的可見度閾值ΔL,再把ΔL值與DCT變換后對應的系數進行比較,如果系數小于ΔL值,表現為人眼對其改變不能覺察,則可以直接記該系數為零,再依據量化零系數的分布情況采用Huffman編碼算法實現,則可以達到壓縮圖像數據的目的。
在量化的過程中,要利用描述人眼視覺系統特性的Barten模型篩選出人眼對圖像的不敏感像素點,達到在編碼過程中,讓不敏感的像素點用最短的碼字長來描述,則需要利用Barten模型計算原始圖像頻譜圖的可見度閾值ΔL。如何進行利用?就要解決以下兩個問題:1)人眼視覺特性測量中觀察目標光柵的對比度定義如何應用到圖像中;2)如何將CSF數學模型中的空間頻率與圖像中的空間頻率結合起來。下面對這兩個問題進行闡述:
1)對比度的定義。在人眼對比度敏感閾值的測量過程中,一般采用顯示器顯示目標光柵,通過精確控制顯示器的亮度和色度來實現測量時所需要的光柵的亮度和對比度,光柵的對比度采用Michole提出的亮度對比度定義[6-10]

式中:L1,L2分別為光柵條紋的亮度,Lˉ為整個光柵的平均亮度。
為了把視覺測量中的對比度定義應用到圖像壓縮技術中,首先對源圖像進行8×8大小子塊劃分,然后對每個子塊進行DCT變換[1-2],取每個8×8大小子塊圖像的平均亮度作為該大小光柵的平均亮度Lˉ值,子塊圖像中的任意一個小的區域或任意一個像素點的亮度與平均亮度Lˉ的差值為ΔL,則其對比度均可用式(3)來描述。
2)空間頻率。在圖像處理技術中,圖像的空間頻率描述了圖像像素值在空間中的變化特征,其定義是圖像的像素亮度在單位空間距離內周期性變化的次數,單位一般用周期/像素或周期/米;但是在眼視覺光學的研究中,空間頻率是指每度視角內觀察目標中以亮暗作為正弦調制的柵條周數,一般用周/度來描述[6-10]。結合兩種頻率的定義和人眼對比度感知特性的實際測量過程,兩頻率的換算方法具體描述如下。
在人眼視覺特性的測量過程中,顯示屏上顯示的光柵圖像的大小一般不變,但可以改變光柵條紋內的像素點的個數,通過改變其像素點的個數達到改變周期條紋的寬度,則不同的柵條寬度,光柵的空間頻率的就不同,從而實現實驗中需要的空間頻率。則人眼觀察目標光柵的空間視角θ的示意圖如圖2,計算方法為

式中:W是光柵圖像的寬度,由于目標光柵是采用顯示器來顯示,W不便于準確測量,但可直接通過像素值換算來得到;D為觀察者距離觀察目標的距離。

圖像的分辨力一般在顯示器設置完成后為一固定值,用Kpixel/inch來描述,根據1 inch≈2.54 cm來換算,則光柵圖像的每個像素所占的空間大小Δl和整個光柵的寬度W可用式(4)來計算

式中:W的單位為厘米(cm),Wi為光柵圖像寬度的像素數。結合圖像離散余弦變換特征和人眼視覺特性測量的實際情況,源圖像頻譜圖的空間頻率f可用式(5)來計算,其中n表示為圖像中某一像素或區域的位置(n≥2)。

結合式(1)、式(2)和上面的頻率換算方法,可計算出圖像每一小區域或每一像素位置的人眼對比度覺察閾值C和可見度閾值ΔL。通過可見度閾值ΔL采用上面的方法便可實現量化,即采用把對于不敏感的信息DCT變換系數值直接記為零,使得最大限度的減小量化后描述圖像像素的比特數,達到最大壓縮的效果。其壓縮方法流程圖如圖3。

壓縮方法流程圖具體說明如下:
1)對原始圖像順序的按8×8大小分割成一系列的子塊,對于計算機圖像處理中的數字圖像一般其灰度用8 bit來量化。
2)對每一子塊進行DCT變換。
3)首先取變換后系數精度與計算的閾值精度一致,再利用計算的閾值對每一子塊變換后每一個系數進行比較,篩選出每一子塊人眼不敏感的信息,量化其為零;具體為由于DCT變換后,頻譜顯示與分布圖表現為低頻區域幅度大,圖像信息主要集中于此;高頻區域有信息但很少,使得DCT系數集中在低頻區域,越是高頻區域系數越小;根據人眼視覺特性,計算的視覺閾值將許多能量較小的高頻分量和部分中頻分量量化為零。如此增加了變換系數中零的個數,同時保留了能量較大的系數分量,從而在保證觀測效果的同時獲得進一步的壓縮。
4)對變換系數進行Huffman編碼。
5)在經過信道傳輸或存儲后,根據上面的逆過程操作,重建圖像,獲得解壓后的圖像。
實驗選取大小為256×256的灰度圖Lena圖作為源圖像,先對其進行子塊劃分,再對每一個子塊進行DCT變換,之后根據上面提出的方法進行量化和編碼,并利用Matlab進行編程實現,獲得的結果如圖4所示。
根據人眼視覺特性,峰值信噪比PSNR>30 dB時,解壓縮后的圖像的保真度比較高,且PSNR越大,保真度越高,解壓縮圖像和源圖像之間的差異就越小。用I代表原始圖像,I′代表解壓縮后的圖像[1-2],PSNR可表示為


計算可得,此壓縮方案的PSNR為45.4775 dB。表明解壓縮圖像的保真度比較高,且從人眼視覺上看圖像的損失是可以接受的。表明該基于人眼視覺特性的壓縮算法是一種較好的算法。
在數字圖像通信系統中,壓縮比、平均碼字長度、編碼效率和冗余度是衡量數據壓縮性能的重要指標,實驗中計算得到的性能指標見表1。

表1 衡量圖像數據壓縮性能的指標
根據信息論中的信息源編碼理論,一個編碼系統的關鍵研究問題是平均碼字長度要盡可能小,使編碼效率接近1,冗余度盡量趨近零。編碼結果的平均碼字長越接近于信源的熵,其編碼效率就越高;壓縮比越大,圖像數據占用空間就越小,壓縮效果就越好,但是保真度不一定越高。為了提高壓縮技術,綜合考慮各方面的情況,最佳的編碼技術是在提高壓縮比的同時,要求平均碼長小于或等于信源的熵,使得不丟失信息,不引起圖像失真,且占用較少的比特數。由表1可見,實驗得出的結果平均碼長為1.3933,接近于信源的熵1.1231,編碼效率達到0.8823,且壓縮比在滿足人眼觀察效果的同時還能達到13.2299,表明該壓縮方案是一種較好的方案。
本文提出了一種基于人眼感知特性的DCT域圖像壓縮技術方案,方案利用人眼對比度敏感閾值來量化源圖像頻譜圖的各個8×8大小子塊的信息,再依據量化零系數的分布情況采用Huffman編碼算法實現,并通過實驗進行驗證。實驗結果表明,圖像壓縮效率和經該壓縮算法壓縮后圖像的質量較高,同時又因為結合了人眼視覺特性,保證了壓縮圖像的觀測效果,說明該壓縮方案是一種較好的方案。當然,從實驗得到的衡量數據壓縮性能的指標即平均碼長、冗余度、壓縮比和編碼效率上看,仍有待提高,但是隨著人眼視覺特性研究的不斷深入,結合HVS的感知模型來研究壓縮技術必將得到更大的發展和應用。
[1]鄭方,章毓晉.數字信號與圖像處理[M].北京:清華大學出版社,2006.
[2]王新年,張濤.數字圖像壓縮技術實用教程[M].北京:機械工業出版社,2009.
[3]李書欣,王泉,吳延贊,等.基于HVS感知模型與數據壓縮的可逆圖像水印算法[J].電視技術,2010,34(6):26-28.
[4]楊志高,易堯華,秦前清.基于視覺掩蓋效應的自適應圖像壓縮算法[J].武漢大學學報:信息科學版,2006,31(9):802-805.
[5]張曉娣,劉貴忠,曾召華,等.JPEG2000圖像壓縮編碼系統及其關鍵技術[J].電視技術,2001,25(8):13-17.
[6]姚軍財,申靜,何軍鋒,等.基于CRT顯示器的人眼對比度敏感測量[J].液晶與顯示,2008,23(6):788-793.
[7]姚軍財,申靜,王劍華.CRT顯示器亮度范圍內對人眼視覺特性的實驗研究[J].物理學報,2008,57(7):4034-4041.
[8]NADENAU M.Integration of human colour vision models into high quality image compression[D].Lausanne,Switzerland:école Polytechnique Fédérale de Lausanne,2000.
[9]JOHNSON G M,FAIRCHILD M D.Measuring images:differences,quality and appearance[J].Proceedings of the SPIE,2003,5007:51-60.
[10]JOHNSON G M,FAIRCHILD M D.Darwinism of color image difference models[C]//Proc.of IS&T/SID 9th Color Imaging Conference.Scottsdale,Arizona:[s.n.],2001:108-112.
[11]COMES S,MACQ B M.Human visual quality criterion[J].Proceeding of SPIE,1990,1360:2-13.
[12]姚軍財.基于人眼視覺特性的印刷圖像壓縮技術研究[J].包裝工程,2011,32(5):69-72.
[13]申靜.一種利用人眼視覺特性的數字圖像水印技術[J].液晶與顯示,2011,26(2):234-240.