高 放 孫長建 邵慶龍 郭樹旭
?
基于K-均值聚類和傳統(tǒng)遞歸最小二乘法的高光譜圖像無損壓縮
高 放 孫長建 邵慶龍 郭樹旭*
(吉林大學(xué)電子科學(xué)與工程學(xué)院 長春 130012)
針對基于預(yù)測的高光譜圖像無損壓縮算法壓縮比低的問題,該文將聚類算法與高光譜圖像預(yù)測壓縮算法相結(jié)合,提出一種基于K-均值聚類和傳統(tǒng)遞歸最小二乘法的高光譜圖像無損壓縮算法。首先,對高光譜圖像按光譜矢量進(jìn)行K-均值聚類以提升同類光譜矢量間的相似度。然后,對每一聚類群分別使用傳統(tǒng)遞歸最小二乘法進(jìn)行預(yù)測,消除高光譜圖像的空間冗余和譜間冗余。最后,對預(yù)測誤差圖像進(jìn)行算術(shù)編碼,完成高光譜圖像壓縮過程。對AVIRIS 2006高光譜數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),所提算法對16位校正圖像、16位未校正圖像和12位未校正圖像分別取得了4.63倍,2.82倍和4.77倍的壓縮比,優(yōu)于同類型已報道的各種算法。
高光譜圖像;圖像壓縮;遞歸最小二乘法;聚類
高光譜圖像由于在地物的分類和識別上所特有的極強(qiáng)能力,在大氣檢測、資源管理、環(huán)境監(jiān)測、軍事偵查和礦產(chǎn)勘探等領(lǐng)域有著廣泛的應(yīng)用。近年來,伴隨著光譜成像技術(shù)的飛速發(fā)展,高光譜圖像越來越高的空間分辨率、譜間分辨率和時間分辨率導(dǎo)致其數(shù)據(jù)量的迅速上升,對高光譜圖像的存儲與傳輸造成了巨大的壓力。高光譜圖像作為最有價值的遙感觀測數(shù)據(jù)之一,多用來對地物進(jìn)行精確分類,在壓縮時引起的任何圖像數(shù)據(jù)的失真都是不可接受的,所以,即使有損壓縮可以得到更好的壓縮效果,但只有對高光譜圖像進(jìn)行無損壓縮才可以在提高傳輸和儲存效率、降低成本的同時,又保證了高光譜圖像的質(zhì)量。因此,在大多數(shù)情況下,對高光譜圖像進(jìn)行無損壓縮是將其存儲或傳輸之前必不可少的一步,高光譜圖像的無損壓縮技術(shù)也一直是當(dāng)前國內(nèi)外研究的熱門領(lǐng)域。
高光譜圖像具有兩種不同的相關(guān)性,同一波段像素間的空間相關(guān)性和相鄰波段像素間的譜間相關(guān)性。在高光譜圖像中,譜間相關(guān)性遠(yuǎn)大于空間相關(guān)性,因此,在利用空間相關(guān)性的同時充分發(fā)掘高光譜圖像中較強(qiáng)的譜間相關(guān)性是高光譜圖像無損壓縮算法取得良好壓縮結(jié)果的關(guān)鍵。目前,常見的高光譜圖像壓縮算法根據(jù)其去除相關(guān)性方法的不同可分為3類:預(yù)測法、變換法和矢量量化法。其中,矢量量化法由于其龐大的算法復(fù)雜度對實(shí)際應(yīng)用的制約,導(dǎo)致當(dāng)前針對矢量量化法的高光譜圖像壓縮算法相對較少。變換法可使用較小的碼字表示圖像的大部分能量,方便了對細(xì)節(jié)分量的量化,因此多用于近無損壓縮和有損壓縮。預(yù)測法通過特定的預(yù)測準(zhǔn)則對待測像素估值以得到預(yù)測誤差的方法合理地利用了高光譜圖像的空間相關(guān)性和譜間相關(guān)性,可以對高光譜圖像取得良好的無損壓縮效果的同時保持較低的算法復(fù)雜度,是近年來國內(nèi)外研究的重點(diǎn)。
文獻(xiàn)[1]提出的基于查找表(LUT)的預(yù)測壓縮算法,將前一波段中與待測像素具有相同空間坐標(biāo)的像素視為索引,通過在表中查找此索引得出最終預(yù)測結(jié)果。文獻(xiàn)[2]對文獻(xiàn)[1]中算法進(jìn)行強(qiáng)化,該算法首先計算待測像素的LAIS(Locally Averaged Interband Scaling)參考值,通過在兩個表內(nèi)查找索引值得到兩個預(yù)測結(jié)果,選擇其中與LAIS參考值最接近的作為最終預(yù)測結(jié)果。文獻(xiàn)[3]在完善文獻(xiàn)[2]中LAIS參考值計算公式的同時,通過自適應(yīng)量化因子的使用對索引值進(jìn)行量化以達(dá)到減少表所占內(nèi)存空間的目的。文獻(xiàn)[4]提出了一種致力于機(jī)上壓縮的FL(Fast Lossless)算法,該算法使用多個當(dāng)前已知波段預(yù)測待測波段,并使用最小均方誤差法(LMS)求解預(yù)測系數(shù)。文獻(xiàn)[5]提出的IP3(Third-Order Interband Predictor)算法將其譜間預(yù)測的過程轉(zhuǎn)化為維納濾波的求解過程。文獻(xiàn)[6]提出的RLS算法首次將遞歸最小二乘法引入到高光譜圖像預(yù)測壓縮領(lǐng)域。更多研究內(nèi)容參見文獻(xiàn)[7-20]。
預(yù)測壓縮算法作為一種最經(jīng)典且最成功的無損壓縮算法之一,主要通過使用當(dāng)前已知數(shù)據(jù)預(yù)測未知數(shù)據(jù),已知數(shù)據(jù)的選取和預(yù)測系數(shù)的確定制約了預(yù)測壓縮算法的準(zhǔn)確度。而高光譜圖像的圖像紋理相對密集,對某一像素進(jìn)行預(yù)測時,其近鄰的已知像素往往都是不同地物的成像,選取屬于不同地物的像素對待測像素進(jìn)行預(yù)測極易造成預(yù)測失準(zhǔn),進(jìn)而對算法的壓縮性能造成損害。在高光譜圖像中,同一地物在相同的光照強(qiáng)度、結(jié)構(gòu)特征、覆蓋植被種類等條件下具有相似的光譜信息,從而表現(xiàn)出較強(qiáng)的相似度,可劃分到同一類中。對高光譜圖像進(jìn)行聚類處理,有助于去除其空間冗余,提高預(yù)測壓縮算法的壓縮性能。
本文提出了一種基于K-均值聚類和傳統(tǒng)遞歸最小二乘法的高光譜圖像無損壓縮算法(C-CRLS)。首先,該算法以高光譜圖像中的每條光譜矢量為樣本進(jìn)行K-均值聚類以提升同類光譜矢量間的相似度,去除空間冗余。然后,對每一聚類群分別使用傳統(tǒng)遞歸最小二乘法預(yù)測以消除高光譜圖像的譜間冗余。最后,對預(yù)測誤差圖像進(jìn)行算術(shù)編碼,完成壓縮過程。該算法充分利用了高光譜圖像的空間相關(guān)性和譜間相關(guān)性,在取得良好壓縮結(jié)果的同時保持了相對較低的運(yùn)算時間。
為了充分利用高光譜圖像光譜矢量間的冗余,提高算法的壓縮比,本文將K-均值聚類算法與傳統(tǒng)預(yù)測算法相結(jié)合得到新壓縮算法。本文算法將高光譜圖像的無損壓縮過程分為3個步驟:聚類、預(yù)測和編碼,圖1展示了本文算法的流程圖。
2.1 K-均值聚類
本文選用K-均值聚類算法[21]將高光譜圖像中的每個光譜矢量(光譜矢量由高光譜圖像各波段中同一空間坐標(biāo)的像素構(gòu)成)分配到與其距離最近的聚類群之中,整個聚類過程由以下5步組成:
(1)確定聚類群數(shù)目,本文通過仿真實(shí)驗(yàn)選擇使用16個聚類群以獲得最佳壓縮效果。
(2)生成16個隨機(jī)光譜矢量作為16個初始聚類群的中心點(diǎn)。
(3)將每個光譜矢量分配到最近距離的聚類群中,光譜矢量間的距離使用歐幾里得距離,其表達(dá)式如式(1)所示,其中和分別表示一條光譜矢量,為光譜矢量的長度,即高光譜圖像的波段數(shù)。

(4)對所有光譜矢量完成一次聚類后,重新計算每個新聚類群的中心點(diǎn)。

圖1 本文算法流程圖
(5)重復(fù)運(yùn)行步驟(3)和步驟(4)直至算法收斂。
K-均值聚類算法通常需要使用不同的隨機(jī)中心點(diǎn)多次進(jìn)行初始化計算,然而以高光譜圖像的光譜矢量作為數(shù)據(jù)集時,使用不同的隨機(jī)中心點(diǎn)并不會影響壓縮算法的最終壓縮結(jié)果。因此,對于每一組高光譜圖像,本文算法的K-均值聚類步驟只需運(yùn)行一次,并未增加算法的整體復(fù)雜度。為了更直觀地描述本文算法中的K-均值聚類過程,其算法流程圖如圖2所示。

圖2 K-均值聚類算法流程圖
2.2傳統(tǒng)遞歸最小二乘預(yù)測
本文算法對高光譜圖像進(jìn)行K-均值聚類后,分別對每一聚類群的重構(gòu)圖像使用傳統(tǒng)遞歸最小二乘法[22]預(yù)測得到預(yù)測誤差圖像。在此階段,本文將第波段中第行列的待測像素設(shè)為,當(dāng)高光譜圖像中像素按反向光柵掃描順序排列時,本文也使用來表示第波段中的第個像素(其中為高光譜圖像的寬度)。



與輸入向量相對應(yīng)的系數(shù)向量定義為

首先,對傳統(tǒng)遞歸最小二乘法進(jìn)行如下初始化,其中為單位矩陣,。


然后,使用遞歸最小二乘法預(yù)測待測像素,得出預(yù)測誤差:

設(shè):



2.3算術(shù)編碼
本文采用文獻(xiàn)[23]中的算術(shù)編碼器對預(yù)測步驟得到的誤差圖像進(jìn)行編碼壓縮。由于文獻(xiàn)[23]中算術(shù)編碼器的輸入只能為正整數(shù)序列,因此,本文算法在進(jìn)行編碼壓縮之前,首先對預(yù)測誤差圖像進(jìn)行轉(zhuǎn)換,在轉(zhuǎn)換序列中使用正整數(shù)表示預(yù)測誤差圖像中出現(xiàn)的第個新誤差值。在預(yù)測誤差圖像全部轉(zhuǎn)換完成后,使用算術(shù)編碼器對轉(zhuǎn)換序列和轉(zhuǎn)換對應(yīng)關(guān)系進(jìn)行編碼壓縮,完成本文算法的全部壓縮過程。
為了驗(yàn)證本文算法的有效性,使用現(xiàn)有實(shí)驗(yàn)平臺(Intel i7 3.80 GHz CPU/16GB RAM)對機(jī)載可見光/紅外成像光譜儀(AVIRIS)于2006年獲取的高光譜圖像進(jìn)行MATLAB仿真測試。AVIRIS 2006高光譜數(shù)據(jù)由5組16位校正圖像、5組16位未校正圖像和2組12位未校正圖像組成,每組圖像均包含224個光譜波段,圖像寬度均為512列,其具體規(guī)格如表1所示。
3.1參數(shù)設(shè)定
仿真實(shí)驗(yàn)過程中相應(yīng)的參數(shù)設(shè)定如下:
為上下文窗口大小,本文算法在=24(即上下文窗口中包含24個已知像素)時得到的壓縮比較=4時高0.04,繼續(xù)增大上下文窗口的尺寸無法獲得更好的壓縮結(jié)果,因此本文算法中上下文窗口的設(shè)定如式(2)所示。
3.2 壓縮結(jié)果
表2比較了同樣使用AVIRIS 2006高光譜數(shù)據(jù)作為實(shí)驗(yàn)圖像的多種高光譜圖像無損壓縮算法的壓縮結(jié)果,采用壓縮比作為無損壓縮算法性能的評價標(biāo)準(zhǔn),其中包括JPEG-LS[7], LUT[1], LAIS-LUT[2], FL[4], IP3[5]和本文算法C-CRLS,對每組實(shí)驗(yàn)結(jié)果中的最高壓縮比使用加粗表示。表2顯示,本文算法對AVIRIS 2006高光譜數(shù)據(jù)中的16位校正圖像、16位未校正圖像和12位未校正圖像分別取得了4.63倍、2.82倍和4.77倍的平均壓縮比,高于所比較的其他高光譜圖像無損壓縮算法,并且,本文算法對12組高光譜數(shù)據(jù)中任意一組所取得的壓縮結(jié)果也為最優(yōu)。
表3對比了本文算法和同樣基于遞歸最小二乘法的RLS算法[6]對相同實(shí)驗(yàn)圖像進(jìn)行壓縮得到的壓縮結(jié)果。表3顯示,在以AVIRIS 2006高光譜數(shù)據(jù)中的16位校正圖像、16位未校正圖像和12位未校正圖像分別作為實(shí)驗(yàn)圖像時,本文算法得到的壓縮比較RLS算法分別高出4%,2%和3%,對應(yīng)提高的壓縮比數(shù)值分別為0.17, 0.06和0.15。表3證明了與其他基于遞歸最小二乘法的高光譜圖像無損壓縮算法進(jìn)行比較時,本文算法由于將K-均值聚類與預(yù)測算法結(jié)合,充分利用了高光譜圖像的空間相關(guān)性和譜間相關(guān)性,因而在壓縮性能的比較上更具優(yōu)勢。

表1 AVIRIS 2006高光譜圖像規(guī)格

表2 多種算法對AVIRIS 2006高光譜圖像的壓縮結(jié)果比較

表3 本文算法和RLS算法對AVIRIS 2006高光譜圖像的壓縮結(jié)果對比
表4展示了本文算法對AVIRIS 2006高光譜圖像進(jìn)行壓縮時的計算時間,其中cal和raw分別表示校正圖像和未校正圖像。對于本文算法,K-均值聚類對每場景圖像的平均計算時間為12 s,算術(shù)編碼對每場景圖像的平均計算時間為71 s,傳統(tǒng)遞歸最小二乘法預(yù)測對每波段圖像的平均計算時間為3.7 s。本文算法的計算復(fù)雜度與RLS算法接近,從文獻(xiàn)[6]中的數(shù)據(jù)對比可知,本文算法在運(yùn)算時間上少于IP3算法,但多于LAIS-LUT和FL算法,這主要是由于本文算法在進(jìn)行仿真實(shí)驗(yàn)時選取8個已知波段預(yù)測當(dāng)前波段,而LAIS-LUT和FL算法分別只使用了1個和3個已知波段預(yù)測當(dāng)前波段,減少了預(yù)測器的運(yùn)算時間。
從上述對比中可以看出,JPEG-LS作為傳統(tǒng)2維圖像壓縮算法,只利用了圖像的空間相關(guān)性,取得了所比較算法中最差的壓縮比,并不適用于高光譜圖像。LUT算法和LAIS-LUT算法作為針對高光譜圖像的無損壓縮算法,使用一個已知波段預(yù)測當(dāng)前波段,雖然具有運(yùn)算時間短和算法復(fù)雜度低的特點(diǎn),但同樣只能獲得差強(qiáng)人意的壓縮比。FL算法和IP3算法著重利用高光譜圖像的譜間相關(guān)性,使用多個已知波段預(yù)測當(dāng)前波段,獲得了更好的壓縮比,但在運(yùn)算時間上遠(yuǎn)高于LUT算法。而本文提出的C-CRLS算法,通過K-均值聚類和傳統(tǒng)遞歸最小二乘預(yù)測分別去除了高光譜圖像的空間冗余和光譜冗余,充分利用了高光譜圖像的空間相關(guān)性和譜間相關(guān)性,取得了所對比算法中的最高壓縮比,與此同時,本文算法在運(yùn)算時間也優(yōu)于IP3算法,證明了本文算法在取得高壓縮性能的同時保持了相對較低的運(yùn)算時間。
表4本文算法對AVIRIS 2006高光譜圖像壓縮的計算時間

圖像名稱計算時間(s) Yellowstone 0 cal 848 Yellowstone 3 cal 791 Yellowstone 10 cal1123 Yellowstone 11 cal1093 Yellowstone 18 cal 902 Yellowstone 0 raw 841 Yellowstone 3 raw 778 Yellowstone 10 raw1265 Yellowstone 11 raw1077 Yellowstone 18 raw 814 Hawaii 1 raw 702 Maine 10 raw 764 平均 917
為了充分提高高光譜圖像無損壓縮算法的壓縮比,本文將圖像聚類與預(yù)測壓縮相結(jié)合,提出了基于K-均值聚類和傳統(tǒng)遞歸最小二乘法的高光譜圖像無損壓縮算法。首先,對高光譜圖像以光譜矢量為單位進(jìn)行K-均值聚類以提升同類光譜矢量間的相似度。然后,對每一聚類群分別進(jìn)行傳統(tǒng)遞歸最小二乘預(yù)測。最后,對預(yù)測誤差圖像進(jìn)行算術(shù)編碼。對AVIRIS 2006高光譜數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)的實(shí)驗(yàn)結(jié)果表明,本文算法對16位校正圖像、16位未校正圖像和12位未校正圖像分別取得了4.63倍,2.82倍和4.77倍的壓縮比,優(yōu)于同類型已報道的各種算法,同時,該算法具有相對較低的運(yùn)算時間,證明了本文算法的有效性和實(shí)用性,為高光譜圖像無損壓縮提供了一種很好的解決方案。
[1] MIELIKAINEN J. Lossless compression of hyperspectral images using lookup tables[J]., 2006, 13(3): 157-160. doi: 10.1109/LSP.2005.862604.
[2] HUANG B and SRIRAJA Y. Lossless compression of hyperspectral imagery via lookup tables with predictor selection[C]. Conference on Image and Signal Processing for Remote Sensing XII, Stockholm, Sweden, 2006: 63650L.1- 63650L.8. doi: 10.1117/12.690659.
[3] MIELIKAINEN J and TOIVANEN P. Lossless compression of hyperspectral images using a quantized index to lookup tables[J]., 2008, 5(3): 474-478. doi: 10.1109/LGRS.2008.917598.
[4] KLIMESH K. Low-complexity adaptive lossless compression of hyperspectral imagery[C]. Conference on Satellite Data Compression, Communications, and Archiving II, San Diego, USA, 2006: 63000N-1-63000N-9. doi: 10.1117/12.682624.
[5] LIN Chengchen and HWANG Yintsung. An efficient lossless compression scheme for hyperspectral images using two-stage prediction[J]., 2010, 7(3): 558-562. doi: 10.1109/LGRS.2010.2041630.
[6] SONG Jinwei, ZHANG Zhongwei, and CHEN Xiaomin. Lossless compression of hyperspectral imagery via RLS filter[J]., 2013, 49(16): 992-993. doi: 10.1049/el.2013.1315.
[7] ABRARDO A, BARNI M, MAGLI E,. Error-resilient and low-complexity onboard lossless compression of hyperspectral images by means of distributed source coding[J]., 2010, 48(4): 1892-1904. doi: 10.1109/TGRS.2009.2033470.
[8] RIZZO F, CARPENTIERI B, MOTTA G,. Low- complexity lossless compression of hyperspectral imagery via linear prediction[J]., 2005, 12(2): 138-141. doi: 10.1109/LSP.2004.840907(410).
[9] MAGLI E. Multiband lossless compression of hyperspectral images[J]., 2009, 47(4): 1168-1178. doi: 10.1109/TGRS. 2008.2009316.
[10] MIELIKAINEN J and TOIVANEN P. Clustered DPCM for the lossless compression of hyperspectral images[J]., 2003, 41(12): 2943-2946. doi: 10.1109/TGRS.2003.820885.
[11] AIAZZI B, ALPARONE L, BARONTI S,. Crisp and fuzzy adaptive spectral predictions for lossless and near-lossless compression of hyperspectral imagery[J]., 2007, 4(4): 532-536. doi: 10.1109/LGRS.2007.900695.
[12] WU Jiaji, KONG Wanqiu, MIELIKAINEN J,. Lossless compression of hyperspectral imagery via clustered differential pulse code modulation with removal of local spectral outliers[J]., 2015, 22(12): 2194-2198. doi: 10.1109/LSP.2015.2443913.
[13] ULKU I and TOREYIN B U. Sparse representations for online-learning-based hyperspectral image compression[J]., 2015, 54(29): 8625-8631. doi: 10.1364/AO.54.008625.
[14] WANG Lei, BAI Jing, WU Jiaji,. Hyperspectral image compression based on lapped transform and Tucker decomposition[J].:, 2015, 36: 63-69. doi: 10.1016/j.image.2015.06.002.
[15] BEERTEN J, BLANES I, and SERRA-SAGRISTA J. A fully embedded two-stage coder for hyperspectral near-lossless compression[J]., 2015, 12(8): 1775-1779. doi: 10.1109/LGRS.2015.2425548.
[16] LEE C, YOUN S, JEONG T,. Hybrid compression of hyperspectral images based on PCA with pre-encoding discriminant information[J]., 2015, 12(7): 1491-1495. doi: 10.1109/LGRS. 2015.2409897.
[17] ZHAO Chunhui, LI Xiaohui, REN Jinchang,. A novel framework for object-based coding and compression of hyperspectral imagery[J]., 2015, 24(2): 300-305. doi: 10.1049/cje.2015.04.012.
[18] NIAN Yongjian, HE Mi, and WAN Jianwei. Lossless and near-lossless compression of hyperspectral images based on distributed source coding[J]., 2015, 28: 113-119. doi: 10.1016/j.jvcir.2014.06.008.
[19] ZHANG Lefei, ZHANG Liangpei, TAO Dacheng,. Compression of hyperspectral remote sensing images by tensor approach[J]., 2015, 147(1): 358-363. doi: 10.1016/j.neucom.2014.06.052.
[20] HUANG Bingchao, NIAN Yongjian, and WAN Jianwei. Distributed lossless compression algorithm for hyperspectral images based on classification[J]., 2015, 48(7): 528-535. doi: 10.1080/00387010.2014.920888.
[21] JAIN A K. Data clustering: 50 years beyond k-means[C]. 19th International Conference on Pattern Recognition, Tampa, USA, 2010: 651-666.
[22] DINIZ P S R. Adaptive Filtering: Algorithms and Practical Implementation[M]. New York, Springer, 2012: 195-227.
[23] MOFFAT A, NEAL R, and WITTEN I H. Arithmetic coding revisited[C]. Data Compression Conference, Snowbird, USA, 1995: 202-211.
Lossless Compression of Hyperspectral Images Using K-means Clustering and Conventional Recursive Least-squares Predictor
GAO Fang SUN Changjian SHAO Qinglong GUO Shuxu
(,,130012,)
To improve the compression ratio of lossless compression scheme based on prediction, a lossless compression scheme for hyperspectral images using K-means Clustering method and Conventional Recursive Least-Squares (C-CRLS) predictor is presented in this paper. The proposed scheme first clusters the spectral data into clusters according to their spectra using the famous K-means clustering method. Then, the proposed scheme calculates the preliminary estimates to form the input vector of the conventional recursive least-squares predictor. Finally, after prediction, the prediction residuals are sent to the arithmetic coder. Experiments on the Airborne Visible/Infrared Imaging Spectrometer (AVIRIS) 2006 hyperspectral images show that the proposed scheme yields an average compression ratio of 4.63, 2.82, and 4.77 on the 16-bit calibrated images, the 16-bit uncalibrated images, and the 12-bit uncalibrated images, respectively. Experimental results demonstrate that the proposed scheme outperforms other current state-of-the-art schemes for hyperspectral images that have been previously reported.
Hyperspectral images; Image compression; Recursive least-squares; Clustering
TP751.2
A
1009-5896(2016)11-2709-06
10.11999/JEIT151439
2015-12-22;改回日期:2016-04-08;
2016-05-25
郭樹旭 guosx@jlu.edu.cn
國家自然科學(xué)基金(41101419)
The National Natural Science Foundation of China (41101419)
高 放: 男,1987年生,博士生,研究方向?yàn)楦吖庾V圖像壓縮.
孫長建: 男,1993年生,博士生,研究方向?yàn)閿?shù)字圖像處理.
邵慶龍: 男,1990年生,碩士生,研究方向?yàn)橐曨l圖像處理.
郭樹旭: 男,1959年生,博士生導(dǎo)師,研究方向?yàn)閿?shù)字圖像處理與分析等.