范 超
(河海大學 計算機與信息學院, 江蘇 南京 211100)
隨著遙感成像光譜儀的發展,遙感成像由多光譜發展到高光譜(Hyperspectral)階段,高光譜成像光譜儀在對目標進行成像的同時,對每個空間像元經過色散形成幾十個甚至上百個窄波段以進行連續光譜成像,因此高光譜遙感圖像可以看為一個由空間維和光譜維組成的多維圖像立方體。與傳統多光譜遙感影像相比,高光譜影像不僅在信息豐富程度方面有了極大的提高,在處理技術上,對該類光譜數據進行更為合理、有效的分析處理提供了可能。它的覆蓋范圍從可見光到近紅外光(400~2 500 nm),每一個波段寬度大約10 nm左右,得到每個像元完整連續光譜曲線的同時,也增加了圖像數據量,且波段之間相關性很強,因而包含了大量的冗余信息,這給后續的處理帶來了一定的難度。
在實際的應用過程中,高光譜遙感圖像作為一個圖像立方體[1](如圖1所示),需要根據具體要求,在不改變圖像原有特性的基礎上對高光譜圖像進行降維,以便提高后期處理效率。針對這個問題,可以采用波段選擇的方法,從原始圖像數百個波段中選取最能代表整體特征的波段組,以此來表示整個數據集。現有的波段選擇方法在進行波段組合優選時主要從3個因素著手:
1)所選擇的波段或波段組合信息含量大;
2)所選擇的波段與波段之間相關性小;
3)所選擇的波段與波段之間能使某些類別地物容易區分。
本文從信息論和波段間相關性這兩個方面綜合考慮,提出了一種采用粒子群優化算法(PSO)基于信息論準則的高光譜遙感圖像波段選擇方法,進行波段組合優選。

圖1 高光譜圖像立方體Fig.1 Hyperspectral remote sensing image cube
粒子群算法(particleswarmoptimization,PSO)是計算智能領域的一種群體智能的優化算法[2-3]。該算法最早由Kennedy和Eberhart在1995年提出的。PSO算法源于對鳥類捕食行為的研究,鳥類捕食時,找到食物最簡單有效的策略就是搜尋當前距離食物最近的鳥的周圍區域。PSO算法是從這種生物種群行為特征中得到啟發并用于求解優化問題的,算法中每個粒子都代表問題的一個潛在解,每個粒子對應一個由適應度函數決定的適應度值。粒子的速度決定了粒子移動的方向和距離,速度隨自身及其他粒子的移動經驗進行動態調整,從而實現個體在可解空間中的尋優。
PSO算法首先在可行解空間中初始化一群粒子,每個粒子都代表極值優化問題的一個潛在最優解,用位置、速度和適應度值三項指標表示該粒子特征,適應度值由適應度函數計算得到,其值的好壞表示粒子的優劣。粒子在解空間中運動,通過跟蹤個體極值Pbest和群體極值Gbest更新個體位置。個體極值Pbest是指個體所經歷位置中計算得到的適應度值最優位置,群體極值Gbest是指種群中的所有粒子搜索到的適應度最優位置。粒子每更新一次位置,就計算一次適應度值,并且通過比較新粒子的適應度值和個體極值、群體極值的適應度值更新個體極值Pbest和群體極值Gbest位置。
假設在一個D維的搜索空間中,由n個粒子組成的種群X=(X1,X2,…,Xn),其中第i個粒子表示為一個D維的向量Xi=(xi1,xi2,…,xiD)T,代表第i個粒子在D維搜索空間中的位置,亦代表問題的一個潛在解。根據目標函數即可計算出每個粒子位置Xi對應的適應度值。第i個粒子的速度為Vi=(Vi1,Vi2,…,ViD)T,其個體極值為Pi=(Pi1,Pi2,…,PiD)T,種群的群體極值為Pg=(Pg1, Pg2,…, PgD)T。
在每次迭代過程中,粒子通過個體極值和種群極值更新自身的速度和位置,即式(1)(2):

中,ω為慣性權重;d=1,2,…,D;i=1,2,…,n;k為當前迭代次數;Vid為粒子的速度;c1和c2是非負的常數,稱為加速度因子;r1和r2是分布于〔0,1〕區間的隨機數。為防止粒子的盲目搜索,一般建議將其位置和速度限制在一定的區間[-Xmax,Xmax]、[-Vmax,Vmax]。
根據高光譜遙感圖像波段多、數據量大、波段間相關性強等特點[4],本文設計的高光譜遙感圖像波段選擇方法共分為四個階段,如圖2所示:1)圖像預處理階段;2)波段去相關分組階段;3)波段優化組合階段;4)分類驗證階段。

圖2 波段選擇法流程圖Fig.2 Band selection algorithm flowchart
1)原始圖像預處理
大氣吸收、散射作用使得到達地表的輻射能力和到達遙感器的地物反射能量都出現衰減且大氣本身作為散射體的上行散射輻射到達遙感器使得能量增加,但該輻射能量不帶有任何地物信息。在圖像預處理階段,對原始高光譜圖像進行輻射校正和幾何校正,去除受噪聲和水氣污染較為嚴重的波段。
2)波段分組去相關
多波段圖像間的相關性表示了每個波段圖像在相同空間位置處的像素相關性,反應了波段之間的冗余,可用互相關系數進行評價,相關系數越大,相關性越強,波段間冗余越高[5]。波段i與波段j間的相關系數Rij可表示為:

式中,xi,xj分別表示i,j波段上對應位置值,μi、μj分別為i , j波段平均值,E()表示函數的數學期望。
文中根據相鄰波段間的相關系數變化曲線對經預處理的高光譜遙感圖像進行波段分組。
3)波段優化組合
依照提出的基于信息論準則的高光譜波段選擇方法,將波段的信息熵作為粒子群優化算法(PSO)的適應度函數,波段的適應度切合程度決定波段組合被選中的概率。在進行選擇時,同時考慮波段與相鄰前一波段之間的相關系數,選擇信息熵大且相關系數較小的波段。
根據香農信息理論,熵可以用來表征信息量[6],它使總體平均意義上的概念,一幅8bit的圖像P的每個像元所攜帶的平均信息量可以用熵H來表示:

其中,是圖像中像素灰度值為i的概率。
粒子群優化算法(PSO)在進行多目標優化時,隨著迭代次數的變化,粒子的速度和位置也發生變化,粒子的位置不斷朝著較優位置變動,迭代若干次后獲得最優解組合。速度更新公式中慣性權值ω決定著算法的全局搜索能力與局部搜索能力,本文為了兼顧算法的全局搜索能力與局部搜索能力,迭代過程中采用變慣性權值的方式,在每次迭代完成后,改變慣性權值ω的大小。算法中ω按照式(5)進行隨機調整。波段優選方法詳細流程如圖3所示。

其中,rand( )為0~1之間的一個隨機數。

圖3 波段選擇詳細算法流程圖Fig. 3 Hyperspectral image band selection algorithm flow chart
整個算法詳細步驟如下:
1)初始化粒子群,每個粒子由高光譜圖像波段組合、慣性權值ω、加速因子C 3部分組成。初始種群中粒子隨機生成3部分,初始種群的大小根據計算的復雜程度進行合理設置,保證初始種群中含有盡可能多的可能解;
2)根據波段的信息熵和與相鄰前一波段間相關系數計算公式計算適應度值,求解最優解;
3)根據第2部分式(1)(2)更新粒子的速度Vi、位置Xi;
4)判斷是否符合迭代停止條件,如未達到停止條件則改變慣性權值,跳至第3步繼續迭代尋優。如達到迭代停止條件則結束搜索,輸出最優解。
為了驗證文中提出的基于信息量準則的高光譜波段選擇方法的可行性和有效性,本文采用1992年6月利用AVIRIS傳感器獲得的印第安納州西北部印第安農林高光譜遙感試驗區的一部分圖像進行試驗。預先經過統計及計算去除受水氣和噪聲影響較為嚴重的波段(波段1-4、78、103-110、149-165、217-224),經處理后圖像剩余179個波段,圖4為第5、37、120三波段合成的R、G、B偽彩色圖。整個實驗在InterCORE 2.1 GHz CPU、內存為4G的計算機上運行,采用Matlab R2009編程實現。

圖4 第5、37、120三波段合成的R、G、B偽彩色圖Fig. 4 5、37、120tri-band synthesis of R、G、B pesudo-color diagram
按照前章描述的處理過程,對經處理剩余的179個波段進行分組。根據式(3)計算波段間的相關系數,得到相關系數矩陣。如圖5所示,相關系數矩陣具有分塊的特點,且以對角線左右對稱,圖中灰度值越大,代表波段間的相關系數越大,相關性越強。表1為部分波段間的相關系數矩陣,從相關系數矩陣中分別獲得首波段與波段間及相鄰波段間的相關系數,如圖6所示。結合圖5與圖6將179個波段劃分為5個波段子集 :[1-33]、[34-75]、[76-91]、[92-129]、[130-179]。

圖5 相關系數矩陣灰度圖Fig. 5 Correlation coefficient matrix grayscale
實驗中,粒子群優化算法的參數設置如下:c1=c2=2,粒子速度的初始值為0,迭代次數設置為200,種群規模設定為50,個體速度最大值和最小值分別設定為5和-5。慣性權值ω按照式變動,當迭代次數達到預設200時,算法停止。經過算法搜索選取,獲得波段組合[25,37,77,102,143]為最佳組合。
為進一步評價采用本文提出的方法選出的最佳波段組合,對選出的最佳波段組合進行分類驗證,并與使用等間隔劃分波段方法進行比較。采用支持向量機(SVM)高光譜分類方法進行分類,經計算得到分類準確率達到91.0%,較采用等間隔劃分波段方法有明顯的提高。圖7所示分別為原始地物定標圖、使用按波段間相關系數分組方法分組分類圖和使用等間隔分組方法分組分類圖。

表1 部分波段間的相關系數矩陣Tab.1 Correlation matrix between the part of the band

圖6 波段與首波段間及相鄰波段間的相在系數圖Fig. 6 Band and the first band and adjacent band correlation coefficient between Figure

圖7 分類結果對比圖Fig. 7 Comparison of the classification results
在對高光譜圖像進行處理時,圖像降維是關鍵的處理步驟,近年來很多文獻提出了相應的解決辦法,本文在分析現有文獻基礎上,針對現有方法采用單一準則的片面性,結合高光譜圖像波段間的相關系數,提出了一種基于信息量準則的高光譜波段選擇方法。實驗結果表明該方法對AVIRIS高光譜遙感圖像波段選擇的有效性。
文中雖然驗證了對AVIRIS高光譜遙感圖像進行波段選擇時具有較高的效率,但對于其他的高光譜遙感圖像未得到進一步的驗證,還需要對不同類型光譜成像儀獲得的圖像進行實驗與驗證,這都需要進一步分析與研究。
[1]張兵,高連如. 高光譜圖像分類與目標探測[M]. 北京:科學出版社,2010.
[2]Kennedy J,Eeberhart R C. Particle Swarm Optimization[C]//Proceedings of IEEE International Conference on Neural Network s. Perth: IEEE Neural Networks Society,1995: 1942-1948.
[3]Ke nne dy J,Ebe rhart R C. A discrete binary version of the particle swarm Algorithm[C]//Proceedings of the World Multiconference on Systemic, Cybernetics and Informatics 1997.Piscataway: IEEE,1997:4104-4109.
[4]趙春暉,陳萬海,楊雷. 高光譜遙感圖像最優波段選擇方法的研究進展與分析[J].黑龍江大學自然科學學報,2007,24(5):592-602.
ZHAO Chun-hui,CHEN Mo-hai,YANG Lei. Research advances and analysis of hyperspectral remote sensing image band selection[J]. Journal of Natural Science of Heilongjiang University,2007,24(5):592-602.
[5]蘇紅軍,盛業華,杜培軍. 自動子空間劃分在高光譜影像波段選擇中的應用[J]. 地球信息科學,2007,9(4):123-128.
SU Hong-jun,SHENG Ye-hua,DU Pei-jun. Study on autosubspace partition for band selection of hyperspectral image[J].GEO-INFORMATION Science,2007,9(4):123-128.
[6]盧健,彭嫚,盧昕. 遙感圖像相關性及其熵計算[J]. 武漢大學學報:信息科學版,2006,31(6):476-480.
LU Jian,PENG Man,LU Xin. Relativity of remote sensing images and entropy calculation[J]. Geomatics and Information Science of Wuhan University,2006,31(6):476-480.