任會峰,朱洪前,唐 玥,董慶超
(1.無錫學院,江蘇 無錫 214105;2.中南林業科技大學 材料科學與工程學院,長沙 410004;3.海軍航空大學 岸防兵學院,山東 煙臺 264001)
遙感圖像分類是高光譜遙感圖像處理的重要分支,在城市規劃、智能農業、環境保護、地質勘探、搶險救災以及軍事偵察等領域應用廣泛[1-2]。目前主要依據地物圖像的空間信息分類識別遙感圖像場景[3]。在計算機運算能力相對較低的早期,學者們主要依據遙感圖像的局部特征進行分類[4-5],這些研究為遙感圖像分類進行了積極探索,但由于探測波段和空間分辨率較低等因素的影響,遙感圖像分類面臨特征維數高、訓練樣本缺乏等問題,而且局部特征與遙感圖像本身的語義之間存在“鴻溝”[6]。為了提高對遙感圖像語義的理解和表示,相關學者在局部特征的基礎上引入特征編碼方法,如詞袋模型BOW[7]以及結合稀疏表示[8-9]的改進算法,提高了對圖像的描述能力[10-11]。機器學習方法中,傳統字典學習通過最小化信號重構誤差實現分類[12],不適用于圖像分類,且圖像細節的方向性影響局部特征的描述[13],不同尺度圖像的細節也不同[14]。
將遙感圖像在8個方向5個尺度進行高斯核分解后提取Gabor特征,并用改進的粒子群算法確定中心最大頻率和帶寬的最優取值,稀疏表示構建Gabor特征視覺詞典,形成遙感圖像稀疏系數矩陣輸入分類器,在分類器中計算特征增益以區分不同特征的重要度,從而構建遙感圖像多方向多尺度稀疏表示(multiple levels sparse representation,MLSR)特征增益SVM分類器,并在標準數據集上測試方法的優越性。
Gabor濾波的多角度選擇性較好地模擬了人類視覺感受,能在頻域和空域獲得最佳分辨率,對提取信息量高的特征非常有效[15]。因此,可通過二維Gabor濾波器組與遙感圖像卷積運算獲得頻域范圍內各角度和各尺度的局部特征和鑒別特征。
二維Gabor濾波器組由高斯包絡調制的正弦波定義,其高斯核表達式為


二維Gabor濾波器組與遙感圖像卷積運算按照式(5)從時域或空域轉換到頻域:

濾波器包含實部濾波和虛部濾波2個部分,選擇實部操作,計算公式見式(6):

圖1是二維Gabor濾波器組在5個尺度8個方向的實部圖像。

圖1 二維Gabor濾波器組在5個尺度8個方向的實部圖像
二維Gabor濾波器組對遙感圖像在各角度和各尺度的局部特征和鑒別特征的提取效果取決于其參數選擇。組合參數最佳取值可以采用粒子群算法對中心最大頻率kmax和帶寬σ進行尋優。針對標準粒子群算法容易早熟且慣性權重線性遞減導致進化后期算法收斂速度下降的問題,將慣性權重ω和加速因子c1和c2設置為最優點適應度的函數,如式(7)和式(8)所示:

式中:f(gk)是算法第k次迭代全局最優點適應度,α=1/f(g1),n∈(1,2),通常n取值為1.5。按照式(9)和(10)更新粒子的速度和位置。

式中:k=1,2,…,m是迭代次數,根據迭代次數線性遞減慣性權重ω,加速因子c1和c2取值為2,r1和r2取值為均勻分布在閉區間[0,1]的隨機數;pi和pg分別表示當前粒子歷史最優點和全局最優點,搜索空間范圍為kmax∈[0,2π]/2,帶寬σ∈[0,2π]。適應度函數采用式(11)的加權歐氏距離計算,其中L為類別數,fi為待分類遙感圖像經過第i個Gabor濾波器高斯核后的平均值,為第l類遙感圖像經過第i個Gabor濾波器高斯核后的平均值和方差。

參數尋優算法如下:
步驟1初始化種群規模M,終止條件為迭代100次,隨機生成每個粒子的位置xi和速度vi,i=1,2,…,M。
步驟2按照式(11)計算粒子的適應度f(xi)。
步驟3按照如下規則更新粒子的極值和全局極值:


步驟4若滿足終止條件,則pg對應位置坐標即為最優組合參數取值,否則步驟5。
步驟5按式(7)和式(8)更新慣性權重和加速因子。
步驟6按照式(9)和(10)更新粒子的位置,返回步驟2。
采用改進的粒子群算法獲得二維Gabor濾波器組的最優參數組合后,連接Gabor濾波器5個尺度和8個方向的實部共計5×8個輸出,形成遙感圖像的Gabor特征向量集F={f1,…,fV}。
稀疏表示可用于遙感圖像的特征聚類和生成可視化字典,在稀疏表示過程中,利用稀疏表示模型從遙感圖像中提取空間特征[16],從而提高視覺詞典的語義準確性,生成更健壯有效的遙感圖像表示。給定Y=[y1,y2,…,yN]∈Rd×N為N個d維遙感圖像Gabor特征向量的集合,其中yi為一個d維的Gabor特征描述子。B=[b1,b2,…,bM]∈Rd×M是一個具有M個聚類中心的字典,對每一個列向量yi稀疏表示的系數向量記為xi∈RM,X=[x1,x2,…,xN]∈RM×N是字典B上的系數矩陣,其中M<<N。
遙感圖像稀疏表示就是求解字典B的過程,使得Y=BX,其中系數矩陣X中非零元素的數量遠小于數據樣本yi的數量,則求解系數矩陣X就是解決如下優化問題:

式中:‖·‖是l0范數,亦即X中非零元素的個數,盡管l0范數的求解是NP問題,但當系數足夠稀疏時,可用l1范數代替l0范數從而獲得稀疏表示系數矩陣。因此,可將上式轉換為如下優化問題

式中,最小化代價函數由X中每一列的數據擬合和正則化項組成,參數λ是一個平衡數據保真度和解稀疏性的懲罰參數[17]。
不同類別的遙感圖像地物特征位于不同的子空間,能夠被該類訓練樣本組成的字典線性表示,而很難被其他類別的訓練樣本線性表示。
首先對遙感圖像I提取多層次的Gabor特征,構建特征集F={f1,…,fV},根據式(13)和(14)采用開源工具SPAMS獲得稀疏系數矩陣X和構造字典B,最后將稀疏系數矩陣作為SVM分類器的輸入。SVM分類器用歐氏距離度量樣本之間的相似度,每一維的特征對分類器的貢獻存在差異,而傳統SVM分類模型中假設所有特征對分類器的貢獻相等,忽視了特征的重要度差異。信息論中“熵”表明任意樣本集對分類器的貢獻都具有一定不確定性,因此,圖像特征對分類器的貢獻可以用特征的信息增益表示。同上可以計算所有稀疏系數向量的特征增益λM,得到遙感圖像特征增益對角矩陣Q=diag(λM)。

考慮稀疏系數向量的特征增益以后,SVM的核函數形式變為

SVM核函數選擇高斯核函數,則稀疏系數向量特征增益的高斯核函數為

圖2為基于多層次特征稀疏表示的遙感圖像分類流程框圖。

圖2 特征增益SVM分類流程框圖
特征增益稀疏系數矩陣作為SVM分類器的輸入,采用開源工具箱LIBSVM判決得到測試像素的類別標簽。
采用Pavia University數據集進行測試,該數據集是由德國的機載反射光學光譜成像儀(reflective optics spectrographic imaging system,ROSIS-03)在2003年對意大利的帕維亞城所成的像[18],空間分辨率為1.3 m,尺寸為610像素×340像素,因此共計2 207 400個像素,其中包含大量的背景像素,包含地物的像素總共只有42 776個,這些像素共包括9個地物類別,表1為各類的名稱和每類的樣本總數,圖3為Pavia University數據集中典型圖像和對應的真實地物類別標識圖像。

表1 Pavia University數據集屬性表

圖3 Pavia University圖像與對應真實地物類別標識圖像
由于Pavia University數據集C1~C9這9類樣本間數量相差較大,若按比例抽取會造成類間不平衡問題,影響分類結果。因此,仿真時從每一類抽取250個樣本作為分類模型的訓練集,且限制抽取的樣本總數不超過Pavia University數據集樣本總數的10%。
經過30次迭代,共耗時262.736秒獲得粒子的最優位置,對應中心最大頻率kmax為2.406 7,帶寬σ為1.148 6,分類器采用LIBSVM工具包[19]中徑向基函數核的SVM,對于懲罰參數和RBF核寬度通過網格搜索的方法分別從{2-5,…,215}和{2-15,…,23}中選取。二維Gabor濾波器組中采用不同高斯核將遙感圖像分解成不同尺度對算法性能的影響體現在中心最大頻率和帶寬的不同取值,表2為不同Gabor組合參數下分類器性能。

表2 不同Gabor參數下分類性能
從表2可知,選擇合適的二維Gabor組合參數中心最大頻率和帶寬對分類器的性能具有較大影響,主要因為不同的中心最大頻率和不同的帶寬對圖像的濾波能力和局部特征提取能力存在差異,低頻有利于提取圖像的整體特征,而窄帶有利于提取圖像的局部特征,從而全局上提升了圖像的描述能力。而不同的中心最大頻率和不同帶寬對模型的訓練時間影響不大,實驗測試分析發現,只需要犧牲很小的時間代價即可換取較大的分類性能的提升。
再將提出的多層次特征稀疏表示聯合特征增益SVM的遙感圖像分類方法(MLSR)與不考慮特征增益的SVM分類器(MLSVM)以及BoVW、PLSA算法進行比較。其中,SVM統一采用徑向基函數核,評價指標選擇總體精度和Kappa系數[20],表3為Pavia University數據集上不同方法的測試結果。

表3 不同方法的識別結果
圖4為MLSR、BoVW和PLSA 3種不同算法在Pavia University數據集上采用SVM分類器模型的分類結果示意圖。圖4(a)為真實的地物類別圖;圖4(b)為BoVW算法基礎上的SVM分類結果;圖4(c)為PLSA算法基礎上的SVM分類結果。

圖4 不同算法分類結果示意圖
由表3和圖4可知:提出的多層次特征稀疏表示聯合特征增益的遙感圖像分類方法(MLSR)相比不考慮特征增益的SVM分類器(MLSVM)、BoVW和PLSA算法具有更高的總體精度和Kappa系數,這是因為不同特征對分類器的貢獻存在差異,通過計算信息熵和條件熵,將特征對分類器的貢獻加以區分,提升了分類器的性能,同時多角度多尺度的多級特征稀疏表示能夠更完備地描述遙感圖像語義特征,其原因在于通過多角度多尺度分解后,低頻有利于提取圖像的整體特征,而窄帶有利于提取圖像的局部特征,從而在全局提升圖像的描述能力,更加充分地利用遙感圖像的空間信息,縮小圖像特征與圖像語義之間的鴻溝。盡管增加了圖像的預處理過程,但是稀疏表示減少了運算量,模型訓練時間并無明顯增加。
為進一步直觀展現不同方法的性能差異,采用PowerBI的Chord視覺對象對分類結果可視化,如圖5所示。9個類別用不同的顏色的色帶表示,色帶之間的連接關系表示對應類別之間的混淆情況,各類之間連線交叉越復雜表明類間分類混淆程度越大,連接線與色帶顏色越接近表示被誤分為此類的樣本越多。從中可見,MLSR的類間混淆最少,總體分類精度最高。

圖5 和弦圖
遙感圖像因其訓練樣本少、特征維數高,其分類是一項比較復雜的任務,二維Gabor濾波器組的關鍵參數中心最大頻率和帶寬對分類器的性能影響較大,低頻窄帶提高了圖像的描述能力和可解釋性,通過區分特征增益進一步提升了分類器的性能,下一步將深入開展遙感圖像地物面積和形狀測量工作。