趙軒浩,李欣竺,王云浩
(核工業二四三大隊,內蒙古赤峰)
在遙感技術領域中,高光譜遙感技術是將由地物獨特的物質組成所決定的光譜與反映地物形狀、紋理和布局的空間圖像有機結合,實現了對地物的準確檢測、識別和空間特性分析的方法。因此產生的高光譜影像包含豐富的地面物體形狀、布局和背景的光譜和空間信息。與多光譜圖像和自然圖像相比,由于具有獨特的光譜特性,在HSI 上可以更準確地識別分類。在實際的高光譜影像分類中,高光譜數據人工標注費時費力。因此在有限標記樣本條件下,充分利用高光譜數據中的光譜和空間信息進行高精度分類是主要的研究內容之一[1]。
采用空間特征提取通道來利用目標像素周圍的空間信息。該通道采用二維卷積層來更好地利用空間特征。與上面描述的光譜通道類似,每次卷積操作后應用激活函數。在空間分支中有一個卷積層和一個殘差塊。首先,輸入的三維立方體經過1×1×200 卷積層,從一個具有多個波段的高光譜影像映射到一個只有一個光譜波段的灰度圖像。該操作旨在迫使網絡集中于檢測空間域中的相關性。產生的7×7 塊被傳遞到一個殘差塊,該殘差塊由兩個連續的卷積層組成,具有24 個3×3 卷積核,能夠強調重要的空間信息。
對于影像數據中所涵蓋的光譜與空間特征的提取,將兩者融合,用于將來自兩個獨立通道的信息組合在一起。通過光譜和空間分支分別處理后,光譜分支的輸出與空間分支的輸出相連接。因此,在連接128個7×7 塊(光譜)和24 個7×7 塊(空間)之后,總共獲得了152 個塊,其空間和光譜信息都很豐富。然后,具有7×7 核的平均池化層將二維矩陣映射到152 維向量中。然后,通過全連通層和激活函數得到分類結果[2]。
考慮到高光譜數據的三維結構以及高光譜數據的小樣本問題,為了能夠得到足夠的信息量,這里對輸入的樣本點進行重采樣處理。傳統的基于像素點的分類中輸入樣本是基于一個像素點的一維向量,這里針對分辨率較高的高光譜數據將每個像素點附近k×k 大小的區域采樣為一個樣本,這種像素塊的結構在原本光譜信息的基礎上提供了豐富的空間信息,也在一定程度上緩解了因標注樣本較少而帶來的信息匾乏問題。輸入影像塊示意如圖1 所示。

圖1 輸入影像塊示意
針對高光譜訓練樣本有限的問題,結合輸入樣本數據的影像塊結構應用了高光譜數據增強方法。結合光譜- 空間的融合特征,在空間中對高光譜遙感影像進行輸入增強,進而更好地輸入到空間領域中。
自動編碼器通常由無監督的預訓練和有監督的微調組成,其中無監督的過程與有監督的過程是分開的。本文在階梯網絡的基礎上,引用了經過改進的半監督階梯網絡,可在有監督和無監督的雙重模式下進行樣本訓練,半監督階梯網絡結構如圖2 所示。

圖2 半監督階梯網絡結構
半監督階梯網絡的損失函數由每層構造的誤差損失函數加權,并且自動編碼器僅為解碼部分的輸出層構造損失函數。本文對半監督階梯網絡的實際實現方式如下:
首先,為了防止過擬合,有必要構建一個具有多個隱藏層的神經網絡,因為過擬合的可能性更高;此外,需要在網絡的每一層中應用批量標準化。其次,校正線性單元傳遞函數用于防止梯度消失。相應的公式如下:
高光譜影像包含豐富的空間信息與光譜信息,由于直接使用原始數據會導致“維度災難”,所以使用主成分分析法對原始數據上的光譜維度進行預處理降維操作。采用混合光譜網絡作為特征提取網絡用來同時提取空間和光譜信息,完成對于半監督階梯網絡結構的架構[3]。
通過當前節點與周圍節點的光譜聚合來實現光譜- 空間特征的融合,而圖卷積操作類似于低通濾波器,僅保留影像中的低頻信息。為了保存影像中的高頻細節信息,通過在圖中設置邊特征來保存影像中的邊界信息。邊特征在一定程度上緩解了信息聚合過程中的過度平滑問題。同時,邊特征和節點特征的參數是可學習的,通過自動參數優化可以增強不同目標之間的光譜差異性[4]。
基于以上特點,本文利用了一種簡單的信息傳遞策略來實現節點特征與邊特征的融合。假設節點v 與鄰居節點u?N(v)進行信息聚合,信息構造函數可進行如下定義:
在高光譜遙感影像中,根據所需分類特征,在單一尺度上難以從影像中準確提取出不同尺度的地物。然而,信息聚合一般只考慮一階鄰居節點忽略了高階鄰居節點在高光譜分類中的重要性。為避免上述問題,進行卷積運算,其中,K 可看作卷積核的“感受野半徑”,即以中心點的K 階鄰居節點作為鄰域節點。
如果僅考慮了自身與其一階鄰居節點之間信息的聚集,幾乎完全可以等價。但是僅依靠一階節點的信息,對于光譜與空間信息的融合較為不利。與一階鄰居的聚合相比,二階聚合增加了感受野的范圍,更有利于高光譜影像的分類。
卷積神經網絡能夠提取數據的大量深層特征,這包括數據在通道方向的特征和空間幾何位置上的特征,在針對具體的分類任務時不同的特征所占的重要程度往往并不相同,如果能讓網絡把注意力都集中在這些對分類幫助較大的特征上就能夠很好的改善網絡的性能,因此本文聯合注意力機制完成對于高光遙感影像的精細分類。
卷積注意力機制(CBAM)可以直接集成到許多經典的網絡架構當中。對于輸入特征圖,CBAM 會在通道方向和空間方向上分別計算注意力權重,通過乘積運算得到加權后的特征圖。CBAM機制可以與網絡一起訓練并且不會帶來大量的額外計算量,可以有效改善網絡的性能[5]。
由于輸入樣本數據的特征維度較高,針對這一特點使用三維卷積核來提取特征,并通過添加CBAM在通道和空間方向上引入注意力機制,為了降低網絡模型的復雜度,只在殘差部分的輸入和輸出兩個位置添加了注意力機制。殘差網絡中提出了殘差塊的結構,通過跳躍連接將來自初始層的信息通過相加的方式傳遞到更深層,通過快捷連接將殘差網絡的輸入與輸出相連,在不引入額外的參數的條件下將輸入的特征傳遞到輸出,從而避免了網絡模型的退化問題,也為構建更深層的神經網絡模型帶來了可能。
使用WHU-HI 數據集,隨機選取300 個訓練樣本,對輸入樣本進行空間鄰域采樣,將采樣后的樣本數據送入殘差網絡進行分類。設置本文的基于改進卷積神經網絡的高光譜遙感影像分類算法為實驗組,基于深度學習的高光譜遙感影像分類算法為對照組。高光譜數據采用主成分分析算法將其光譜維度降到15。實驗的輸入空間尺寸大小為25×25。所有實驗均在配置有128 GB 內存的同一平臺上執行,其中批量大小設置為200,每一個批塊有100 個有標記樣本和100個無標記樣本構成。優化器設置為Adam,學習率為0.001,動量為0.9,學習率的更新采用自適應調整策略。兩種高光譜遙感影像分類算法精度對比結果如表1 所示。

表1 高光譜遙感影像分類算法精度對比結果
根據表1 的結果可得,實驗組在不同K 值下對于遙感影像的分類系數均比對照組要高,最后基于不同值下的分類精度為97.62%,高于對照組87.63%的分類精度,從這個結果可以看出本文所設計的分類算法,可在不同K 值下對高光譜遙感影像均有較高的分類精度。
本文對于高光譜遙感影像分類算法的設計,基于改進卷積神經網絡。在對算法的分析過程中,通過對于遙感影像中空間和光譜特征的融合,結合其輸入空間的向量,完成對于高光譜的分析,在卷積神經網絡算法的改進中,對卷積神經中的注意力機制作了詳細說明,以空間和通道的雙重機制作為輔助,對高光譜影像的分類進行闡述。本文雖然以實驗證明了算法中分類的有效性,但是研究中仍存在一定不足,這些問題將在之后的研究中做更為細致的分析。