張偉濤,王 敏,郭 交
(1.西安電子科技大學電子工程學院,陜西西安 710071;2.西北農林科技大學機械與電子工程學院,陜西楊凌 712100)
農作物分類在農業遙感監測中起著重要的作用,是進一步監測農作物生長及產量的前提。因此,農作物分類對于指導農業生產、合理分配農業資源、保障國家糧食安全具有重要意義。
隨著遙感技術及其理論的不斷進步和發展,已廣泛應用于農作物普查、生長監測、產量預測和災害評估等農業領域。偏振合成孔徑雷達(Polarimatric Synthetic Aperture Radar,PolSAR)作為微波遙感系統中一種主動遙感技術,具有其他遙感技術無法比擬的優勢,其工作條件不受天氣和氣候限制。近年來,農作物分類研究大多采用單時相PolSAR 數據,然而,由于不同農作物間相同的長勢狀況,單一時相的PolSAR 圖像很難識別出不同的農作物類別,尤其是在播種時期。因此,有必要采集多時相PolSAR 數據用于農作物分類,從而提高分類精度。
由于對多時相全極化PolSAR 數據進行極化特征分解后的數據直接分類會出現所謂的“維數災難”問題,因此,對多時相數據極化分解后的特征進行降維成為一項重要的工作。主成分分析法(Principle Component Analysis,PCA)和局部線性嵌入法(Locally Linear Embedded,LLE)是解決“維數災難”問題常用的特征壓縮方法。PCA 是一個線性的數據處理方法,但實際工程中大多數問題都是非線性的;LLE 可以自動從高維數據中提取非線性的低維特征,但對異常值非常敏感。近年來,隨著深度學習的發展,出現了一些成熟的神經網絡結構(如自編碼器、稀疏自編碼器),在特征壓縮和圖像分類方面都具有良好的性能。然而,稀疏自編碼器的稀疏性在提取有效分類特征時并沒有得到充分的利用,并且常見的傳統卷積神經網絡(Convolutional Neural Networks,CNN)和支持向量機(Supper Vector Machine,SVM)分類器在分類時也不能獲取到壓縮特征的多尺度信息。基于上述缺點,農作物分類性能不能達到實際應用水平。
為了利用多時相PolSAR 數據對農作物進行分類并且解決“維數災難”的問題,首先采用了一種非負性約束稀疏自編碼器(Sparse Auto-Encoder with Non-negativity Constraints,NC-SAE)網絡進行特征降維,提取有效的極化特征信息。然后,構建了一個多尺度特征分類網絡(Multi-scale Feature Classification Network,MSFCN)實現農作物的分類識別,大幅提高了農作物的分類精度。
全極化合成孔徑雷達用于接收目標的后向散射信號,以HH、HV、VH 和VV 這4 種組合方式測量幅值和相位,其中H 為水平模式,V 為垂直模式。采集的每個像素的散射信息用一個2×2 的復矩陣表示,這些復數關系到入射電場和散射電場:

式中:為垂直發射和水平接收的極化散射因子,同理可定義式中其他參數。
通過對散射矩陣矢量化可以得到目標特征向量,由于PolSAR 數據是復對稱數據,符合后向散射互易定理,可以將近似等于,因此,偏振散射矩陣可以重寫為Lexicographic 散射向量:



式中:上標*為復數的共軛。
NC-SAE 是在自編碼器的基礎上發展而來,是數據表征的無監督學習算法,其目的是使輸出值盡可能接近輸入值。單層自編碼器網絡的基本結構由3 部分組成:編碼器、激活層、解碼器。自編碼器網絡采用最速下降法進行網絡訓練,最終實現目標函數的最小化,其目標函數為輸入與輸出之間的重構誤差,表示如下:

式中:為訓練樣本數;()為第個樣本的輸入數據;()為第個樣本的重構輸出。
NC-SAE 是在自編碼器的目標函數上增加2 個約束項進行實現。第一個約束項為稀疏約束:

該約束使網絡訓練過程具有較快的收斂速度。稀疏約束項的目的是通過限制隱藏層的激活神經元個數來增加網絡的稀疏性,通常使用KL(Kullback-Leibler)散度函數表示。
可以看出:當(稀疏參數)和ˉ(平均激活值)趨于相等時,趨于0;當兩者相差越大時,較大。第2 個約束項為非負性約束,其有利于避免網絡訓練過程中的過擬合現象,計算式如下:

式中:為權值;為層數。
綜上所述,NC-SAE 的目標函數表示如下:

式中:為非負性約束項的系數;為稀疏約束項的系數。
采用最速下降法更新式(8)目標函數中的權重和偏置,計算式如下:

式中:為迭代次數;為學習率。
采用誤差反向傳播算法計算式(9)中的偏導數。在解碼過程時,目標函數對權值的偏導數為

式中:(·)為(·)的偏導數。
(·)是一個sigmoid 函 數,一般選 取logsig 函數,如下所示:

此時,式(10)可表示為

然后,對編碼過程的偏導數求解如下:

編碼過程和解碼過程目標函數對偏置的導數計算如下:

提出的MSFCN 的網絡結構如圖1 所示,其主要包括3 個部分:多尺度特征提取、特征融合、分類。首先,利用卷積層中多個不同大小的卷積核提取不同尺度的特征信息;然后,將獲取的不同尺度的特征信息使用concat 層進行融合作為分類層的輸入數據;最后,采用softmax 層進行分類。因此,MSFCN不僅利用卷積層中的不同卷積核提取多尺度特征信息,而且可以捕捉到特征圖之間的細微差別。

圖1 多尺度特征分類網絡結構Fig.1 Architecture of MSFCN
使用的實驗數據由歐洲航天局提供,主要用于評估所提方法的分類性能。實驗區域位于加拿大薩斯克切溫省東南部的Indian Head 小鎮,是一個約為14 km×19 km 的矩形區域。該區域共包含14 種不同類型的農作物和一個“非農作物”類別,“非農作物”類別可能是城鎮、道路或天然植被區等非農作物地物。實驗區域各農作物數據的具體信息見表1。

表1 研究區農作物類型及其信息統計Tab.1 Information statistics of crops in the study area
實驗所用的PolSAR 數據是利用歐空局發射的Radarsar-2 衛星采集的真實數據,通過模擬還未發射的Sentinel-1 系統參數而生成的仿真數據。數據采集時間分別是2009 年4 月21 日、5 月15 日、6 月8日、7 月2 日、7 月26 日、8 月19 日和9 月12 日,這7 個時間段的PolSAR 數據幾乎涵蓋了實驗區域所有農作物的從播種到收割的整個生長周期。對單個時相的PolSAR 數據使用極化特征分解方法進行特征分解,可以獲得36 維特征。因此,7 個時相的Pol-SAR 數據一共可以獲得252 維特征信息。
為了對分類結果進行精確的評估與分析,使用整體分類精度(Overall Accuracy,OA)和Kappa 系數進行結果對比。其中,整體分類精度OA 表示正確分類的樣本數與樣本總數之比,具體計算式如下:

式中:為分類正確的樣本數;為所有樣本的總數。
Kappa 系數:常見計算分類精度的算法,來源于一致性檢驗,用于評價分類算法的分類性能,它是衡量預測輸出與地面真實值一致性的標準,有效避免了因某一類目標地物分類精度高而導致整體分類精度高,進而誤以為模型分類效果好的情況。整體分類精度僅涉及正確預測的樣本數,與之不同的是,Kappa 系數考慮了位于混淆矩陣非對角線上的各種缺失和誤分類樣本,其計算式如下:

式中:為整體分類精度;為待分類目標的樣本總數;為待分類目標的類別數;為分類算法的混淆矩陣;Z為混淆矩陣第行所有列的值之和;為混淆矩陣第列所有行的值之和。
本文對提出的特征降維方法、分類網絡與傳統的降維方法和分類方法進行了比較分析。首先利用所提的NC-SAE 以及傳統的LLE、PCA、S-SAE等特征降維方法,對極化分解后的252 維特征進行降維,從而獲得9 維特征;然后將降維后的9 維特征分別輸入SVM、CNN 和MSFCN 分類器進行分類,每個分類器的訓練樣本選擇總樣本的1%。
不同分類器的分類結果和誤差如圖2 所示。對于CNN 和MSFCN 分類網絡,其輸入樣本尺寸也會影響農作物的分類性能,因此,對不同輸入樣本大小下的分類結果也進行了比較,整個實驗結果見表2。
結合圖2 和表2 中的分類結果,得出如下結論:

表2 不同方法的分類精度統計Tab.2 Classification accuracy of different methods

圖2 不同分類器的分類結果和誤差Fig.2 Classification results by different classifiers
1)與傳統的LLE、PCA 降維方法相比,使用NC-SAE 和S-SAE 降維方法獲取的特征信息進行分類的農作物總體分類精度提高了6% 以上,雖然NC-SAE 和S-SAE 的分類精度幾乎相同,但是這2個自編碼器的網絡結構不同。提出的NC-SAE 是一個單層網絡,而S-SAE 是將3個自編碼器依次連接而成的三層網絡,因此,NC-SAE 的計算復雜度更低。
2)比較不同分類器的分類性能,由圖2 可以清楚地看出MSFCN 的分類效果比其他分類網絡更好。同時,由表2 可以得出,MSFCN 網絡的整體分類精度OA 比SVM 和CNN 分別高21%和12%。
3)CNN 和MSFCN 網絡的輸入大小對分類性能也有一定的影響,增大輸入大小可以顯著提高農作物的分類精度。通過實驗證明,建議在實際應用中選擇中等大小尺寸35×35。
4)分析農作物分類的整個實驗過程,通過對比表2 中的結果可以得出,所提出的NC-SAE 與MSFCN 結合的方法可以獲得最好的分類性能。
本文構建了一種新的MSFCN 用于完成對多時相PolSAR 數據的分類。為了解決維數災難問題,提出了一種改進的自編碼器NC-SAE,用于對多時相PolSAR 數據的極化散射特征降維。與此同時,利用歐空局提供的Sentinel-1 系統模擬多時相PolSAR 數據和實驗區域的地面真實值對所提方法進行分類性能評估。與傳統的分類方法SVM 和CNN 相比,最終分類結果表明:對于多時相PolSAR 數據的農作物分類,所提方法MSFCN 網絡的分類性能最優。
此外,對于提出的多時相PolSAR 數據農作物分類方法,還可以進行進一步的研究。首先,對于NC-SAE 的超參數,直接使用S-SAE 方法的經驗值,但不一定是NC-SAE 方法在特征降維時的最優值,因此,NC-SAE 最優值的選取值得后續繼續研究;其次,使用了2 個階段(特征壓縮和作物分類)實現對多時相農作物數據的分類,對此也可以進行優化,研究出更簡便的方法,即使用一個獨立網絡實現多時相PolSAR 數據的農作物分類,將進一步簡化分類過程,減少計算量。