崔兆韻,張承明,楊曉霞,鞏雯雯,周 虎
(1.泰安市氣象局,山東 泰安271000;2.山東農業大學信息科學與工程學院,山東 泰安271018;3.山東省數字農業工程技術中心,山東 泰安271018)
近年來,隨著遙感技術的進步以及多種遙感系統的應用,遙感圖像分辨率不斷增加,同時地物的光譜信息也越來越豐富,充分合理地利用這些特征可有效提高分類效果[1]。影像分類的核心是遙感圖像特征學習與特征提取[2]。傳統的基于光譜統計特性的分類方法如最大熵方法、K 最近鄰域等,僅利用圖像的光譜、形狀等低層信息,未能充分利用影像中豐富的細節信息而導致分類準確性較低,對于復雜的高分辨率遙感影像表現出許多不足[3-5]。因此,為進一步提取分類精度,在高分辨率遙感影像的分類過程中融入了大量的空間幾何分布規律等信息,并引入機器學習(Machine Learning,ML)相關算法如支持向量機(Support vector machine,SVM)[6]、隨機森林(Random forest,RF)[7]、神經網絡(Neural networks,NN)[8]等進一步提高分類精度。
當前,深度學習(DeepLearning,DL)[9]作為機器學習范疇內最富有生命力的新領域,由底層(輸入層)輸入數據,由低到高逐層提取特征,從而挖掘數據在時間與空間上的規律,建立起低層次特征到高級語義之間復雜的映射關系,從而提升分類的準確性[10]。當前,使用由深度學習相關算法訓練得到的卷積神經網絡模型在計算機視覺等領域已經得到顯著成果。然而,運用其開展針對高分辨率遙感影像分類中的研究工作還相對較少,相關技術仍不夠成熟。
選用深度學習的典型模型-卷積神經網絡模型(Convolutional Neural Networks,CNN)[11],綜合利用了影像更深層次的特征進行分類,編程實現一種快速高效的分類模型,并應用到高分一號遙感影像的地物分類中。
CNN,將人工神經網絡技術和深度學習方法相結合,使用一種基于梯度的改進反向傳播算法來訓練網絡中的權重,實現了深度學習的多層過濾器網絡結構以及過濾器和分類器結合的全局訓練算法[12]。其降低了網絡模型的復雜度,減少了權值的數量,在視覺圖像處理領域進行的實驗,得到了很好的效果,目前已成為當前語音分析和圖像識別領域的研究熱點[13]。作為一種采用共享權值和局部連接的前饋式多層感知機神經網絡,主要包括兩大部分,分別為預測模型和訓練模型,其對大量的數據采用有監督訓練的方式進行訓練,進而建立起一種輸入到輸出的映射關系[14]。該網絡主要由卷積層(特征提取)、下采樣層(池化操作)、全連接層三種類型的神經網絡層和一個輸出層組成,其中卷積層與下采樣層交替出現,如圖1 所示。每一個神經網絡層都包含多個二維平面,同時每個二維平面都包括任意多個獨立的神經元。每一個二維平面中的單個神經元只同前一層局部感受野范圍內的神經單元相連接,并由卷積運算操作而提取局部特征。
以黑龍江省某試驗區為實驗研究區,黑龍江省占地面積為46 萬多平方千米,處于中緯度歐亞大陸東沿;北面臨近寒冷的西伯利亞,跨中溫帶與寒溫帶,屬于高緯度大陸性季風氣候。總的氣候特征為四季分明,冬季漫長而寒冷,夏季短暫而炎熱,而春、秋季氣溫升降變化快,時間較短。受地理環境、海陸氣團和季風的交替影響,各季氣候差異顯著,變化很大。冬季在極地大陸氣團控制下,氣候寒冷干燥;夏季受副熱帶海洋氣團影響,降水充沛,氣候溫熱;同時其地形、地貌較為復雜。選用采集時間為2016-08-25,位于北緯43.264 3°~53.330 9°、東經121.110 2°~135.053 2°的高分一號全色和多光譜遙感影像進行研究。該影像覆蓋多種地物類型,主要有建筑物、道路、水域、林地、草地等5 種,原始圖像如圖2 所示。

圖1 CNN 示意圖

圖2 原始影像
在進行分類前,需要對原始數據進行輻射定標、大氣校正、幾何校正等預處理操作,其中最主要的操作是幾何校正;然后對預處理后的影像,進行全色和多光譜數據的融合,以提高分類的準確度。借助ENVI 軟件,對全色和多光譜數據的三波段彩色合成,采用多項式插值法進行幾何校正、三次卷積法進行重采樣,然后進行大氣校正、植被增強和圖像融合。融合后的影像如圖3 所示。

圖3 融合后的影像
將融合后的影像,結合使用面向對象的分類技術,選用“對象個數最多法”進行影像分割,得到適合每一種地物的最優分割尺度。在分類樣本的選取過程中,考慮到地物的光譜、紋理等特征,每一類地物類型大約均勻地選取1 000 個有代表性的樣本。并且將每一類樣本輸入圖像的大小統一歸一化為(200×200 像素)×3 通道,并將彩色圖像轉為灰度圖像,使用灰度圖像作為CNN 的輸入。
在實驗過程中,隨機抽取其中的2/3 作為訓練樣本進行特征學習監督訓練;剩余的1/3 作為測試數據。研究設定網絡為1 個輸入層、2 個卷積層和下采樣層,3 個全連接層,學習速率為[0.1,3],慣性系數為[0,0.95],迭代次數為[30,45],實驗輸出每次迭代的誤差和總的判斷誤差,通過多次試驗結果驗證,最終確定網絡的學習速率為1,慣性系數為0.5,迭代次數為40,進行模型的評價與分析。圖4 給出了部分地物的樣本圖像。

圖4 樣本集示意圖
在高分辨率遙感影像的分類過程中,由于數據的多樣性和復雜性,本文采用卷積神經網絡對圖像特征進行學習與提取,在網絡的輸出層結合標簽數據訓練一個多類別的分類器。如圖5 所示,隨著實驗迭代次數的增加,網絡訓練的錯誤率隨著迭代次數逐漸收斂至0.002。
在網絡訓練完成后經過對比分析,得到網絡最優參數。同時根據上述實驗分析所得模型參數,進行遙感影像的識別與分類,并與其他兩種不同分類算法進行對比,不同分類算法的識別分類結果如表1 所示。
考慮到現有分類方法大多采用淺層學習結構,在表達復雜函數問題時會具有一定的局限性,導致分類精度相對較低。針對該問題,重點探討了如何應用在包含大量數據細節信息的高分辨率遙感影像的分類中。本文基于深度學習算法和Matlab 環境下的Deep learning toolbox 工具箱,構建能夠對多種復雜智能問題有效建模的深層次模型——CNN 模型;并且對模型中的參數進行反復試驗對比分析,同時結合面向對象分類技術充分考慮各地物、像元之間的關系,得到適合高分遙感影像分類的最優參數。實驗證明,該模型可有效提高分類精度。

圖5 CNN 訓練錯誤率收斂曲線

表1 不同算法實驗對比