王 斌,范冬林
(1. 桂林理工大學測繪地理信息學院,廣西 桂林 541004; 2. 廣西空間信息與測繪重點實驗室,廣西 桂林 541004)
遙感影像分類與識別工作對于研究物體或現象的發展過程和分布規律有著重要意義,經典算法有監督分類和非監督分類。監督分類又稱訓練場地法,指根據已知樣本區類別信息對非樣本區進行判別的方法。常見方法有:最小距離分類法、最大似然分類法等。非監督分類也稱聚類分析,是指無先驗知識的“盲判”。常見方法包括:分級集群法、K-均值算法、ISODATA聚類法。隨著遙感影像分辨率的不斷提高,以及“同物異譜”和“同譜異物”現象的出現,經典算法不再滿足高精度要求,于是,出現大量機器學習算法。早期出現的人工神經網絡(artificial neural network,ANN)是一種數學模型的機器學習分類方法,其中反向傳播神經網絡(back propagation,BP)在有足夠的隱層和隱層節點時,可以映射出任意的非線性關系。另外,支持向量機(support vector machine,SVM)最早從最優分類面問題提出,是一種有監督的機器學習方法,常用于遙感影像研究。機器學習算法也存在一些問題,如BP神經網絡存在收斂速度慢和隱層及隱層節點難以確定問題,SVM在樣本數量較大時存在漏分和錯分的概率變大[1-2]。近年來,深度學習發展迅速,在機器算法中脫穎而出,本文綜合分析深度學習算法在遙感影像分類與識別中的應用現狀,探討其在分類與識別算法中的發展趨勢。
深度學習的概念由文獻[3]于2006年首次提出。在遙感領域,深度學習在分類與識別方面的應用使得分類效果得到了進一步優化,前人利用遙感高分辨率和高光譜影像作出的研究,證明了深度學習能夠充分提取遙感影像特征。目前,深度學習主流算法模型有4種:受限波爾茲曼機(restricted boltzmann machine,RBM)、深度信念網絡(deep belief networks,DBN)、卷積神經網絡(convolutional neural networks,CNN)以及自動編碼器(auto encoder,AE)等。其中AE和DBN算法屬于無監督學習,而CNN算法則是一種深度的監督學習。現階段深度學習在遙感影像分類與識別中應用廣泛的主要為DBN、CNN及AE這3種算法,RBM為組成DBN的淺層結構,因此研究者對于RBM算法主要是加入到DBN算法中應用。
2.1.1 DBN算法簡介
DBN由多個RBM組成,是具有若干潛變量層的深層無監督學習網絡模型。其中RBM是包含一層可觀察變量和單層潛變量的無向概率圖模型,它們可以層與層堆疊起來形成更深的模型(RBM結構如圖1所示),可見層和隱層中的任何單元之間不允許存在連接。DBN模型對RBM進行單獨的訓練是采用了逐層初始化和整體反饋的方法,以此來完成整個網絡的訓練過程。DBN的訓練過程見表1,通常由預訓練和微調兩大部分組成。

表1 DBN訓練過程

續表1
2.1.2 DBN在遙感影像分類與識別中具體應用的研究進展
文獻[4]2014年首次將DBN模型用于SAR影像中的城市地圖制作,并利用RADARSAT-2衛星6d的極化合成SAR影像進行了驗證試驗。基于極化SAR地物分類方法基礎,文獻[5]2015年提出了一種基于稀疏極化DBN的模型,該模型充分利用了極化SAR影像極化信息進行特征提取,旨在解決極化SAR影像數據復雜且量大導致的分類困難問題,試驗證明精度效果和訓練速率比SVM和NN算法有所提高。同階段,不少研究者研究了單源光譜信息的分類局限性。文獻[6]2015年將DBN應用在高光譜數據分類中,分別從光譜、空間及光譜-空間3個信息角度使用DBN和LR分類器結合方式進行數據分類。利用影像紋理特征信息,文獻[7]將DBN用于準確地挖掘高分辨率遙感影像的空間分布規律。針對高光譜影像圖譜合一、高維度和存在非線性成分數據,文獻[8]2017年提出一種基于空-譜特征的DBN模型,利用PCA降維重組后的空-譜特征作為DBN的輸入,解決了單源光譜信息在高光譜影像分類的局限性。另外,一些研究者在DBN模型結構參數上進行了大量研究。文獻[9]2016年提出了一種快速去噪和DBN結合的高光譜影像分類方法,結合DBN對去噪后的圖像進行地物分類,當DBN的參數設置為:權重學習率為0.1,可見層和隱藏層偏置學習率均為0.1,權重為0.000 2,初始動量為0.5,最終動量為0.9,以及當迭代次數高于80次時,分類效果很好。利用高分辨率遙感影像具有高維、多尺度、異構等內外部特征和豐富的空間信息,文獻[10]2017年通過對比分類精度、Kappa系數以及參數敏感度,分析出當設置迭代次數為15,每個batch大小為100,網絡深度為3層,每個隱含層的節點個數為64,學習速率為0.01時,分類精度達到92%左右。前人大量試驗結果顯示,一般將學習率設為0.01或0.1,隱含層設為3層,隱含層節點在50-500不等時,精度基本都達到90%以上。
2.2.1 CNN算法簡介
CNN是一種前向反饋神經網絡,它的低隱含層由卷積層、池化層(降采樣層)交替組成,高層通常由全連接層作為分類器使用(典型CNN模型結構如圖2所示)。
ANN分類方法模擬人腦神經系統結構和功能,不需要有關統計分布的先驗知識和預定義各數據源的先驗權值。CNN將ANN和深度學習相結合,基于改進梯度反向傳播算法來訓練網絡中的權重,實現了深度學習的多層過濾器網絡結構以及過濾器和分類器結合的全局訓練算法,降低了網絡模型的復雜度,減少了權值的數量,在影像處理領域的試驗,效果良好。
2.2.2 CNN在遙感影像分類與識別中具體應用的研究進展
CNN在處理高維影像數據時有獨特的優勢。根據高光譜影像中包含豐富的空間和光譜信息,文獻[11]提出了將譜信息變換成圖像的方法。一種是轉換為灰度圖,利用CNN提取紋理特征進行分類;另一種是轉換為波形圖,利用CNN訓練波動特征進行分類。試驗表明,在樣本種類多時比PCA降維的高斯核SVM方法優越,樣本數量少時也有部分優越性。同階段,前人在不同高光譜影像特征作為CNN的輸入信息方面展開了研究。基于光譜域開展的CNN分類算法,文獻[12]通過構建5層網絡結構,繼而逐個分析像素的光譜信息,在輸入端輸入全光譜段集合,通過神經網絡對代價函數值進行計算,實現光譜特征的提取與分類,試驗正確率達90.16%。在空間鄰域信息作為輸入端的研究上,文獻[13]將每個像素點空間鄰域信息作為CNN框架的輸入,同時為緩解梯度彌散,提高網絡執行效率和分類精度,對激活函數ReLU進行了設計,研究表明mini-batch隨機梯度下降法可以提高CNN框架執行效率,試驗精度達到97.57%。CNN也在目標檢測物的檢測、建筑物的提取中被廣泛應用。文獻[14]利用DCNN構建水體識別模型,先利用最大穩定極值區域(MSER)算法對無人機高分辨率遙感影像進行分割,通過輸入待識別目標子區,導入DCNN水體識別模型識別水體,試驗證明,識別精度高達95.36%。鑒于不同激活函數下的目標檢測研究差異較大,文獻[15]利用CNN算法在不同激活函數應用下對SAR影像目標進行識別試驗,試驗精度均達95%以上,同時得出ReLu函數為最適合的激活函數的結論。在建筑物的提取識別與分類中,文獻[16]通過在CaffeNet學習框架下的農村建筑物和非建筑物的影像進行CNN訓練和測試,建筑物識別率達到95.00%。當然,CNN模型在研究中也存在一些缺陷,文獻[17]利用CNN在水田中提取地物特征進行分析,根據不同的卷積核能提取不同的特征,又對富錦市遙感影像進行了分類試驗及精度評價,但由于CNN的網絡性質和參數的選擇,使線條特征提取模糊,分類邊界粗糙,影響分類效果。從上述具體應用分析,對于不同的激活函數和不同的卷積核都會使試驗精度不同,網絡性質和參數的選擇也會有一定影響。
2.3.1 SAE算法簡介
AE由編碼器和解碼器共同組成(SAE結構模型如圖3所示),經過訓練后,能夠將輸入復制到輸出,即編碼器輸入數據映射到特征空間,然后通過解碼器返回特征映射回到數據空間。SAE的學習過程取決于網絡最頂層有無標簽信息而分為無監督學習和有監督學習過程。
2.3.2 SAE在遙感影像分類與識別中具體應用的研究進展
SAE既可作為特征提取方法,也可自身作為分類模型。早期,文獻[18]提出了AE-SVM和SAE-LR分類器兩種分類方案。SAE能提取更好的特征為SVM分類識別做準備,另外利用PCA提取空間信息,融合空-譜特征,利用SAE-LR分類器進行空-譜分類要優于SVM。利用空間特征在遙感影像中含有豐富的信息,文獻[19]通過構建SAE來進行高光譜遙感影像的分類,并結合Softmax分類器和利用AVIRIS和ROSIS數據集進行驗證,與稀疏多項式邏輯回歸相比,加入空間特征的SAE的方法更好。另外,在SAE算法提取光譜特征中加入能量函數會使試驗效果更加明顯,文獻[20]采用SAE逐層提取光譜特征,并加入正則項的能量函數,使之最小化優化網絡,實現深度空譜特征提取,并在此基礎上進行多個試驗,試驗精度結果均明顯。另外,為解決高光譜遙感影像數據類型復雜和分類效率低等問題,文獻[21]提出基于深度極限學習機的高光譜遙感影像分類方法,首先將原訓練集特征分割,利用SAE變換子特征,然后將SAE變換后的數據輸入D-ELM,通過試驗確定D-ELM的隱含層數,進而確定最終模型,其分類精度較高。為解決高分辨率極化SAR影像標注樣本費時費力和淺層算法有限的表達能力,文獻[22]研究了一種主動深度學習的極化SAR圖像分類方法,主要通過SAE對無標記樣本實現無監督學習,同時,利用少量無標記樣本訓練分類器與SAE連接,有監督地微調整個網絡,再利用分類器對有價值樣本進行人工標記,重新訓練。
深度學習在遙感影像處理方面發展很快,但也存在不少問題,總結闡述如下:
(1) DBN在發揮無監督學習的特點時,能更好地提取影像特征,而且在遙感影像數據復雜、有限的基礎上,逐漸摸索出的DBN模型結構參數對后人研究大有裨益,但是其網絡參數選擇需要人工和先驗知識的干預,難以確定合適的試驗參數。
(2) CNN在處理像高光譜數據的高維影像時優勢明顯,但是遙感影像有限的樣本限制了CNN算法的泛化能力,另外,不同的激活函數、卷積核及網絡參數的選擇都會對試驗精度和效果有所影響,合適的選擇會大大加強CNN執行效率。
(3) SAE在現實應用中發揮了無監督分類的特點,同時,在降維跟特征提取方面,比PCA方法產生更少的重構誤差,但是仍需與其他分類器聯合才能獲取分類與識別的高精度,而且需要參數的優化和人工標記樣本等,這些都使得SAE并不是完全的無監督學習。
結合上述存在的問題,對未來深度學習在遙感影像分類與識別中應用的預測分析如下:
(1) 進一步完善和調優深度學習網絡參數和函數。不同的網絡參數和函數選擇會對研究項目的精度效果產生不同的影響,合理的選擇會對試驗起到很大幫助。
(2) 向更深的模型層次和復雜的模型結構展開研究。深層次模型會帶來更加精確的結果,復雜的結構會降低過擬合程度,從而提高模型學習能力,也對大規模訓練數據有利。
(3) 深入探討樣本擴容問題。現有的遙感影像數據不滿足深度學習訓練需求,研究者需結合圖像數據進行平移、旋轉、縮放等方式產生更多有效數據,以提高模型精度。
(4) 搭建多算法結合的深度學習模型結構。目前單一的深度學習模型難以達到遙感影像處理所需的精度,因此研究者多利用改進模型提高精度,如SAE與SVM算法的結合。
本文簡要介紹遙感影像分類與識別算法發展歷程,發現其不斷向更迭的機器學習算法發展,然后闡述了深度學習的幾個典型算法,以及在具體遙感應用層面算法的研究進展,總結了各學習模型的發展和各自的優缺點。通過與目前存在的其他機器學習算法在遙感分類與識別中的研究相比,深度學習算法可以確保分類精度并同時降低運算復雜度。最后指出了深度學習應用于遙感圖像存在的一些問題,并根據這些問題及現階段的深度學習發展預測了未來深度學習在遙感領域的研究范疇。