滕文秀,王 妮,施慧慧,許振宇
(1. 南京林業大學林學院,江蘇 南京 210037; 2. 滁州學院地理信息與旅游學院,安徽 滁州 239000; 3. 安徽省地理信息智能感知與服務工程實驗室,安徽 滁州 239000)
樹種分類對森林資源管理和森林資源監測具有重要意義[1]。傳統樹種調查方法主要依賴于實地調查或利用大比例尺航片進行人工判讀[2],該方法成本高且效率低下。高分辨率遙感圖像具有豐富的光譜和空間信息,為樹種分類提供了一種高效的方式。現有的樹種分類方法主要采用手工提取特征結合傳統機器學習的方法。文獻[3]綜合利用光譜、紋理、植被指數、時相、地形等特征,在不同層次上采用適用于該層的支持向量機、人工神經網絡(artificial neural network,ANN)、多分類器組合(multiple classifier combination,MCC)等分類方法。文獻[4]利用光譜和紋理特征結合隨機森林(random forest,RF)和支持向量機(support vector machine,SVM)進行樹種分類。文獻[5]探討不同移動窗口大小對紋理特征的影響,選擇合適的窗口大小及紋理因子組合提高了樹種分類精度。上述方法取得了較好的分類結果,但手工提取特征的方式自動化程度低,而且這些特征是針對特定研究區特定任務設計的,如果使用在其他研究區其他任務上錯誤率可能顯著提高,這種特征具有不可遷移性。深度學習[6]是人工智能的重要進展之一,它顛覆了傳統算法的設計思路,能夠自動從數據中學習特征,避免了傳統算法中人工設計、提取特征的復雜性和局限性,在沒有人為干預的情況下,具有極大的特征學習潛力,特別是深度卷積神經網絡(deep convolutional neural network,CNN)[7]已經被廣泛用于遙感圖像的分類、提取、識別和檢索,基本全面超越了傳統方法[8]。為此本文將深度學習技術和高分影像樹種分類相結合,提出一種結合面向對象和深度特征的高分影像樹種分類方法,實現端到端的樹種分類,可以為森林資源管理和監測提供技術支持。
皇甫山國家森林公園位于安徽省滁州市,地處北亞熱帶溫潤性季風氣候區,海拔399.2 m,占地面積35 533 km2,是皖東地區保存最完整、面積最大的原始次生林國家森林公園。保護區森林覆蓋率達到96%,區內建設有皇甫林場,以人工林著稱,主要分布具備根系發達、樹冠濃密、落葉豐富易分解、生長迅速、郁閉緊密等特點的樹種,在江淮流域地區植被類型有一定的代表性。其中,以松(pinus)和麻櫟(quercus acutissima)為主,占總株數的60%左右,其他數量較多的樹種還有刺槐(robinia pseucdoacacia)、楊樹(populus)、柳樹(salicaceae)、楓香樹(liquidambar formosana),以及輔助經濟樹種,如桃樹(persica)等。本文采用2017年2月QuickBird遙感影像數據,像素分辨率為0.61 m,區域無云覆蓋,質量較好,利用二類調查成果與野外調查成果驗證樹種分類精度。
針對現有樹種分類方法采用人工提取特征自動化程度低并具有不可遷移性的問題,提出了一種結合面向對象和深度學習的高分影像樹種分類方法。為了獲取精確的樹種邊界,首先利用多尺度分割技術分割整幅遙感影像,并選擇訓練樣本作為深度卷積神經網絡的輸入。為了避免樣本數量少導致過擬合問題,采用遷移學習方法,使用ImageNet上訓練的VGG16模型參數初始化深度卷積神經網絡,并利用全局平局池化壓縮參數,在網絡最后添加1024個節點的全連接層和7個節點的Softmax分類器層,利用反向傳播和Adam優化算法訓練網絡。最后分類整幅遙感影像,生成樹種專題地圖。本文分類流程如圖1所示。

圖1 結合面向對象和深度遷移學習的高分影像樹種分類流程
現有基于卷積神經網絡的遙感影像制圖方法中,滑動窗口方法沒有考慮像素的空間和光譜相關性,生成塊狀專題地圖,地圖邊界模糊[9],而像素級別的分類效率較低,容易出現“椒鹽現象”,已經被證明不適合高空間分辨率遙感影像制圖[10]。為了獲得更精確的樹種專題地圖,本文引入面向對象技術,首先利用圖像分割技術分割整個遙感影像。圖像分割技術面向對象分類的基礎,它在整個影像信息提取中有著非常重要的作用。多尺度分割技術[11]是指采取不同的分割尺度對不同尺度的圖像對象層次進行分割,進而生成一個由不同尺度數據構成的影像層次網狀結構。它采用一種自下而上的分割算法,合并異質性閾值以內的空間鄰近對象,逐漸合并對象由小及大,循環往復,直至沒有相鄰對象小于異質性閾值,最終結束合并。多尺度分割算法中需要設置的參數包括尺度參數、形狀因子的權重和緊致因子的權重,影像分割后的區域在光譜信息上有一定的相似性,同時也有紋理、大小或上下文之間的一致性。通常假設每個區域中的全部像素都是屬于一個類別的,但在實際應用中很難成立,為了避免一個對象中包含多個樹種對分類產生影響,本文采用過分割的方式分割整幅遙感影像,確保區域內的像素具有相同的樹種類別。本文選取最優分割尺度為35,最優形狀因子為0.6,緊致度為0.4。多尺度分割后選擇部分對象作為卷積神經網絡的訓練樣本。
深度卷積神經網絡參數數量多,利用少量的樣本訓練一個深度卷積神經網絡會導致過擬合問題,為此本文引入遷移學習方法,避免過擬合問題并加速網絡的學習和優化。為了避免樣本數量少導致過擬合問題,采用遷移學習方法,使用ImageNet[12]上訓練的VGG16模型參數初始化深度卷積神經網絡,并利用全局平局池化壓縮參數,在網絡最后添加1024個節點的全連接層和7個節點的Softmax分類器層,最后利用反向傳播和Adam優化算法訓練網絡。本文設計的高分影像樹種分類模型如圖2所示。

圖2 高分影像樹種分類模型
卷積和池化層:將大型卷積及神經網絡模型VGG16去掉全連接層,利用剩余的卷積和池化層提取樹種影像的特征圖。假設輸入樹種影像為I,Fi為卷積神經網絡第i層的特征圖(F0=I),卷積和池化操作可分別表示為
Fi=f(Fi-1?Wi+bi)
(1)
Fi=subsampling(Fi-1)
(2)
式中,Wi為第i層卷積核的權值;?代表卷積核與第i-1層圖像或特征圖進行卷積操作,卷積的輸出與第i層的偏移bi相加,最終通過非線性的激活函數f(x)得到第i層的特征圖Fi;subsampling為下采樣(池化)函數,修正線性單元(Relu)作為激活函數,可表示為

(3)

(4)
全連接層:經過特征提取和全局平局池化后,將全局平局池化后的所有特征值與全連接層每個節點連接,VGG16包含兩個4096個節點的全連接層,由于本文數據量較少,為了避免過擬合問題,本文利用一個1024個節點的全連接層。
Softmax分類器:最后一層使用Softmax分類器,將網絡輸出的特征放到Softmax分類器中進行分類,其類標簽為y∈{1,2,…,K},K為類別標簽數量,本文N=7,分為松樹、麻櫟、楊樹、柳樹、楓香樹、毛竹、杉木7類。
對于模型的訓練,本文利用Adam優化算法和反向傳播更新全連接層可訓練參數。Adam優化算法[14]能夠自適應選擇每個訓練參數的學習率,并且該算法對內存需求較小,具體表示為
(5)
(6)

為驗證本文方法的有效性,采用本文方法對皇甫山森林公園的QuickBird高分影像進行樹種分類,并利用二類調查成果與野外調查成果驗證分類精度。首先利用多尺度分割技術分割整幅遙感影像,最優分割尺度為35,最優形狀因子為0.6,緊致度為0.4,然后選擇訓練樣本,將訓練樣本從影像中裁剪下來后縮放到模型輸入大小,本文采用預訓練模型為VGG16[15],模型輸入大小為224×224像素,對于模型的訓練,速率衰減周期設置為100 epoch,Batch size設置為32,Adam優化算法中初始學習速率設置為0.000 1,epsilon設置為10-8,速率衰減因子為0.9,訓練過程中的精度和損失變化曲線如圖3所示,從圖中可看出,模型在前40個epoch精度迅速上升,損失迅速下降,在經過40個epoch后基本穩定,因此使用預訓練模型初始化網絡參數能夠有效加快網絡的訓練,避免過擬合問題。

圖3 訓練精度及損失變化曲線
模型訓練完成后對整幅遙感影像進行分類,利用二類調查成果與野外調查成果驗證分類精度。為了驗證本文方法的有效性,本文分別用支持向量機、隨機森林及本文方法對樹種進行分類,利用混淆矩陣、總體精度和Kappa系數進行精度評價,結果見表1,制圖結果如圖4所示。本文方法樹種分類總體精度和Kappa系數分別為78.98%和0.685 0,比支持向量機高15.63%和23.85%,比隨機森林高6.82%和13.01%,其中柳樹、麻櫟、杉木、楊樹、毛竹的分類精度都高于傳統淺層機器學習方法支持向量機和隨機森林,松樹和楓香樹的分類精度相比傳統方法精度相對較低,但都很接近。總體來看,由于深層結構模型包含多層非線性變換,具有更強的表達與建模能力,能夠從樹種影像中自動學習有效的特征表示,因此分類精度優于傳統淺層機器學習方法。綜上所述,本文方法能夠有效提高高分影像樹種分類精度,而且自動化程度更高,更具有穩健性,是一種有效的樹種分類方法。

表1 皇甫山高分影像樹種分類精度評價
本文針對傳統手工提取特征方法需要專業領域知識,提取高質量特征困難,提出了一種結合面向對象和深度特征的高分影像樹種分類方法。利用面向對象分割技術獲取樹種的精確邊界,并利用遷移學習方法,將現有的知識遷移到高分影像樹種分類中,避免了樹種訓練樣本較少容易導致過擬合問題,實現了端到端的高分影像樹種分類,避免了手工提取特征的不可遷移性。為驗證本文方法的有效性,以安徽省滁州市的皇甫山國家森林公園為研究區,QuickBird高分影像作為數據源,采用本文方法進行樹種分類。試驗結果表明,本文方法樹種分類總體精度和Kappa系數分別為78.98%和0.685 0,在保證樹種精度的同時實現了端到端的樹種分類,可以為森林資源管理和監測提供技術支持。

圖4 皇甫山樹種專題地圖