董建康,連 懿,2,趙之江,張 虎,馮晨陽
(1.天津師范大學地理與環境科學學院,天津 300387;2.中國科學院國家天文臺,北京 100012)
林地具有緩解全球氣候變化、改善生態環境和維護生態平衡等生態系統服務功能.提取林地信息可以監測林地變化、預測林地密度,有助于管理和維護林地生態系統.傳統獲取林地信息的方法效率低、時效性差且成本較高,而遙感信息技術憑借實時、快速等優勢成為獲取林地信息的重要手段[1-2],為林地提取提供了豐富的數據來源,如GF-1、MODIS、Sentinel-2和Landsat系列等中等空間分辨率衛星影像數據以及IKONOS、QuickBird和WorldView系列等高空間分辨率衛星影像數據[3].中等分辨率的影像數據空間分辨率較低,對零散林地的識別效果不佳,且難以及時獲得特定研究區域的高分辨率衛星影像數據.無人機遙感技術因具有低成本、低風險、高時效、高分辨率、不受云層影響和自由規劃航線等特點,很好地解決了這些問題[4],更適合特定區域遙感監測的應用場景[5-6].
近年來,研究人員基于不同種類遙感影像數據,采用多種方法開展林地信息提取方法的研究[7-9].各類遙感數據中,衛星影像和雷達數據已廣泛應用于林地提取.Lu等[10]利用極化與干涉信息融合的SAR數據進行林地提取;Dong等[11]基于中高分辨率的MODIS數據提出了一種林地提取方法.雷達數據雖然能夠獲取林地的三維特征信息,但處理過程較為復雜,所需成本較高;衛星數據雖具有宏觀觀測的優勢,但由于空間分辨率的制約,其對小范圍特定研究區的提取精度有限,無人機遙感的發展有效解決了這些問題.機器學習方法中,隨機森林法和支持向量機法均可以完成林地的識別.黃建文等[1]基于高分六號衛星多光譜數據提出隨機森林的分層分類法用于人工林地提取;曾文等[12]以高景一號遙感影像為數據源,基于支持向量機(support vector machines,SVM)分類器進行林地提取.機器學習算法的優點是算法簡單,運行速度快,但無法處理復雜的分類問題,此外,面對大數據量的問題時會表現出不穩定性,識別結果的精度受到限制;而深度學習算法很好地解決了機器學習算法無法處理復雜分類的問題,成為當前的研究熱點[13].
基于多源遙感數據的林地提取研究有很多,但大多只考慮提取精度,對林地提取效率和成本方面的研究較少.本研究運用數據降維思想[14],在綜合考慮效率和準確度的基礎上,利用高空間分辨率無人機多光譜數據和深度學習方法提取林地,并對以無人機遙感作為數據源和深度學習算法的優點進行分析,提出了一種林地提取方法,并通過選擇特定研究區域來驗證分析.
研究區位置以及樣本分布如圖1所示.由圖1可以看出,研究區為位于天津市西青區天津師范大學內的部分區域(117°7′15″E~117°7′25″E,39°3′25″N~39°3′38″N).天津師范大學地處北半球中緯度亞歐大陸東岸,屬溫帶季風氣候,四季分明,冷暖適中,年平均氣溫約14℃,適宜多種植物生長.研究區地形起伏較小,面積約為0.091 km2,區域內植被覆蓋種類繁多,包含喬木、灌木、草地和稀疏草地等,林地類型主要為落葉闊葉林.此外,研究區貼近生活區,方便觀察記錄,有助于研究的順利展開.

圖1 研究區位置示意圖和樣本分布情況Fig.1 Location of the studied area and distribution of samples
1.2.1 數據獲取
本研究使用的六旋翼無人機是一種具備垂直升降和懸停等靈活飛行性能優勢的無人機,它通過上下共軸放置的3組共6個電機提供升力,通過改變旋翼轉速來調整姿態,進一步實現位置控制,具有懸停性能優異、移動靈活、機械結構緊湊和零部件可靠性高等優點[15].無人機平臺搭載的傳感器為Tetracam公司生產的Micro MCA12 Snap多光譜攝相機陣列成像系統,該系統質量輕、體積小且能實現遠程觸發,適用于無人機搭載.傳感器各波段的波長及波寬如表1所示.該相機可以同時獲取自由組合的12個波段的影像數據,且能夠將數據實時記錄在大容量高速SD閃迪卡內,為成功獲取影像提供了保障.

表1 傳感器各波段波長及波寬Tab.1 Wavelength and bandwidth of each band of the sensor
本次實驗拍攝時間為2019年7月30日,此時段內植被長勢茂盛,天氣狀況良好,風力影響較小.本研究利用搭載了傳感器的無人機拍攝,獲得了空間分辨率為0.05 m的無人機多光譜影像,包含490~950 nm的12個波段數據,其中前8個位于可見光波段范圍,后4個位于近紅外波段范圍[16].
1.2.2 數據處理
無人機的數據處理主要包括幾何校正和輻射校正.數據處理工作中,將測得的一部分地面控制點數據作為控制點用于攝影測量處理時的幾何校正,另一部分作為檢查點用于驗證無人機多光譜影像幾何校正的精度,利用檢查點的均方根誤差(root mean square error,RMSE)評價幾何校正的精度.對所有檢查點進行誤差統計發現,檢查點的平面誤差為0.2 m,高程誤差為0.4 m.參照《CH/Z 3003-2010低空數字航空攝影測量內業規范》[17]可知,較平坦地區的成圖比例尺為1∶500的數字正射影像圖平面檢查點誤差應不大于0.5 m且高程檢查點誤差不大于0.4 m,因此本次幾何校正符合要求.
通過在研究區內設置典型的定標點,利用ASD光譜儀進行地面測量實驗,獲得目標地物的純凈反射光譜值.通過線性回歸耦合無人機影像上對應像元點的像元亮度值(digital number,DN),求出任意波段處的增益和偏移量,建立DN值與反射率之間的相互關系,實現無人機多光譜影像的輻射校正[16].具體步驟為:①假設圖像DN值與反射率間存在線性關系,r=gain·DN+bias,其中r為某一波段的地表反射率,gain和bias分別為相應的增益和偏移;②確定地面測量區域與影像像元的空間對應關系;③通過所測數據建立DN值與地物反射率的線性回歸關系;④用擬合優度評價校正結果精度,并對評價結果進行顯著性檢驗[16].DN值與反射率間的關系如圖2所示,圖2中R2為度量擬合優度的系數,最大值為1,其值越接近1說明回歸直線對觀測值的擬合程度越好.

圖2 DN值與地物反射率的關系Fig.2 Relationship between the DN value and the reflectivity of ground objects
表2為顯著性檢驗結果,當計算出的顯著性概率值P<0.05時,說明擬合關系顯著有效.由圖2可知,多光譜數據中多數波段的R2>0.9,只有少數波段的R2<0.9,但也接近,且表2中各波段P值均明顯小于0.05.由此可知,本研究方法進行輻射校正的效果良好.

表2 顯著性檢驗Tab.2 Significance test
為了更好地提取林地信息,本研究對處理后的影像進行主成分分析降維和相關性分析.首先選取貢獻度高的主成分特征波段與相關性分析篩選后的特征波段進行波段融合,再利用U-Net網絡實現區域的林地提取[18-19],最后評價提取結果的精度并針對分類中存在的問題展開討論,對應的技術流程如圖3所示.

圖3 技術流程圖Fig.3 Technical flowchart
在林地識別的過程中,大量多光譜信息無疑會增加訓練網絡的復雜性,利用原變量之間的相互關系以及降維的思想,使用較少的新變量代替原來較多的變量,能夠讓多個有用信息集中到少數幾個相互獨立的波段,對多光譜數據進行波段篩選將極大地提升提取效率.本研究主要采用主成分分析和相關性分析的方法來實現分類特征的重構和篩選.
2.2.1 主成分分析
本研究所用無人機多光譜影像波段數較多,造成影像的數據維度較大,給林地信息提取帶來諸多不便,為此需要運用PCA對數據進行降維處理[20].PCA又稱主分量分析或矩陣數據分析,它通過變量變換的方法把相關變量變為若干不相關的綜合指數變量,實現對數據集的降維,從而簡化問題,是一種基本的數據降維方法,在多光譜數據壓縮、去相關和特征提取中發揮了重要作用[21].
2.2.2 相關性分析
相關性分析指對2個或多個具備相關性的變量元素進行分析,衡量2個變量因素的相關密切程度,確定元素間相關關系的存在、呈現的形態和方向及其密切程度.一般通過統計相關波段間的相關性系數來衡量波段間的冗余程度.相關性系數代表了波段間像元灰度值的重疊度,其值越大說明波段間數據重疊度越高,冗余信息越多[21].為了減少多余信息,要盡可能選擇相關系數小的波段.
U-Net網絡框架是Ronneberger等[22]在2015年提出的,其最初是為了解決生物醫學圖像方面的問題,后來被廣泛應用于語義分割的各個方向.U-Net網絡結構主要包含下采樣、上采樣和跳躍連接3個部分,結構模型如圖4所示.網絡中較淺的高分辨率層可以用來解決像素定位問題,較深層可以用來解決像素分類的問題,從而實現圖像語義級別的分割.U-Net的結構包括1個捕獲上下文信息的收縮路徑和一個允許精確定位的對稱拓展路徑.通過這種方法,使用非常少的數據即可完成端到端的訓練,并獲得很好的效果[23].U-Net網絡模型具有跳躍連接的編碼和解碼結構,能夠融合不同層的特征,對特征較少的圖像分類也具有非常好的效果.

圖4 U-Net網絡模型Fig.4 U-Net network model
本研究對原始影像進行主成分分析,結果如圖5所示.

圖5 主成分分析結果Fig.5 Results of principal component analysis
由圖5可以看出,少數幾個主成分因子能夠提取原始指標變量的大部分信息,且彼此之間互不相關.前3個分量特征具有約99.3%的特征信息,其中第一主成分包含圖像信息的84.8%,其他成分包含的有效信息較少.為了最大限度保留原始空間的主要信息,在不減少有效信息的前提下降低特征空間的維數,提高數據表示效果,本研究選取第一主成分、第二主成分和第三主成分.
無人機多光譜數據的波段較多,而針對特定地物而言,波段間(尤其是非峰值波段之間)存在的冗余信息多,研究顯示相互間關聯性小的波段其相關性越小,波段的標準差越大,因此對各波段進行相關性分析,結果如圖6所示.

圖6 相關性分析結果Fig.6 Correlation analysis results
由圖6可以看出,12個波段的相關性分為2大組:①波段1~8之間相關性系數偏高,相關性系數平均值由小到大依次排序為:5<6<1<3<4<7<2<8;②波段9~12之間相關性系數偏高,相關性系數平均值由小到大依次排序為:12<9<10<11;③2個波段組間的相關性要明顯小于組內各波段間的相關性.比較分析各波段與其他波段相關性大小可知,波段5和波段12是與其他波段相關性均值最小的波段,波段8和波段11則是與波段5和波段12相關性最小的波段.因此,綜合分析后本研究選取了波段5、波段8、波段11和波段12這4個相關性較小的波段與前3個主成分作為林地提取的數據.
將相關性分析結果與PCA結果進行組合,所得影像兼顧了波段的信息量和獨立性,波段組合信息量充足且相關性低,有利于林地信息的提取.
基于野外考察數據和無人機多光譜影像,將研究區分為訓練區和驗證區,將目視解譯結果作為U-Net網絡模型的真實數據,建立訓練集和測試集,其中訓練樣本共包括208個圖斑,共計2 636 953個像元.在此基礎上,利用U-Net網絡模型進行10輪訓練,每輪迭代次數為1 000次,總迭代次數為10 000次,并利用該模型對研究區進行林地提取,結果如圖7所示,圖7中綠色部分為正確提取的林地,藍色部分為漏分的林地,紅色部分為錯分的林地.由圖7可以看出,該模型有效實現了研究區林地信息的識別,對所有紋理復雜的林地信息均基本判斷準確.

圖7 林地提取結果Fig.7 Results of forest land extraction
本研究的總體精度采用正確率、錯分率和漏分率進行表征.錯分誤差(commission error,CE)指被分為林地,而實際上屬于其他類別的像元占林地提取結果的百分比.

式(1)中:Ns為林地提取結果的總像元數;Nt為正確提取的林地像元數.
漏分誤差(omission error,OE)指本屬于林地地類,但沒有被分為林地的像元數占林地提取結果的百分比.

式(2)中:Nr為驗證樣本的像元個數.本研究將人工識別所得樣本作為驗證樣本.
總體精度(overall accuracy,OA)指被正確分類的像元數占總像元數的百分比.

研究區林地識別的正確率、錯分率和漏分率分別為84.79%、15.21%和15.78%,基本滿足林地提取的需要,但也存在錯分和漏分現象.圖7(a)所示的區域A中,對于一些零散單株樹木的提取效果不理想,主要原因是模型訓練過程中零散樹木的樣本較少,訓練樣本不足,其次是單株樹木所占面積較小,包含的林地信息較少,易造成漏分.區域B(圖7(b))中將部分草地錯分為林地是由于該區域林地周圍的草地密集程度較高,且實地調查結果表明,該區域草地的生物多樣性比較豐富,而在圖像中的表征紋理相對復雜,導致該區域草地圖像表現的卷積特征與林地更加類似,容易造成錯分.區域C(圖7(c))中錯分為林地的地物是水體中的蘆葦,相比草地,蘆葦在高度和紋理復雜度上都更接近林地,因此在波段信息中與林地相似度更高,在研究區中是錯分為林地最多的地物,在訓練模型中沒能有效地區分蘆葦和林地,這是造成錯分的主要原因.區域D(圖7(d))中林地邊緣的提取效果較差,在地物邊緣位置存在一些像元尺度錯分和漏分的區域,這可能是由于高分辨率遙感影像上的信息高度細節化以及混合像元與隨機噪聲的影響導致對像元級林地邊緣的提取效果不理想.
本研究基于高空間分辨率無人機多光譜數據,提出一種篩選特征波段結合卷積神經網絡U-Net的方法,對影像進行分割并提取林地信息,并通過深度學習算法構建了基于U-Net的林地分割模型,對模型提取結果進行精度驗證和評價分析,得到以下結論:
(1)林地提取的總體分類精度為84.79%,說明本方法能夠較好地區分林地和其他地物,達到較高的精度水平,表明此方法能夠實現小尺度區域林地資源調查和變化監測,具有可行性、有效性和一定的應用價值.
(2)本方法的優勢主要體現在神經網絡模型的選取和特征波段的篩選上.因神經網絡一般需要依賴大量的樣本訓練才能達到較高的精度,時間成本比較高,而U-Net使用較少的訓練樣本即可達到良好的訓練結果,相比其他網絡模型具有更高的訓練效率.特征波段的選擇通過主成分分析減少了數據維度和數據冗余,通過相關性分析又進一步減少了數據量,且在減少多余數據的基礎上充分利用了影像的光譜特征和紋理特征,避免了僅依靠單一特征提取林地造成的提取結果不準確的問題,對陰影也有較好的區分,提高了訓練的效率和準確度.
(3)本研究僅利用無人機多光譜數據進行林地信息提取,實現小范圍特定研究區的林地資源調查,具有一定的片面性,其他地區的提取精度能否達到較高水平還有待驗證.因此,如何結合多源遙感數據實現數據間的優勢互補,彌補無人機影像數據自身缺陷,實現更大尺度的林地監測,進一步提高林地信息提取精度還有待進一步研究.