陳 凱 雷少剛 楊星晨 史運喜 陳樹召
(1.國家能源集團包頭能源李家壕煤礦,內蒙古 鄂爾多斯 017000;2.中國礦業大學礦山生態修復教育部工程研究中心,江蘇 徐州 221116)
礦山開采方式包括露天開采和地下開采。地下開采通過構建井筒和巷道等方式進行地下作業,往往會對其周邊原本穩定的巖土結構造成巨大影響,繼而引發地表形變[1]。研究表明,地表形變會造成井工礦區植被退化[2]。植被退化成為了礦山生態環境質量下降的主要方面。因此,及時地進行植被調查對礦區生態修復工作具有重要意義。
植物物種調查是植被調查工作的基礎。由于其高效、準確的優點,利用遙感的方式進行植物物種識別得到了廣泛的應用。例如,Lucas等[3]利用機載高光譜影像對美國密西西比州Horn島進行了植物種類識別;Hakkenberg等[4]綜合高分影像、機載高光譜影像和激光雷達在森林地區實現了物種分類并完成了植物多樣性制圖。但是,現有研究大多基于高光譜遙感數據,有些甚至需要融合激光雷達數據。而這些數據(高光譜、激光雷達)成本高,數據源少。尤其是在偏遠的礦區,更是難以獲取合適的影像數據,因此難以普及。將RGB相機搭載于無人機(Unmanned Aerial Vehicle,UAV),不僅成本低廉,而且操作簡單,因此便于在礦區推廣應用。但是,目前基于UAV-RGB進行植物分類的研究較少,發展新的植物分類技術具有較好的應用前景。
將機器學習技術應用于遙感圖像分類,是目前研究的熱點。例如,黃雨菲等[5]利用U-net深度學習方法識別不同濱海濕地植物種類的精度可達95.67%,總體精度較其他分類方法提高6.67%~13.67%;杜保佳[6]利用隨機森林、卷積神經網絡和支持向量機3種方法對植物群落分類,同樣取得了較好的效果。但是,將機器學習方法應用于RGB影像的研究尚不多見,尤其是針對礦區植被類型。
另外,對植被生理參數進行分析也是植被調查工作的重要內容。以往研究表明,葉綠素含量是早期識別和評價植被健康狀況的關鍵診斷指標,可較好地反映植被退化程度[7]。因此,基于遙感技術,分析地表沉陷對植物葉綠素含量的時空擾動規律,可及時發現生態質量退化區,有效地指導礦山生態修復工作。
綜合現有研究的不足以及實際需求,本文以內蒙古李家壕礦為例,使用機器學習技術,提出了一種基于RGB相機的礦區典型植物分類方法。隨后,在多期分類結果的基礎上,分析了2種典型植物的葉綠素含量的時空變化規律,以期為礦山生態環境的精準修復提供指導。
以內蒙古鄂爾多斯市的李家壕礦為研究區,該礦的開采方式為井下開采。礦區屬于干旱-半干旱氣候,降水量小但蒸發量大。年均降雨量為348.3 mm,然而年均蒸發量為2 506.3 mm。礦區內原生植被稀疏,以草地為主,其中大部分為針茅。喬灌類植被較少,多為人工種植的檸條、樟子松、楊樹等。研究區生態環境脆弱,原有的生態系統在礦山開采過程中受到影響和破壞,目前部分區域已開展生態修復工作。
1.2.1 無人機數據
選擇晴朗無云的天氣獲取無人機影像,影像獲取時間、相片數量、航高、空間分辨率和影像重疊度如表1所示。無人機型號是大疆公司生產的PHANTOM4 RTK,包含紅綠藍3個波段。根據地形條件、開采進度和精度要求,設計無人機飛行航線,包括飛行范圍、飛行高度和重疊度。在11∶00到13∶00之間獲取數據,以盡量減少來自大氣的干擾和太陽高度角的變化。利用Pix4Dmapper軟件對影像進行預處理,生成正射影像圖。為了提高影像空間位置的精度,我們在研究區均勻布設了20個像控點,以完成影像的精配準工作。

表1 無人機影像參數Table 1 UAV image parameters
1.2.2 植被數據
為了對植物分類結果進行驗證,我們分別對各類地物類型選取一定數量的樣本,樣本選取過程中盡可能地避免混入其他地物像元,以保證統計結果的準確性。共選取楊樹樣本39個,樟子松樣本38個,檸條樣本40個,針茅樣本40個,裸地樣本36個。我們對選擇的樣本進行定位,定位設備為華測公司生產的X5工程型RTK產品。
研究區的主要植物種類有針茅、檸條、楊樹、樟子松等。因此將地物類型分為6類,包括檸條、針茅、楊樹、樟子松、裸地以及其他。
由于無人機數據僅包含紅、綠、藍3個波段的反射率信息,僅憑光譜信息難以實現植被種類的區分。因此,為了充分挖掘RGB影像中的潛在信息,本文提出將影像的紋理特征以及密集匹配點云計算的幾何特征引入到分類工作中。綜合光譜信息、紋理信息和幾何特征,借助機器學習算法,實現植物種類的識別。
無人機RGB影像具有高空間分辨率,其紋理信息比較豐富,因此可以借助不同地物間的紋理差異來提高分類的精度。圖像的紋理特征提取方法已經十分成熟,各種理論方法層出不窮[8]。本文選取了著名的灰度共生矩陣[9]。其定義為灰度圖像中特定方向θ上間距為d的2個灰度值同時出現的聯合概率分布。實驗中采用ENVI5.3軟件對RGB影像進行處理,分別獲得紅、綠、藍3個波段的4個紋理特征,包括方差、相異性、信息熵和二階矩。其中,濾波窗口大小設為5×5,空間相關性矩陣X和Y的變化值設為1,灰度化級別按照默認設置。
點云的3D特征體現點云的分布結構,同時也反映了植被的三維結構特征。本文采用軟件Cloud-Compare2.12.4提取了包括高斯曲率以及特征值相關特征在內的共計5個點云幾何特征。特征值相關特征是基于鄰域內所有點的協方差矩陣所求的3個特征值計算所得,3個特征值分別記作L1、L2、L3,并且L1>L2>L3。具體包括各向同性、曲面變化率、球體指數和垂直度等4個特征。
選取變異系數[10]來反映各樣本的上述20種特征的離散程度。地物樣本的某一特征的變異系數越小,則表示此特征對于該類地物的代表性越強。但能否有效地將該類地物與其他地物類型區分開來,僅統計各特征的變異系數并不夠。針對某一特征,還要統計各地物類型之間的差異性。因此選取差異系數[11]來反映各地物類型在某一特征的差異程度,差異系數越大,表示該特征用于區分地物的效果越好。變異系數和差異系數的計算:
式中,V為變異系數;S為標準差;M為均值;DW為類間差異系數;M1為第一類地物的均值;M2為第二類地物的均值。
本文選取了神經網絡、支持向量機以及隨機森林3種機器學習方法。神經網絡是用計算機模擬人腦的結構,用大量的處理單元模擬人腦神經元[12]。神經網絡通常由輸入層、隱藏層和輸出層構成,通過損失函數和梯度下降法不斷調整參數,最終確定分類模型。支持向量機[13]是一種基于統計學習的分類方法,其核心思想是通過非線性映射將原始空間轉換到一個高維特征空間,將原始空間中的非線性可分問題變成高維特征空間中的線性可分問題,從而在高維特征空間中尋找最優的分類面。隨機森林[14]本質上屬于機器學習中的集成學習,它的基本單元是決策樹,每棵決策樹都是一個分類器,其核心思想是將所有樹的分類結果進行投票輸出。
高空間分辨率的無人機影像中包含大量與植被冠層相關的信息,所以可以利用遙感植被指數來表征植被冠層的葉綠素含量。本文影像數據僅包含紅、綠、藍3個波段,故選用與RGB相關的植被指數。前人研究表明,紅波段和藍波段與葉綠素含量密切相關,已有一些植被指數被證明是切實可行的,如BRRI[15]和Ikaw[16]。經過對比,我們最終選擇了BRRI指數:
式中,B為藍光波段的反射率;R為紅光波段的反射率。BRRI的值位于0、1之間,值越大代表冠層葉綠素含量越高。
根據植被類型的地面調查結果,在影像中提取針茅、檸條、樟子松、楊樹、裸地的光譜特征、紋理特征以及幾何特征,計算各特征的變異系數以及不同地類間的差異系數。以檸條為例,表2為檸條20種特征的變異系數以及檸條與其他地類間的差異系數。可以看出,檸條各類特征的變異系數大小不一,其中高斯曲率的變異系數最大,為103.85%,綠波段信息熵的變異系數最小,為2.09%。此外,檸條與樟子松的綠波段二階矩差異系數最大,為1 104.93%,檸條與針茅的綠波段相異性差異系數最小,為0.08%。綜合了所有地類各特征的變異系數以及每一地類與其他地類各特征的類間差異系數后,最終選定紅、綠、藍3波段的二階矩以及點云幾何特征中的高斯曲率、各向同性、曲面變化率和球體指數7個特征。加上紅綠藍3個光譜波段,共計10個特征。

表2 檸條各特征的變異系數以及檸條與其他地類各特征的類間差異系數Table 2 The coefficient of variation of various characteristics of Caragana korshinskii and the coefficient of inter class differences between Caragana korshinskii and other land types %
選取最佳的特征后,我們采用3種機器學習的方法(神經網絡、支持向量機、隨機森林)對植物類型進行分類。本研究綜合了RGB相機的光譜信息、紋理信息和點云的3D特征(即植被的結構信息)。首先僅采用光譜特征進行分類,然后采用光譜+紋理特征的方式,最后采用光譜+紋理+3D幾何特征的方式,分類結果如圖1所示(以7月13日的影像為例)。隨后我們使用總體分類精度和Kappa系數對分類結果進行評價(表3)。總體而言,支持向量機是3種分類方法中效果最好的。同時,結果也表明,采用多特征融合的方法確實能夠獲得更好的分類結果。以支持向量機為例,僅使用光譜特征,其總體分類精度為80.57%,當在光譜特征中加入紋理特征和3D幾何特征后,總體分類精度提高了9.45%,達到90.02%。由于無人機數據易于獲得,未來可以利用多期遙感影像提取植物的物候信息。將物候信息融合到現有方法中,或許可以進一步提高物種分類精度。另外,可以嘗試更多的機器學習算法,將遙感分類與人工智能更好地結合。

圖1 分類結果Fig.1 Classification results

表3 精度評價Table 3 Accuracy evaluation
采用多特征融合的手段,使用支持向量機對獲取的全部9期無人機影像進行分類,并計算BRRI指數。在研究區選取一條垂直于開采方向的樣線(圖2),結合分類結果,提取了樣線上針茅和檸條2種植物的BRRI指數。根據開采沉陷情況,分別統計了中性區、壓縮區、拉伸區和自然區域的BRRI指數,并計算退化系數,以反映植被的退化程度:

圖2 樣線以及中性區、壓縮區、拉伸區Fig.2 Transect and neutral zone,compression zone and stretching zone
退化系數的值越低,代表植物受到的脅迫越嚴重。BRRI和退化系數的時空變化如圖3所示。在調查初期,退化系數的值在1附近,說明自然區和沉陷區的植被葉綠素含量基本一致,此時植物尚未受到擾動。根據井下開采數據,該工作面在6月15日掘進至樣線所在的位置。但是從圖3可知,在6月15日之前,植物就出現了退化的趨勢,這是開采的超前影響所致。對于同一區域,針茅的退化系數均低于檸條,說明灌木比草本更能抵抗開采帶來的脅迫。對于同一物種,中性區的退化系數最高,其次是壓縮區,拉伸區的退化系數最低。這說明拉伸區的植被退化最嚴重,應該作為生態修復的重點區域。圖中顯示,一段時間后退化系數會逐漸上升。這說明植被正在逐漸恢復,但是其退化系數仍然小于1,即開采區植物的葉綠素含量仍然低于自然區。

圖3 BRRI指數和退化系數的時空變化Fig.3 Temporal and spatial variations of BRRI index and degradation coefficient
通過分析礦區典型植物的葉綠素含量的時空變化,發現位于拉伸區的植物受到的脅迫最嚴重。這可能是由于地表形變的原因,拉伸區更容易產生地裂縫,而地裂縫會造成土壤含水量的缺失[17]。該研究區屬于干旱半干旱地區,水分是影響植物生長的限制性因素,缺水更容易導致植被的退化,直觀的表現則為葉綠素含量的下降。因此,地裂縫應作為礦區生態治理的重點對象,而拉伸區則為生態修復的重點區域。研究發現,相比于檸條,在同樣的環境下針茅受到的脅迫更大。這可能是因為檸條的根系更為發達,即使生長于裂縫區,也不易斷裂(圖4(a))。而針茅在地表形變劇烈的地區更容易發生根系斷裂,進而死亡(圖4(b))。本文結果表明,在工作面未開采到植被樣線所在的位置時,植被葉綠素含量已經出現了下降。這說明開采引起的超前影響就足以導致植被的退化。采后40 d時,掘進面已經超過植被樣線約320 m(開采速度約為8 m/d)。此時植被葉綠素含量雖然有所升高,但是依然低于自然區域的水平。這說明不論是在時間維還是空間維,礦山開采對植被的影響都是存在的,需要采取相應的保護與修復措施。從7月10日開始,該工作面采取了一系列生態修復措施,如治理裂縫,給植被澆水等。可以看到,7月13日的退化系數得到了明顯的回升,說明這些生態修復措施起到了較好的效果,應繼續堅持。

圖4 地裂縫對植被根系的損傷Fig.4 Damage of vegetation roots caused by ground fissures
考慮到經濟成本以及數據源的可獲取性,將RGB相機搭載于無人機上,是一種在礦區進行植被遙感調查的有效手段。由于其操作簡單且成本低廉,因此易于在礦區得到大范圍推廣。基于無人機獲取的RGB影像,本文提出了一種針對礦區典型植物的遙感分類方法。該方法融合了影像的光譜信息、紋理信息和點云的3D特征,使用3種機器學習分類算法,實現了礦區典型植物的分類。研究發現,多特征融合可以顯著提高分類的精度,最佳的機器學習算法為支持向量機,其總體分類精度可達90%,基本可以滿足礦區植物調查的需求。通過對植物葉綠素含量的時空變化進行分析,發現沉陷拉伸區的植被更容易出現退化,其次是壓縮區和中性區。相比于針茅,檸條更能抵抗地下開采帶來的擾動,適合作為礦區生態修復的先鋒物種。