陳安旭,李月臣
(1. 重慶師范大學地理與旅游學院,重慶 401331;2. 西南大學地理科學學院 遙感大數據應用重慶市工程研究中心,重慶 400715;3. GIS 應用研究重慶市高校重點實驗室,重慶 401331;4. 重慶金佛山喀斯特生態系統教育部野外科學觀測研究站,重慶 400715)
水稻是中國乃至全球最重要的糧食作物之一。2018年,水稻種植面積約占中國糧食種植面積的1/4,稻谷產量約占中國糧食產量的1/3。水稻的有效監測對保障國家糧食安全,水資源有效管理及溫室氣體排放至關重要[1-2]。近年來,遙感技術因其宏觀動態的優點被廣泛運用于水稻產量、面積、物候等信息的提取[3-5]。水稻遙感提取的方法可分為單時相提取與多時相提取。區別在于前者利用水稻特殊時期的地物特征,后者則融合水稻多個時期的地物特征進行提取。鄔明權等[6]融合MODIS 時間分辨率和ETM+空間分辨率的影像提取了南京市江寧區水稻種植面積,提取精度為93%,Kappa系數為0.96。Xiao 等[7]基于多時相MODIS 數據對中國南方的水稻種植區進行提取,達到較好的分類效果,并認為所用的水稻制圖算法同樣適用于水稻占主導地位的其他亞洲國家,但其后續研究[8]發現該算法并不適用于識別小塊稻田。雖然多時相提取憑借更豐富的光譜信息能比較全面的反映水稻的地物特征,但所用數據源以中低空間分辨率的影像為主,適用于種植面積較大,云霧天氣較少的地區[9-10]。山區水稻種植區受地形、氣候等條件的限制,云霧天氣較多,稻田呈現規模小、破碎分散的特點,中低空間分辨率的影像顯然不適用,尋找質量較好的數據源是開展研究前需要解決的問題。單時相提取涉及到水稻特殊時期的界定,Zhang 等[11]認為移栽蓄水期的水稻生長在被淹沒的土壤中,稻田是開放水域和綠色水稻植物的混合物,具備更易識別的地物特征。但此觀點忽視了其他生長階段,缺乏對各生長階段分類精度的比較,水稻的其他生長階段是否更易區別于其他地類值得進一步探討。此外,選擇分類特征時,多數研究側重選取歸一化植被指數(Normalized Difference Vegetation Index,NDVI)、地表水指數(Land Surface Water Index,LSWI)等傳統的植被指數與水體指數作為分類特征,忽視了水稻在不同生長階段下不同的形態特點,在選擇分類特征的豐富度與適應性上也有待完善。
基于上述問題,本研究將結合多種分類特征對不同生長階段的水稻進行提取,定量的評價各生長階段水稻的分類精度,并基于空間分辨率為10 m 的Sentinel-2 影像探究適用于山區水稻種植區的提取方法。
巴南區位于重慶市主城區南部(29°7"44"N ~29°45"43"N,106°26"2"E~106°59"53"E),地形以山地丘陵為主,平均海拔434.23 m,氣候為亞熱帶季風氣候,年日均氣溫約為18 ℃,年均總降水量約為1 200 mm。區內土地覆被以耕地與林地為主,建筑、工業、道路等用地集中分布在西部地區,水域以長江干流和大型湖泊水庫為主。巴南區水稻種植歷史悠久,樵坪山、石灘鎮種植的大米品質較好,是重慶市主城區重要的糧食產地,2017 年糧食產量達到30.26 萬t。由于受到地形影響,巴南區大部分水稻物候期相對較晚,經過實地走訪調查,通常5—6 月犁田插秧,7—8 月水稻生長,8 月末—9 月中旬成熟收割。

圖1 研究區區位圖 Fig.1 Location of study area
本研究所用的數據包括Sentinel-2 影像數據,ASTER GDEMV2 高程數據,研究區邊界矢量數據,實地考察數據。Sentinel-2 影像的波段信息如表1 所示。Sentinel-2提供 Level-1C 和 Level-2A 兩種處理級別的數據,Level-1C 經過輻射定標、幾何校正(包括空間配準和正射校正),Level-2A 是在Level-1C 的基礎上經過大氣校正的產品。
依據水稻的生長特點,選取水多苗小的5—6 月作為發育期,水苗各半的7—8 月作為生長期,放水收割的8月底—9 月作為成熟期,發育期與生長期影像成像時間為2019 年,數據級別為L2A。成熟期由于2019 年和2018年的云量較多,所以選擇質量較好的2017 年的影像(表 2)。對選取的影像應用三次卷積法將低分辨率的波段重采樣為10 m。
ASTER GDEMV2 高程數據由日本METI 和美國NASA 共同研制,數據的空間分辨率精度和高程精度有所提高。該數據空間分辨率為30 m,利用三次卷積法將數據重采樣為10 m 分辨率。此外,涉及的研究區范圍、河流等矢量數據均來自全國地理信息資源目錄系統。
本研究結合研究區實際情況,將地物劃分為5 類:水稻、其他植被(旱地作物、草地、雜草荒地)、林地(各類木本植物用地)、水體、建設用地(包括建筑物、道路、裸地)。由于水田季節形態的多樣性,部分水田僅通過目視解譯難以與其他地物區分,需要實地考察選取訓練樣本。實地考察于2019 年8 月在界石鎮、石灘鎮、木洞鎮、南泉鎮等12 個鄉鎮開展,采集到樣本點:水稻125 個、其他植被152 個、水體50 個,將其作為分類樣本。

表1 Sentinel-2 影像數據波段介紹 Table 1 Waveband parameters of Sentinel-2

表2 水稻各生長階段所選影像數據 Table 2 Selected image data at each rice growth stage

圖2 實地采樣點與考察線路 Fig.2 Field sampling points and survey lines
在數據預處理的基礎上,通過 SNAP(Sentinal Application Platform)、ENVI5.3、ArcGIS10.2 分別計算影像的光譜特征、紋理特征和地形特征作為分類特征。在實地考察數據的基礎上,通過目視解譯補充分類樣本,再通過SEaTH(Separability and Thresholds)算法對備選特征進行篩選,最后通過ENVI5.3 中的隨機森林分類模塊對其進行分類,從分類結果中隨機選取若干點作為驗證點,構建誤差矩陣,比較水稻各生長階段的分類結果差異。

圖3 技術流程圖 Fig.3 Technical flowchart
基于水稻的植物與水屬性,選取了CIgreen、DVI、EVI、EVI2、mNDVI、MSR、NDVI、OSAVI、PVI、RVI、WDRVI共11 個植被指數,LSWI、MNDWI、MSI、NDBI、WL2015、AWEI、NDWI 共7 個水體指數,并基于Sentinel-2 數據特有的3 個紅邊波段,選區CIred-edge、IRECI、MCARI、MCARI2、mNDVIre、MSRre、MTCI、NDre1、NDre2、NDVIre1、NDVIre2、NDVIre3、SRre共13 個紅邊指數,分類特征如表3 所示。此外,有研究表明,紋理特征與地形特征可適當提高分類精度[12-13]。本研究利用ENVI5.3 工具計算均值、方差、協同性、對比度、相異性、信息熵、二階矩和相關性8 個紋理特征,利用ArvGIS10.2 工具計算起伏度、山體陰影,利用ENVI5.3 工具計算坡度、坡向、剖面曲率、水平曲率,將DEM 高程數據作為海拔。與影像的12 個原始波段共同組成58 個分類特征。

表3 前期初選特征說明及計算方法 Table 3 Description of original feature and calculate method
前期選擇的分類特征共計58 個,如果全部用于圖像分類當中,勢必會引起數據冗余和過度干擾,降低分類精度。本研究運用SEaTH 算法篩選分類特征,該算法的基本思想是在分類特征服從正態分布的條件下,利用Jeffries-Matusita 距離(J-M 距離)來衡量類間可分性,即特征值的分離度J 可由式(1)和式(2)計算得出

式中1m 、2m 為樣本對應的每個特征值的均值;1σ 、2σ 為本對應的每個特征值的標準差;B 為巴氏距離;J 的取值區間為[0,2],其中0 代表2 個類別在某一特征上幾乎完全混淆,2 代表2 個類別在某一特征上能夠完全分離[35]。
通過實地考察與目視解譯,最終選取的分類樣本數量為:水稻682 個、其他植被557 個、水體335 個、林地458 個、建設用地514 個,通過計算各樣本所對應各特征值的均值和方差來計算分離度。由于側重提取水稻,分離度中涉及水稻的,將選取J >1 的前4 種分類特征,未涉及水稻的,將選取J >1 的前2 種分類特征,并包括重復的分類特征。
圖像分類方法一直是遙感研究的熱點,不同的地區選擇不同的分類方法可以得出不同的分類結果。基于分類數據的多維度性與研究區地形的復雜程度[35-36],本研究選取隨機森林分類法。該方法被證明在分類精度與速度,處理高維遙感影像數據方面優于傳統監督分類方法。隨機森林可以解釋若干自變量(X1,X2,…,Xk)對因變量Y 的作用。如果因變量Y 有N 個觀測值,有k 個自變量與之相關;在構建分類樹的時候,隨機森林會隨機地在原數據中重新選擇N 個觀測值建立決策樹。同時,隨機森林隨機地從k 個自變量選擇M 個變量進行決策樹節點的確定。每次構建的決策樹都不完全一樣,最后選擇重復程度最高的樹作為最終結果[37]。隨機森林算法中N和M 兩個參數的設置對分類結果影響并不敏感,利用默認值可以達到較優分類效果,研究采用默認設置,N 值為100,M 為分類特征個數的算術平方根。分類后,從結果中隨機選取樣本點,利用谷歌高精度遙感影像對驗證樣本通過構建混淆矩陣,計算Kappa 系數,用戶精度、制圖精度、總體精度等驗證指標進行精度檢驗,比較不同生長階段,水稻提取的分類精度差異。
水稻發育期篩選后的分類特征數量為16 個,其中B7、B12 等波段特征,對各地類均有較高的分離度。CIgreen、MSR 等植被指數主要用于水稻與林地及其他植被的分離,IRECI、MTCI 等紅邊指數對水稻與水體、建設用地的分離度較高;水稻生長期篩選后的分類特征數量為13 個,其中mNDVI、CIgreen等植被指數對水稻與水體、建設用地的分離度較高,NDWI、LSWI 等水體指數用于區分水稻與水體、建設用地;水稻成熟期篩選后的分類特征數量為12 個,其中水稻與其他植被的分離度較差,mNDVIre、MSRre等紅邊指數總體分離作用最大,WDRVI、NDVI 等植被指數主要區分水稻與林地。

表4 水稻各生長階段篩選后的分類特征 Table 4 Classified features after screening at each rice growth stage
本研究的分類方法性質上屬于基于像元分類,分類結果中難免存在小斑塊,為減少小斑塊對分類精度的影響,本研究將通過卷積濾波的方法對分類結果進行分類后處理,其原理是:將較大類別中的虛假像元歸到該類中,目的是為了提高分類精度。最后的分類結果如圖 4所示,各生長階段所提取的水稻區域大致相同,受地形影響,水稻分布呈現分散破碎的特點。巴南區城鄉空間差異明顯,水稻主要分布于巴南區北部的木洞鎮、二圣鎮、惠民鎮,南部的接龍鎮、石灘鎮、石龍鎮。

圖4 水稻各生長階段分類結果圖 Fig.4 Images of classified results at each rice growth stage
為防止構建混淆矩陣時,因驗證樣本數量過少,導致精度驗證結果不準確的問題,本研究選取的總體與水稻的驗證樣本數量分別為2 100 和500 個,驗證結果如圖 5 所示。其中,發育期、生長期、成熟期的用戶精度分別為0.93、0.88、0.85;制圖精度分別為0.93、0.96、0.93;總體分類精度分別為0.92、0.92、0.91;Kappa 系數分別為0.90、0.90、0.88。除用戶精度相差較大以外,其他指標差距不大,發育期的用戶精度遠高于生長期和成熟期,說明發育期是提取水稻最理想的生長階段;成熟期的用戶精度,制圖精度,總體分類精度,Kappa 系數均為3 個水稻生長期數據中最低,相較于發育期和生長期,成熟期數據不適宜用于進行水稻地物的提取。

圖5 水稻各生長階段精度驗證比較圖 Fig.5 Comparison chart of accuracy verification at each rice growth stage
SEaTH 算法廣泛的運用于分類特征的篩選。在付勇勇等[38]對雷州半島的水體與非水體進行分類,江春梅[39]對福州市永泰縣水稻進行提取的研究中,特征篩選結果均表明光譜特征的分離度最大,紋理、地形特征的利用率不高。圖6 為水稻各生長階段篩選后的分類特征數量對比圖。特征篩選后的分類特征表明,水稻各生長階段的分類特征以植被指數與波段特征為主。紅邊指數與水體指數的季節變化明顯,紅邊指數多用于水稻發育期,主要分離水稻與林地、其他植被。水體指數可以反映地表水的分布情況,多用于生長期。紋理、地形特征只用于發育期,未用于生長期與成熟期。雖然兩類特征在分類中能起到適當提高精度的作用,但作用并不明顯。

圖6 水稻各生長階段篩選后的分類特征數量對比圖 Fig.6 Comparison of the number of classified features after screening at each rice growth stage
圖7 通過比較各生長階段中地物間的分離度(用平均值表示)與錯漏分像元數量的關系后發現,各生長階段均呈現出分離度與錯漏分數量成反比的趨勢,即分離度越大的地物,其錯漏分像元數量越少。此外,水稻在不同生長階段與不同的地類混淆,發育期各類地物間的分離情況較好,生長期易與林地、其他植被混淆,成熟期易與建設用地、其他植被混淆。在對分類結果進行精度驗證后發現:發育期是提取水稻最理想的生長階段,部分研究中也提到水稻發育期有易于識別稻田的關鍵特征[40-41];山區的水稻提取與平原地區相比,分類精度仍有差距,Zhang 等[11]基于MODIS 時間序列數據對東北平原的水稻進行提取,用戶精度和總體精度分別達到96%和97%,Dong 等[42]基于Landsat-8 影像對中國東南部的水稻進行提取,總體精度可以達到95%;由于本研究選取了過多的水稻驗證樣本點,造成其他地類的疏忽,總體分類精度與實際情況難免存在一定的誤差。

圖7 水稻各生長階段地物間分離度與錯漏分像元對比圖 Fig.7 Comparison chart of ground objects separation and error-leakage pixel at each rice growth stage
本研究通過對不同生長階段的水稻進行提取得出以下結論,經過SEaTH 算法對分類特征進行篩選可去除分離度較低的分類特征,提高工作效率,避免數據冗余的情況;Sentinel-2 影像憑借其10 m 的空間分辨率與5 d 一景的重返周期經試驗證明能一定程度上克服圖像獲取的困難,是山區理想的數據源;精度驗證結果表明水稻發育期的用戶精度最高,為0.93,說明水稻處于發育期時,更易與其他地物進行區分,在影像質量較好的情況下可作為山地水稻提取的首選。
此外,本研究方法僅適用于小范圍水稻提取,用于大范圍水稻提取勢必增加工作成本,降低效率,GEE(Google Earth Engine)作為遙感大數據云平臺,依托其強大的云計算能力為今后擴大研究區范圍提供參考;水稻生長期得到的用戶精度為0.88,同樣達到較高的分類精度,在影像質量允許的條件下,是否能通過影像融合的方法將發育期與生長期的數據結合,以得到更高的分類精度有待日后繼續研究;本研究所用分類方法實質屬于基于像元的影像分類,難免出現虛假像元的情況,未來可采取影像分割,面向對象的分類方法消除虛假像元的影響。