李 賓,荊 華,張殷欽,王利書
(1.河北工程大學河北省智慧水利重點實驗室,河北 邯鄲 056038;2.邯鄲市漳滏河灌溉供水管理處,河北 邯鄲 056001)
我國耕地總面積位列世界第三,不僅耕地面積大,種植作物結構也復雜多樣,在開展農業精細化水資源管理過程中,急需對不同作物分布情況進行精確監測。但截至目前,我國大多數地區還是以實地調查并逐級匯總上報的形式進行統計[1],組織人力去實地調研勘察冬小麥種植面積,不僅監測范圍有限,還費時費力,若利用遙感技術則可高效獲取大面積耕地影像分布數據,對農業管理與水資源管理具有重要意義。當前,國內外眾多學者對此開展了大量的研究。姚玉梅等[2]基于遙感技術對邯鄲市館陶縣實現了高精度、大面積的農作物水分消耗監測,為農業節水管理提供了依據;馮權瀧等[3]運用機器學習方法和深度循環神經網絡模型,獲取了冬小麥空間分布特征,提取精度達0.93 以上;吳及[4]在1999—2010年Landsat4-5TM 衛星遙感數據的基礎上,通過最大似然分類法提取出三峽庫區的四類土地利用,得到了三峽庫區各土地類型規模占比與變化速率;劉煥軍等[5]使用最大似然法基于多時相遙感數據對土壤進行分類,精度達91%,為土壤精細制圖提供了依據;李振今等[6]使用最大似然法監測濟南市林業變化結果,總體精度達98%以上;孫坤等[7]對比監督分類法中的6 種分類器的分類精度及計算效率,得出最大似然分類法效果幾乎具備各分類器的全部優點且計算時間相對較短,適合在中低空間分辨率多光譜遙感影像的分類研究中應用。
邯鄲市永年區作為河北省多樣蔬菜種植基地和全國糧食生產的先進縣,作物結構復雜多樣,冬小麥種植范圍大,本文以邯鄲市永年區為例,針對區域現狀,詳細闡述了基于ENVI(The Environment for Visualizing Images)遙感操作平臺,使用該方法獲取冬小麥分布影像的流程,可為農業遙感監測提供借鑒。
本文以歐洲航空局Sentinel-2 光學衛星影像為數據源,選取與地面觀測時間同步目標影像。該衛星2015年成功發射,空間分辨率可見光10 m,近紅外20 m,短波紅外60 m,其多光譜儀器每10 d 就可以提供全球從北緯83°到南緯56°的多光譜圖像,時效性較高。
歐洲航空局的SNAP 哨兵數據應用平臺是所有Sentinel-2工具箱的基礎平臺,具有可以處理更大規模的業務、更簡單地從某一環境轉移到另一環境下與將復雜系統分解為更好的可管理模塊的界面。對影像的處理通過SNAP(Sentinel Applications Platform)軟件窗口(Geometric)中重采樣(Resampling)工具對Sentinel-2數據進行波段重新采集至10 m×10 m的空間分辨率。
由于重采樣的波段文件較多、空間儲存較大,通過ENVI5.3 可合并所有波段,也可根據需要合并部分波段。以B2、B3及B4波段為例,使用圖層合并工具Layer Stacking將3個波段合成為真彩色影像。
ROI(Region of Interest)即為樣本區域的選取,也稱為訓練樣本或檢驗樣本,可使用點、線、面進行繪制,主要是為遙感影像分類做基礎準備。通過ROI 可完成圖像的掩膜提取、裁剪以及對影像進行局部統計的相關操作。
訓練樣本分離性的差異程度也可利用Jeffries-Matusita 距離參數確定,取任意2 種樣本類別之間的檢驗區Jeffries-Matusita 距離作為衡量標準[8],根據式(1)計算Jeffries-Matusita距離,由此來確定任意2個訓練樣本間的相似性和可分離度的一致性是否符合要求。Jeffries-Matusita 距離參數是依據不同波段反射率內的每個訓練樣本計算而來,其值域[9]為0~2,若Jeffries-Matusita值超過1.8,則說明選取的2個樣本差異性明顯,兩者分離性較強;若該參數為1.4~1.8,則說明2個樣本差異性降低,兩者分離性較弱;若該參數小于1.4,則說明2個樣本差異性不大,需對2個樣本重新劃分取樣;若該參數小于1,則說明2 個樣本可能為同一種土地利用類型,應合并為同一類,合并后還需重新進行樣本分離度計算并驗證其是否符合精度要求。
式中:Jmn指檢驗區Jeffries-Matusita 距離;指在影像中任意像元x出現在m類中的條件概率;指圖像中任意像元x出現在n類中的條件概率。
監督分類前,在下載的Sentinel-2 影像基礎上,根據野外收集調查整理的資料,可通過室內目視解譯的方法,對不同土地利用類型進行劃分,并在不同用地類型上選取一定量的樣本作為訓練樣本。在此基礎上,選取的每個訓練樣本與整個影像上的像元作比較,在ENVI 平臺操作最大似然分類工具,將所要提取影像的像元劃分到與選取樣本最相近的類別中,以此完成對整個遙感影像的分類[10]。ROI 建立流程,如圖1所示。

圖1 ROI建立流程
遙感圖像方法因具有觀測覆蓋面廣、信息提取速度快的特性,已應用于冬小麥的信息收集。當下的遙感方法中,監督分類法中主要使用的方法有最小距離法、平行六面體法和最大似然分類法等[11]。
最大似然分類法采用了遙感衛星的多頻帶數據分布中的多維正態分布,并以此建立了訓練樣本判定識別的分類方法[12],即為每一種像元在同一類別中的占比將相對應的像元分配在該類型中,其步驟如圖2所示。其主要原理為貝葉斯公式,即:

圖2 最大似然分類法步驟
式中:gi(x)為分類函數;P(ωi|x)屬于ωi的概率;P(x|ωi)為似然概率;P(ωi)表示ωi這一類中出現像元x的概率;P(x)為變量x與樣本類別沒有相互關聯下出現的概率。這表示在不同類別之間的判斷中,利用統計的方法建立非線性的判別函數集。
精度評價是指將實地勘察數據與遙感分類結果相比較,從而判斷分類結果的精確度及可靠性。基于ENVI 平臺,利用混淆矩陣工具評價分類精度。混淆矩陣是將實測的像元個數與分類提取的像元個數相對比形成的陣列關系,以n×n的矩陣表示,是一種最常用的影像分類結果評價的計算工具[13],其步驟如圖3所示。

圖3 混淆矩陣流程
整體影像分類完成后,由混淆矩陣精度計算工具計算Kappa 系數、總體精度(Overall Accuracy),并分別計算樣本點正確分類為要求類別的比率、地面真實參考數據被正確分類的概率、錯誤分類的概率以及被遺漏的誤差[14]。其中,Kappa系數是基于ENVI平臺對分類精度進行評價的一個指標[15],如式(3)所示。Kappa系數的評價指標通常在0~1,用來表示分類前后的一致性:Kappa系數的值若小于0.2,則表示分類結果精度弱;若在0.2~0.4,則表示分類結果精確度微弱;若在0.4~0.6,則表示分類結果前后一致性中等,即樣本劃分結果精確度中等;若在0.6~0.8,則表示分類結果前后一致性高,即樣本劃分結果精確度顯著;若超過0.8,則表明分類結果前后幾乎完全一致,即樣本劃分結果精確度最高[16]。
式中:Kappa系數表示精確度評價指標;M為感興趣區提取的樣本總數;n代表劃分的土地利用類型總數,i表示數量(i=0,1,2,…,n);Xii代表混淆矩陣對角線上的值;Xi+和X+i分別表示混淆矩陣中劃分類別列和行的和。
河北省邯鄲市永年區位于東經114°20′~114°52′、北緯36°35′~36°56′,地處半濕潤半干旱地區,總面積760.72 km2,是全國糧食生產先進縣和全國蔬菜產業十強縣,主要農作物為輪作冬小麥、夏玉米,兼種大蒜、溫室大棚蔬菜等其他作物,種植結構較復雜,具有顯著多樣性。
按上述方法,通過Sentinel-2 影像預覽邯鄲市永年區,最終選取云層覆蓋度較低、經重采樣后空間分辨率為10 m 的遙感數據,成像時間為2019年5月4日。原始影像如圖4 所示,地理位置如圖5所示。

圖4 永年區原始影像

圖5 永年區地理位置
本文將遙感影像數據劃分為冬小麥、建筑物、其他耕地、荒地4 類樣本數據。選取不規則邊框劃分樣本邊界,以避免在取樣時選取到其他土地利用類型。根據樣本分離度計算結果,冬小麥與荒地、荒地與建筑物、冬小麥與建筑物、建筑物與其他耕地及荒地與其他耕地的分離度均大于1.8,屬于樣本分離性最強、差異性較好類型。由于選取試驗區種植結構較為復雜,其他耕地區域在選取影像時間段內種有大蒜等農作物,其中大蒜在目視解譯過程中與冬小麥差異性相差較小,但其種植密度較低,進而導致冬小麥與其他耕地分離度在1.4~1.8,分離度較弱。綜上,樣本分離度符合差異性評價要求,樣本選取合格。感興趣區分離度評價,如圖6所示。

圖6 感興趣區分離度評價
根據《邯鄲統計年鑒2020》,永年區冬小麥實際占地面積330.21 km2,約占總面積的43.4%。基于目視解譯的4 種土地利用類型,為直觀了解其分布情況,通過最大似然分類法使其可視化,如圖7 所示。去除其他3 種土地利用類型后,清晰展示了冬小麥分布情況,如圖8 所示,冬小麥主要分布在劉營鄉、劉漢鄉、講武鄉、大北汪鎮、曲陌鄉與正西鄉東北區域,永年西部及南部地區以種植大蒜等蔬菜為主,與實際情況較為符合。

圖7 土地利用類型

圖8 冬小麥分布
基于ENVI 平臺中的分類統計工具,計算各土地利用類型像元數量,像元總數即永年區整體占地面積。以計算冬小麥占總體像元數量的百分比作為本次分類面積與實際面積的精度驗證。通過最大似然分類法的像元數量分析,提取的冬小麥像元數為3025316 個,約占總面積像元數量的40.01%,與實際占地面積相差僅為3.09%。像元分布數量,如圖9所示。

圖9 像元分布數量
經過ENVI 平臺中的混淆矩陣工具的精度驗證結果,如圖10 所示,影像提取總精度達95.9%,Kappa系數為0.94,表示分類結果幾乎一致,分類精度最佳,錯分誤差及漏分誤差都在0.08 以下,生產者精度與用戶精度達0.92 以上,因此可認為分類精度較高。

圖10 精度驗證結果
以河北省邯鄲市永年區為示例,使用最大似然分類法在作物種植較為復雜的情況下,實現了對冬小麥空間分布和種植面積的快捷、準確獲取,其中冬小麥遙感提取面積為304.33 km2,與實際統計面積相差僅為3.09%,誤差較小,識別的總精度及Kappa系數分別達0.95 與0.94,準確度較高。由此可以看出,最大似然分類法在實際應用中有較強的適應性,不僅可實現種植情況的提取,也可對建筑物以及林地覆蓋范圍進行識別等,應用領域較廣。