







摘 要:【目的】高效獲取大面積耕地影像分布數據,助力關中平原地區耕地保護動態監測和管理。【方法】以陜西省西安市臨潼區為研究區,基于SNAP平臺和ENVI處理軟件,使用監督分類中的最大似然分類法對哨兵二號高分辨率遙感影像耕地RS(Remote Sensing)遙感數據進行識別提取,獲取耕地空間分布及面積等地理信息。【結果】提取耕地總面積為411.57 km2,主要分布于臨潼區北部相橋、交口、棟陽等街道及中東部何寨、零口街道等平緩地區,與官方統計面積相近,誤差僅為0.92%,提取總體分類精度為96.07%,Kappa系數為0.94,符合精度要求。【結論】通過最大似然分類法提取耕地結果與實際數據較為貼合,證明最大似然分類法在實際耕地地類識別檢測應用中有著較高的匹配度,可以較為精準地實現土地利用類型識別。
關鍵詞:最大似然分類法;Sentinel-2高分遙感影像;耕地;ENVI
中圖分類號:TP753" " "文獻標志碼:A" " "文章編號:1003-5168(2024)09-0096-05
DOI:10.19968/j.cnki.hnkj.1003-5168.2024.09.020
Research on Accurate Extraction Method of RS Image of Cultivated Land in Guanzhong Plain
XU Qinghao" "ZHOU Haohao
(School of Land Engineering, Chang'an University, Xi'an 710061,China)
Abstract: [Purposes] This paper aims to assist in the dynamic monitoring and management of farmland protection in the Guanzhong Plain region, and efficiently obtain large-scale farmland image distribution data. [Methods] Taking Lintong District, Xi'an City, Shaanxi Province as the research area, and based on the SNAP platform and ENVI processing software, the maximum likelihood classification method in supervised classification is used to identify and extract the remote sensing data of remote sensing imagery of Sentinel 2's high-resolution farmland RS (Remote Sensing), and obtain geographic information such as spatial distribution and area of farmland. [Findings] The total area of cultivated land extracted is 411.57 square kilometers, mainly distributed in the northern part of Lintong District, including Xiangqiao, Jiaokou, Dongyang and other streets, as well as in the gentle areas of Hezhai and Lingkou streets in the central and eastern parts. It is similar to the official statistical area, with an error of only 0.92%. The overall classification accuracy of the extraction is 96.15%, and the Kappa coefficient is 0.94, which meets the accuracy requirements. [Conclusions] The maximum likelihood classification method is more suitable for extracting cultivated land results and actual data, which proves that the maximum likelihood classification method has a high matching degree in the recognition and detection of actual cultivated land types, and can accurately achieve land use type recognition.
Keywords: maximum likelihood classification; Sentinel-2 high-resolution remote sensing images; cultivated land; ENVI
0 引言
耕地是人類賴以生存和發展的基礎性資源,是糧食安全和生態安全的基石。我國是耕地總面積世界第三的糧食大國,耕地現狀為耕地總量大,人均耕地數量少;高質量耕地少,可開發的后備耕地資源少。由于我國國土遼闊、地形復雜多樣,在開展耕地保護利用過程中,工作內容復雜、難度大。當下全國大部分地區的耕地信息提取工作主要方式仍是通過傳統的實地調研、逐級匯總上報,進行統計[1],不僅調查范圍有限,而且耗費大量人力物力。通過遙感技術高效獲取大面積耕地影像分布數據,有助于降低土地資源監測管理工作難度,提升土地信息數據庫的準確性。
國內外學者對遙感識別進行了大量的研究。張峰等[2]基于多光譜衛星影像的空間紋理特征,按區域對TM影像進行分割,采用模糊函數的方法對選取的識別特征進行定義,耕地提取精度達到90%;鄧勁松等[3]添加植被指數作為新波段,使用決策樹模型提取SPOT5衛星影像中的耕地信息,對耕地中的旱地和水田進行進一步劃分,同時減小了園地對識別結果的干擾;舒煒等[4]對QuickBird影像進行分析,采用光譜閾值法進行耕地信息的提取;吳卓蕾等[5]分析“北京一號”衛星數據的波段特征,計算6種典型的植被指數,利用Erdas進行耕地提取;吳及[6]基于1990—2010年Landsat4-5TM衛星遙感數據,采用最大似然分類法提取三峽庫區4種土地利用類型面積,利用灰色關聯模型分析各土地類型變化驅動力;孫坤等[7]比較了監督分類6種分類方法的分類精度,發現最大似然分類法具有較高精度,分類效果更好。
本研究以西安市臨潼區為例,基于ENVI(The Environment for Visualizing Images)遙感圖像處理平臺,采用最大似然分類法針對關中平原現狀耕地利用進行遙感識別,為耕地遙感監測識別提供參考。
1 研究區概況與數據來源
1.1 研究區概況
臨潼區隸屬于陜西省西安市,地處關中平原東部,位于東經109°05′49″E~109°27′50″E,北緯34°16′49″N~34°44′11″N,地處大陸性溫帶季風氣候區,總面積為915 km2 ,耕地實際占地面積為420 km2,約占全區總面積的45.90%。是關中地區重要的糧食生產基地。
1.2 數據來源
高分辨率衛星影像是研究的基礎,本研究使用歐洲航空局(ESA)官方網站下載的哨兵二號(Sentinel-2)光學衛星影像為數據源。哨兵二號是高分辨率多光譜成像衛星,搭載多光譜成像儀(MSI),覆蓋13個工作波段,圖像采集時間分辨率是每顆衛星10天,具有較高的時效性和準確性。
1.3 數據預處理
圖像預處理是遙感圖像處理工程中非常重要的環節。本研究使用哨兵數據應用平臺SNAP(Sentinel Applications Platform)對哨兵二號數據進行預處理。SNAP是由歐洲航空局官方提供的所有Sentinel-2工具箱的基礎平臺,功能全面,具有可擴展性、可移植性和模塊化界面。通過SNAP軟件對Sentinel-2數據進行重采樣,將波段重新采集至10 m×10 m的空間分辨率。
使用SNAP重采樣處理后的ENVI格式數據內容波段文件多且復雜,采用遙感處理軟件ENVI5.3進行哨兵二號數據真彩色影像的合成,最終得到經過圖像幾何校正、圖像裁剪等預處理過后的高分遙感影像。
2 影像提取方法
2.1 定義訓練樣本
訓練樣本即ROI(Region of Interest),也是對遙感影像進行分類的前期準備,訓練樣本的定義主要依靠人工目視解譯,通過構建點、線、面等空間矢量形狀。同時ROI也是按掩膜提取遙感影像、分析處理影像信息等相關操作的重要工具,ROI建立流程如圖1所示。
對于選取的訓練樣本,通過分析Jeffries-Matusita距離參數評價訓練樣本分離性的差異程度,計算公式為式(1)。
[Jmn=xp(x/m)?p(x/n)2dx12]" " "(1)
式中:[Jmn]指每組樣本區的 J-M距離;[pxm]指在每組ROI中任意像元x出現在m類中的概率; [pxn]表示所選樣本區內任意像元x出現在n類中的概率。
根據式(1)計算任意兩類樣本的Jeffries-Matusita(J-M)距離參數,衡量選取ROI檢驗各區的分離性[8],確定兩個類別間的差異性程度。J-M距離的取值范圍是[0,2][9],0表示兩個類別在某一特征上幾乎完全混淆,2表示兩個類別在某一特征上能夠完全分開。
2.2 最大似然分類法
衛星遙感影像具有輻射面廣、信息更新速度快等特性,已廣泛應用于地類識別與地物提取等方面的研究。隨著傳感器技術的提高,遙感影像的空間與時間分辨率也得到提升,分類算法不斷涌現。基于遙感影像的監督分類是現在主流的分類方法,主要包括平行六面體法、最小距離法、馬氏距離法、最大似然法和支持向量機等[10]。最大似然法通過假設衛星影像的每一個波段的每一類統計都呈正態分布[11],計算給定像元屬于某一訓練樣本的似然度,像元最終被歸并到似然度最大的一類當中,其主要原理為貝葉斯公式,見式(2)。
[gix=Pwi|x=Px|wiPwi|Px] (2)
式中:[gix]為最大似然分類結果函數;[Pwi|x]為像元類別判定屬于[wi]的概率;[Px|wi]為像元[x]的似然概率;[Pwi]表示[wi]這一類別中出現像元[x]的概率;[Px] 為變量[x]與樣本類別相互之間沒有聯系的情況出現的概率。該公式常用來表示不同土地利用類別之間的判定中的非線性函數集的非線性判別。
2.3 精度評價
執行完監督分類后,需要結合實際對分類結果進行精度評價。ENVI平臺提供了多種評價方法,包括分類結果疊加、混淆矩陣和ROC曲線等。本研究選取混淆矩陣評價分類結果精度,使用Confusion Matrix工具將分類結果的精度顯示到一個混淆矩陣中,以此來比較分類結果和地表真實信息。在輸出的混淆矩陣結果信息中,包含了總體分類精度、 Kappa系數、混淆矩陣、錯分誤差、漏分誤差、制圖精度及用戶精度。
其中,總體分類精度代表被正確分類的像元占像元總數的比重;Kappa系數是指把所有真實參考的像元總數[M]乘以混淆矩陣對角線的和[Xii],再減去其中一類中真實參考像元數[Xi+]與該類中被分類像元總數[X+i]之積之后,再除以像元總數[M]的平方減去某一類中真實參考像元總數[Xi+]與該類中被分類像元總數[X+i]之積對所有類別求和的結果[12],計算公式為式(3)。
[Kappa=M×i=1nXii?i=1nXi+×X+iM2?i=1nXi+×X+i] (3)
錯分誤差是指像元被分到某一類其原本不屬于的類別中;漏分誤差指沒有被分類器分到相應類別中的像元數;用戶精度是指正確分到某類的像元總數與分類器將整個圖像的像元分為該類的像元總數比率。
3 區域示例
按照上述研究方法,通過設置時間、云量等參數,自歐航局網站獲取成像時間為2022年6月27日,云層覆蓋度較低的Level-A產品數據,經SNAP軟件重采樣后空間分辨率為10 m。經預處理后的研究區原始影像如圖2所示。
3.1 樣本提取
本研究將地類樣本劃分為耕地、草地、林地、水體、建設用地和未利用地等6類樣本數據。通過人工目視解譯判讀結合實地核實獲得各個分類的樣本數據。
各樣本分離度評價見表1。由表1可知,各樣本的分離度均大于1.8,屬于樣本分可分離性好、差異性明顯。耕地與草地、耕地與林地、耕地與水體、耕地與建設用地及耕地與未利用地的樣本分離度都達到了1.9以上,屬于特征明顯的合格樣本。
3.2 分類結果
基于劃分的6種土地利用類型,通過研究方法中的最大似然分類法使其可視化,得到臨潼區6類土地利用類型分布情況。去除草地、林地等其他5種土地利用類型后,清晰展示了耕地的分布情況,如圖3所示,耕地在臨潼區的主要分布位于其北部及中東部平緩地區,與當地實際情況符合。
對使用最大似然法獲得的分類結果進行統計,總計提取耕地像元總數為4 701 633個,占全域總像元數的44.98%,與臨潼區實際耕地面積占比相差僅為0.92%,統計結果見表2。
基于ENVI平臺,使用Confusion Matrix工具將分類精度以混淆矩陣的結果呈現,混淆矩陣如圖4所示。總體分類精度達96.07%,Kappa系數為0.94,表示分類結果前后幾乎完全一致,樣本分類結果精度顯著,耕地錯分誤差及漏分誤差都在0.08以下,生產者精度與用戶精度達0.95以上,分類結果精度較高。
4 結論
本研究針對關中平原區內的陜西省西安市臨潼區,使用當下所廣泛使用的最大似然分類法,在哨兵二號高分辨率遙感影像的基礎上,實現了對關中重要糧食生產區——臨潼區耕地的空間分布的快速、準確獲取。遙感提取統計該地區耕地總面積為411.57 km2,與官方統計面積相近,誤差僅為0.92%,總分類精度為0.96,Kappa系數為0.94,證明分類結果準確性高、可靠性強。
本研究嘗試建立快速、簡單、操作性強的耕地識別提取方法,基于哨兵二號衛星遙感影像,構建最大似然分類模型,從而證明最大似然分類法在實際耕地地類識別檢測應用中有著較高的匹配度,可以較為精準地實現土地利用類型識別。
參考文獻:
[1]左憲禹,韓林果,葛強,等.基于GF-1衛星的縣域冬小麥面積提取及年際變化監測[J].河南大學學報(自然科學版),2019,49(1):69-77.
[2]張峰,吳炳方,黃慧萍,等.泰國水稻種植區耕地信息提取研究[J].自然資源學報,2003(6):766-772,784.
[3]鄧勁松,王珂,沈掌泉,等.基于特征波段的SPOT-5衛星影像耕地信息自動提取的方法研究[J].農業工程學報,2004(6):145-148.
[4]舒煒,鄧小菲.基于QuickBird影像耕地信息提取方法研究:以綿陽市游仙區為例[J].綿陽師范學院學報,2008(11):115-120.
[5]吳卓蕾,李偉建,曾永年,等.植被指數在“北京一號”數據耕地提取中的應用研究[J].測繪科學,2008(2):98-100.
[6]吳及.三峽工程對庫區土地利用變化的影響研究:基于1990—2010年庫區遙感影像[J].海河水利,2020(1):30-36.
[7]孫坤,魯鐵定.監督分類方法在遙感影像分類處理中的比較[J].江西科學,2017,35(3):367-371,468.
[8]金興,祝新友,王晨昇,等.“高分一號”衛星數據遙感影像分類方法研究:以內蒙古維拉斯托地區為例[J].礦產勘查,2017,8(6):1069-1078.
[9]張佳琪. 基于多源衛星遙感的昌吉市棉花種植面積信息提取研究[D].新疆:新疆農業大學,2017.
[10]ZHANG K,XI W J,ZHU Z B. Comparison of accuracy of different supervised classification methods based on landsat8 images [J].Geographical Science Research,2020,9(3):156-165.
[11]童威.基于ENVI的遙感影像監督分類方法的研究[J].科技創新與應用,2019(23):6-9.
[12]唐廷元,付波霖,何素云,等.基于GF-1和Sentinel-1A的漓江流域典型地物信息提取[J].遙感技術與應用,2020,35(2):448-457.