高 燕,張延玲,何小雷
(1.水利部 松遼水利委員會,吉林 長春 130021;2.北京師范大學 地理學與遙感科學學院,北京 100875)
?
東北黑土區耕地分布解譯的遙感數據源對比
高燕1,張延玲1,何小雷2
(1.水利部 松遼水利委員會,吉林 長春 130021;2.北京師范大學 地理學與遙感科學學院,北京 100875)
[摘要]為了解國家基礎地理信息中心的全球地表覆蓋遙感制圖數據(Globalland30-2010)和中國科學院全國1∶10 萬比例尺土地利用數據庫2010年度更新數據(LUCC-2010)在東北黑土區耕地范圍界定研究中的適用性,選擇位于東北典型黑土區的北安市、克東縣、龍江縣和梅河口市為研究區,利用高空間分辨率的地方土地利用數據建立耕地漏分和誤增兩個指標,對兩種數據進行對比分析。研究結果表明:在耕地連續均勻分布的地區,兩種數據的耕地精度都比較高;在林地和耕地混合分布區域,Globalland30-2010高估了耕地面積;在耕地和草地、水域混合區域,LUCC-2010低估了耕地面積。Globalland30-2010的總體精度略高于LUCC-2010,但是LUCC-2010耕地一類的精度高于Globalland30-2010。
東北黑土區是我國重要的糧食生產區,保護其耕地資源對保障我國糧食安全具有重要意義。近年來針對嚴重的土壤侵蝕狀況,在東北黑土區開展了大量水土保持工作,而掌握耕地分布狀況是進行水土保持規劃的基礎。目前,大范圍的耕地分布數據主要是依靠不同尺度的遙感影像分類解譯獲得的。1 km2分辨率的遙感產品能夠實現全區域的高頻次覆蓋,但是分類結果的精度很低;米級空間分辨率的土地利用產品具有很高的分類精度,但是只有局部的數據產品。目前國內常用的數據產品主要來自30 m分辨率的陸地資源衛星數據,其中最新發布的權威性數據有國家基礎地理信息中心的全球地表覆蓋遙感制圖數據(Globalland30-2010)和中國科學院全國1∶ 10萬比例尺土地利用數據庫2010年度更新數據(LUCC-2010)。為了解這兩種數據在東北黑土區耕地范圍界定研究中的適用性,選擇位于東北典型黑土區的北安市、克東縣、龍江縣和梅河口市為研究區,利用高空間分辨率的土地利用數據建立耕地漏分和誤增兩個指標,對兩種產品進行了對比分析。
1遙感數據介紹
Globalland30-2010是由國家基礎地理信息中心牽頭,聯合多家科研院所共同完成的以2010年為基準年的全球地表覆蓋遙感制圖數據。該數據覆蓋了南北緯80°的陸地范圍,包括耕地、森林、草地、灌木林地、濕地、水體、苔原、人造地表、裸地、冰川和永久積雪等10種地表覆蓋類型,采用柵格格式,投影方式為通用橫軸麥卡托(UTM),WGS-84坐標參數,空間分辨率為30 m,為了表述方便,本文簡稱G30。
中國科學院地理科學和資源研究所劉紀遠等從20世紀80年代以來一直研究地學信息與遙感信息融合的方法,形成了多期LUCC數據,建立了中國1∶ 10萬比例尺土地利用數據庫(LUCC)[1-2]。2010年度更新數據(LUCC-2010)采用矢量格式,投影方式為Albers,Krasovsky-1940坐標參數,空間分辨率為30 m,本文簡稱LU。
選擇和G30、LU數據同時期的高精度土地利用數據,該數據由法國SPOT衛星遙感影像經過精細分類獲得,其野外驗證精度很高。該產品采用矢量格式,投影方式為高斯克呂格(TM),坐標系參數采用CGCS-2000,分辨率為2.5 m,本文簡稱CC。
2研究方法
選擇位于東北典型黑土區的黑龍江省北安市、克東縣、龍江縣和吉林省梅河口市為研究區,選用區內具有較高空間分辨率的CC數據為參考數據,對G30和LU數據進行地類分類結果的比較和精度驗證??紤]到3種數據所采用的土地分類方法不同,為了方便對比分析,首先進行地類的重新歸并,將原地類合并為耕地、林地、草地、水域和其他用地共5個新的綜合類別(表1);其次以CC數據為基準,分別進行CC與G30、CC與LU數據之間的配準,在配準數據的基礎上再進行G30 和LU數據的精度評價。精度評價采用的評價因子包括總體分類精度(OA)和Kappa系數(K)、用戶精度(UA)[3-5]。
(1)總體分類精度(OA),樣本所分類的結果與地面所對應的實際類型相一致的概率,計算公式為

表述的是對每一個隨機
(1)
式中:n為分類類別數量;Pii為混淆矩陣中第i類的斜對角上的像元數目;Ptot為分類圖中像元總數。
(2) Kappa系數(K),是用來評價兩幅圖之間的吻合度或精度的一種指標。相比于總體分類精度,它考慮了對角線上和不在對角線上的各種漏分和錯分誤差,計算公式為
(2)
式中:Pi+為第i行上所有類別(分類圖像的第i類)的像元數;P+i為混淆矩陣中第i列上所有類別(參考圖像的第i類)的像元數。
(3)用戶精度(UA),對于第i類,表示從分類結果中(如分類產生的類型圖)中任取一個隨機樣本,其所具有的類型與地面實際類型相同的條件概率,計算公式為
(3)
為了評價G30、LU兩種數據對耕地面積的誤判,分別采用耕地漏分和耕地誤增兩個指標進行評價,其中:耕地漏分表示驗證數據CC中類別為耕地,但是在待比較土地利用分類數據中類別為非耕地的面積;耕地誤增表示驗證數據CC中類別為非耕地,但是在待比較土地利用分類數據中類別為耕地的面積。
3結果與分析
3.14縣(市)土地類型構成情況
對重歸類后的CC、G30、LU三種數據的4縣(市)土地利用面積和比例進行了統計,見表2。從表2可以看出,北安縣、克東縣、龍江縣和梅河口市的土地利用類型均以耕地為主,其次是林地,草地、水域和其他地類所占比例較小。以CC數據為例,耕地分別占北安市、克東縣、龍江縣和梅河口市土地總面積的49.1%、75.0%、67.8%、56.9%;林地所占比例分別為34.3%、12.8%、11.4%、31.3%;草地、水域和其他地類合計所占比例分別為16.6%、12.2%、20.8%、11.8%。數據結果表明,與CC數據的土地利用數據相比,G30數據高估了耕地和草地的面積,低估了林地和水域面積,LU數據高估了水域面積,低估了林地面積。

表2 4縣(市)不同土地利用數據歸并后的地類面積與比例
CC數據地類歸并后的4縣(市)土地利用類型分布情況見圖1。北安市的耕地主要分布在西部地區,而林地集中在東部,相比于耕地和林地,草地、水域和其他3種地類的分布面積較小,空間分布也較零散;克東縣耕地分布廣泛,林地主要分布在東南角和西北角,草地、水域和其他3種地類的分布較雜亂;龍江縣耕地分布廣泛,林地主要集中在西北角和南部兩個地區,水域在南部、東南部和東北部有較大面積分布,草地和其他2種地類分布零散;梅河口市耕地和林地大致呈東北-西南走向的長條狀分布,水域主要分布在西南角(呈塊狀分布)和中部地區(呈線狀分布),草地和其他2類分布少而零散。

圖1 CC數據土地利用類型歸并結果
3.2分類的總體精度驗證
G30數據與LU數據的精度驗證結果如表3所示。其中,4縣(市)的總體精度值在65%~82%之間,G30數據的精度值高于LU數據,說明G30數據的總體分類精度要優于LU數據;K值在0.40~0.54之間,其中北安市和克東縣G30數據的K值大于LU數據,龍江縣和梅河口市G30數據的K值小于LU數據,而北安市和克東縣各地類的分布情況相對簡單(主要為耕地和林地),龍江縣和梅河口市各地類分布相對復雜(以耕地、林地和水域為主),說明G30數據對地類組成簡單的目標分類效果較好,而LU數據對地類混雜分布的目標分類效果可能更佳。耕地用戶精度值均高于74%,尤其克東縣和龍江縣兩縣的精度值在87%左右,除龍江縣G30數據的精度值略高于LU數據,其他3縣(市)LU數據的精度值均高于G30數據,說明LU數據對耕地一類的分類精度優于G30數據。

表3 G30與LU數據的總體精度驗證
3.3耕地與其他土地利用類型混淆對比
3.3.1耕地與林地比較
選擇林地較多的北安市、梅河口市和龍江縣進行耕地和林地的混淆情況分析,得到耕地和草地兩類之間的誤增和漏分誤差分布,見圖2。由圖2和表2可知,北安市的耕地和林地面積所占比例較大且分布相對集中,CC數據耕地面積為3 433 km2,G30為3 933 km2,LU為2 972 km2,其中:G30數據耕地面積比CC數據高估14.6%,林地面積比CC數據低估27.3%;LU數據耕地低估13.4%,林地低估3.9%。梅河口市林地面積少于北安縣,林區和耕地分布混合度高、 交叉性強、 界限不清,CC數據中耕地面積為1 206 km2,G30為1 523 km2,LU為1 166 km2,其中:G30 耕地高估26.3%,林地低估49.4%;LU耕地低估3.3%,林地高估3.3%。龍江縣的林地面積比例較小,呈零星分布,CC數據中耕地面積為3 884 km2,G30為4 153 km2,LU為3 966 km2,其中:G30 耕地高估6.9%,林地低估71.9%;LU耕地高估2.1%,林地低估48.9%。在林地和耕地混合區域內,G30中林地錯分為耕地的面積大于LU,林地和耕地的結合度越大,耕地面積誤差越大。

圖2 CC-G30和CC-LU耕地與林地的分布及變異對比
3.3.2耕地與草地比較
選擇草地分布相對較多的北安市和克東縣分析草地和耕地的混淆情況,得到耕地和草地之間的誤增和漏分結果,見表2和圖3。在北安縣西部的耕地集中分布地區G30數據中耕地被漏分(耕地被劃分為草地),而在東部的林地集中分布區耕地誤增(草地被劃分為耕地)現象較多,相比于CC數據,G30數據中草地高估25.6%;LU數據與CC數據的比較中,北安縣存在少量的耕地漏分現象,低估約13.4%??藮|縣G30數據的草地比例也被高估,高估比例約為30.0%。從北安市和克東縣2縣(市)的草地和耕地的總體誤判情況來看,LU漏分現象超過G30,G30誤增超過LU。

圖3 CC-G30、CC-LU耕地與草地的分布及變異對比
3.3.3耕地與水域對比
分析龍江縣、梅河口市水域和耕地的混淆情況,得到耕地和水體之間的誤增和漏分結果,見表2和圖4。在G30數據中,龍江縣水域面積比CC數據水域面積低估73.8%,梅河口市低估51.3%。從分布情況看,耕地和水域的混淆主要集中在河道和水庫周邊,呈條帶狀分布。LU數據中,龍江縣水域面積比CC數據水域面積高估51.3%,梅河口市水域面積低估31.3%。在水域與耕地的誤判分析中,LU數據的誤增情況超過G30,而G30數據的漏分情況超過LU。

圖4 CC-G30、CC-LU耕地與水域的分布及變異對比
4結論
本研究利用較高空間分辨率的遙感解譯數據(CC)和兩種較低空間分辨率的地表覆蓋數據(G30、LU)進行了基于地類的疊加對比,對比結果表明:在地類的總體分類精度上,G30數據優于LU數據;在耕地一類的用戶精度評價中,LU數據的表現優于G30數據。在耕地的漏分和誤增的分析和對比中發現:在耕地連續均勻分布的區域,G30和LU兩種數據都對耕地具有較高的分類精度,耕地面積估算比較準確;在林地和耕地混合分布的區域,兩種數據都高估了耕地的面積;在耕地和草地、水域混合分布的區域,兩種數據中耕地面積往往被低估。
鑒于G30數據對耕地一類的驗證精度較高,其他地類的精度較低的特點,在東北地區以耕地為主且集中分布的地域進行耕地面積調查時可以使用G30數據,或者使用如G30數據研制單位采用的自動分類方法進行耕地的提取;在耕地、林地混雜分布地區,LU數據比G30數據的耕地分類精度更高,其耕地面積比G30更為可靠,在此類地區采用類似LU數據的人工參與分類的方法能提高分類的精度。
[參考文獻]
[1] 劉紀遠,鄧祥征.LUCC時空過程研究的方法進展[J].科學通報,2009,54(21):3251-3258.
[2] 劉紀遠,莊大方,張增祥,等.中國土地利用時空數據平臺建設及其支持下的相關研究[J].地球信息科學,2002,4(3):3-7.
[3] Russell G Congalton,Kass Green.Assessing the Accuracy of Remotely Sensed Data:Principles and Practices[M]. 2nd ed.Boca Raton:CRC Press,Taylor & Francis Group,2009,11(4):448-449.
[4] Rosenfield G H,Fitzpatrick-Lins K,Ling H S,et al. Sampling for thematic map accuracy testing[J].Photogrammetric Engineering & Remote Sensing,1982,48(1):131-137.
[5] Pontius R,Millones M.Death to Kappa:birth of quantity disagreement and allocation disagreement for accuracy assessment[J].International Journal of Remote Sensing,2011,32(15):4407-4429.
(責任編輯李楊楊)
[中圖分類號]S157;TP79
[文獻標識碼]A
[文章編號]1000-0941(2016)07-0061-05
[基金項目]水利部公益性行業科研專項經費項目(201501012)
[作者簡介]高燕(1972—),女,山東諸城市人,高級工程師,碩士,主要從事水土保持監測、規劃和科研方面的工作。
[收稿日期]2016-04-01
[關鍵詞]Globalland30-2010;LUCC-2010;高分辨率數據;耕地分布;漏分;誤增;東北黑土區