周 浩, 陳竹書, 馮曉娟
(1.湖南師范大學 資源與環境科學學院, 湖南 長沙 410081;2.益陽市煙草專賣局, 湖南 益陽 413002; 3.嵩山少林武術職業學院, 河南 登封 452470)
耕地監測既是農作物產量估算、農業資源綜合利用基礎,又是政府部門對耕地利用與管理的依據[1]。遙感技術擁有信息豐富、覆蓋面廣、實用性強和可周期性獲取等特點[2-3],已成為當前對耕地監測的最主要手段。一方面受遙感影像空間分辨率、同物易譜和同譜異物等影響[4],實際存在的小地物(主要包括:溝渠、小徑、機耕道、簡易公路、墳地和池塘等)易被納入耕地[5],另一方面,由于部分小地物遙感影像的像元寬度遠大于實際寬度,耕地面積常被夸大[6]。因此,如何剔除小地物影響、實現凈耕地提取具有重要現實意義[7-8]。
國內外學者針對凈耕地提取做了大量工作,如運用實地抽樣手段開展區域小地物信息提取工作,進而間接提取凈耕地利用信息[9];探索如道路等線狀地物對實際耕地面積的影響機理,以提高耕地遙感監測精度[10-13];開展遙感影像對小地物實際寬度和解譯寬度影響的研究,通過扣除小地物實現農作物面積精準估算[1];運用算法技術來自動提取農田線狀工程地物信息,以實現耕地的精細化提取[14-15]。但縱觀現有研究,學者們多通過實地抽樣調查或結合高精度影像、航片來剔除小地物對耕地面積影響[16-19],可推廣性有限。如何在有限的數據條件下實現凈耕地面積提取顯得尤為重要。現代數理統計觀認為[8],客觀系統總是有關聯和有整體功能的,作為表征系統行為特征的數據,總是蘊涵著某種統計規律。中國實行國土用途管制及規劃管理制度,土地利用面積具有內生“灰色”規律,通過對土地利用面積“部分”已知信息的二次生成和挖掘,去認識和研究土地利用面積變化規律。當前已有相關學者注意到灰色系統理論應用于土地或耕地利用信息提取的可行性,如通過灰色關聯度模型分析耕地利用變化驅動因子并選用不同灰色系統模型定量模擬耕地需求量[9,16];運用灰色系統GM(1,1)模型預測和驗證區域有效耕地面積[8]。但值得注意的是,以上灰色系統模型應用研究中多存在灰色區間劃分偏主觀、缺乏圍繞凈旱地和凈水田提取的系統性方案等問題,不利于實際工作的推廣。
撓力河流域為中國重要商品糧生產基地,自21世紀初以來,隨著“兩江一湖”土地整治和高標準基本農田建設工程的實施,該流域耕地及其內部結構快速變化,田間道路、溝渠系統等發生了較大改變[20]。鑒于此,本文以撓力河流域作為凈耕地提取案例區,在基礎土地利用調查數據支持下,運用灰色系統理論來提取該流域的凈旱地和凈水田利用信息。
撓力河流域位于中國黑龍江省三江平原腹地,地理范圍為131°31′—134°10′ E,45°43′—47°45′ N,東南以完達山為界,東與烏蘇里江相接,流域面積約為2.49×106hm2(圖1)。撓力河流域歷經了多次大規模土地利用開發,耕地面積持續上升,呈現出“三山一水六分田”的土地利用特點。該流域耕地分為旱地和水田,水澆地面積極少,主要分布于內外七星河腹地、干流沿岸及友誼地區[20]。

圖1 撓力河流域地形及水系分布
基礎土地利用數據及道路、田間溝渠等小地物信息數據均獲取自當地自然資源部門所提供的土地利用變更調查矢量數據庫(2018年)。通過對流域境內的4縣(富錦縣、友誼縣、集賢縣和寶清縣)3區(寶山區、尖山區和四方臺區)數據庫的拼接、裁剪等處理,得到基礎耕地利用數據(即未進行耕地凈提取的初始耕地利用數據)及線狀地物信息;行政區劃、水系等基礎地理信息數據均來自于中國科學院資源環境科學數據中心(http:∥www.resdc.cn)。
區別于經典數理統計論,灰色系統理論把一切隨機變化過程視作一定范圍內變化的、與時間有關的灰色量及灰色過程,其研究對象為“貧”信息不確定性系統[21]。通過對數據一定方式處理,使其成為有規律的時間序列“模塊”數據,進而找出其“灰色量”變化規律。考慮到凈耕地原始斑塊面積的未知性,通過對非耕地斑塊(除耕地外的土地利用斑塊)面積的一次或多次累加處理以增強數據列的規律性,進而構建灰色系統模型來預測非耕地面積,將區域總面積減去非耕地面積即可得到凈耕地面積。同時,中國實行國土空間用途管制及規劃管理制度,土地利用面積表征著對應用地的開發程度及利用方式,除建設用地中特殊地塊外,部分建設項目由于其規模、性質等原因,占地面積較大,但從區域宏觀角度來看,該部分地塊面積比例較小,將其排除后,土地利用斑塊面積將呈較強的規律性特征。
基于此,提出凈耕地預測思路:①在土地利用變更調查數據支持下,提取非耕地斑塊面積信息,根據系統建模需要,對范圍內非耕地斑塊面積從大到小或從小到大進行排序;②斑塊面積區間的劃分影響著預測結果的準確性,通過建立和比較不同突變模型的分析結果,以確定面積突變奇點(對應為建筑項目用地或大片林地);③確定合適等額間距并對其范圍內的非耕地斑塊面積進行一次或多次累加處理,將得到規律性遞增的一組數據,選取不同階灰色預測模型或其他預測模型進行非耕地面積預測,最終確定面積預測模型;④根據非耕地面積數據來測算凈耕地面積,倘若不同預測模型的預測效果均較好,可綜合預測結果以提高預測精度。基于凈耕地系數數據,結合土地利用變更調查數據庫中溝渠、農村道路等線狀地物信息,對其進行空間信息加權處理,得到凈耕地二次空間分布數據。技術流程見圖2。

圖2 凈耕地預測技術流程
2.2.1 凈耕地系數 凈耕地系數是指單位面積空間內凈耕地面積占耕地毛面積的比例系數[8]。計算公式為:
(1)
式中:η為凈耕地系數;Ai為單位面積的耕地或耕地斑塊內凈耕地面積(hm2);Am為耕地毛面積(hm2);f為小地物類型;Af為第f種小地物的面積(hm2)。
2.2.2 突變檢測 突變是指變量從某一統計特性到另一個統計特性的急劇變化過程,一般通過檢驗均值、方差、回歸系數和事件發生概率等指數有無突然變化來判定[22]。土地利用斑塊面積突變是指面積較大的建筑項目用地或大片林地導致的由非耕地斑塊面積組成的序列數據統計特征急劇變化過程。考慮到需剔除的面積較大的非耕地斑塊數量較小,且與其他用地斑塊面積差異明顯,多種方法均可實現面積序列突變檢測。Pettitt法為經典的非參數檢驗方法,該方法利用秩序列來檢測數據序列突變點,當其秩處于最高水平,且通過對應的顯著性檢驗(p<0.05),則認為該秩所對應的點為數據序列突變點[23],本文選用該方法進行斑塊面積序列的突變點檢測。
2.2.3 灰色動態(GM)建模 灰色GM建模以灰色模塊理論為基礎,通過對無規律的原始數據處理,形成有規律“模塊”序列數據,其幾何意義為生成的序列數據在時間和數據二維平面上所形成的連續曲線與其橫坐標的總稱。由已知數據構成的模塊稱為白色模塊,由白色模塊外推到未來的模塊,即由預測值構成的模塊,稱為灰色模塊[21]。
由于數據多為隨機且無規律性,給定的原始數據列(公式2)不能直接用于建模,若將該原始數據列進行一次累加處理,可獲得新的數據列(公式3),新生成的數據列為單調增長曲線,增強了原始數據的規律性,弱化了隨機性。倘若累加次數越多,其規律性將更強,隨機性更弱,為建立合適的數理動態模型提供了必要中間信息。其中隨機量視作一定范圍內變化的灰色量,隨機過程為一定幅區和一定時區的灰色過程。通過灰數的生成、數據的不同取舍和不同級殘差模型的補充,來調整、修正和提高模型的精度。對于高階系統GM(n,h),可由一階的GM(1,h)模型建立狀態方程解決[22]。
(2)
(3)

對模型模擬精度驗證是研究模型可靠性的必要過程。當前常用的精度驗證方法是對模型進行后驗差檢驗,即先計算數據離差s1及殘差的離差s2,再計算后驗比c=s1/s2及小誤差概率p,根據c和p完成模型診斷,當p>0.95和c<0.35時,模型可靠。模型的構建及精度驗證均通過DPS 7.5軟件實現[24]。
如圖3所示,2018年,撓力河流域基礎耕地的總面積是1.48×106hm2,墾殖率達到62.61%。基礎旱地面積為9.29×105hm2,占耕地總面積的62.67%,且多位于流域的南部平原地區和內七星河上游地帶。基礎水田面積為5.53×105hm2,對應的水田化系數是37.33%,處于水田化中期階段。相對于旱地而言,水田多分布于地勢平坦、灌溉條件較好的地區(圖3):①撓力河干流的下游北岸,該地區以國營農場(主要為七星農場、創業農場、紅衛農場和勝利農場)為主,農業現代化程度較高;②內外七星河流域腹地及友誼縣境內,該地區水田斑塊破碎,家庭農場和農戶個體為主要的水田利用管理主體;③撓力河干流的中段東岸,該地區為八五二和八五三國營農場所在地,坡度、灌溉條件較好。

圖3 撓力河流域基礎耕地空間分布特征
3.2.1 突變檢測 對非水田斑塊(除了水田的土地利用斑塊)和非旱地斑塊(除了旱地的土地利用斑塊)面積按從小到大順序排列以構造對應面積數據序列,采用Pettitt突變檢測法進行非旱地和非水田斑塊面積的突變檢測。結果顯示:①撓力河流域非旱地斑塊數為19 813,并于第19 632位序發生有效突變,且p<0.05,具有統計學上的意義,對應的斑塊面積為2.01×102hm2;②非水田斑塊對應的斑塊數為21 568,在第20 958位序發生突變,p<0.05,對應的斑塊面積為2.00×102hm2。


表1 撓力河流域非旱地斑塊的分區段面積統計
基礎非旱地和非水田面積區間的統計規律性弱,巨大斑塊(位于1區間段的非旱地和非水田斑塊)多位于流域南部、東南部以及東部地區,一般為山地丘陵區的連片林地以及干流周邊耕地地塊,斑塊面積大(非旱地和非水田的1區間段面積分別占流域總面積的37.33%和71.06%),第8和第10區間段的斑塊面積也較大(表2和圖4)。

表2 撓力河流域非水田斑塊的分區段面積統計

圖4 撓力河流域土地利用斑塊面積變化特征
對各區間段斑塊面積進行一次累加處理,數據集規律性特征顯著增強(圖5)。因此,采用不同預測模型進行凈耕地面積預測。

圖5 撓力河流域土地利用斑塊面積累加特征
3.3.1 灰色系統預測 對累加處理后的區間數據進行單變量GM建模。但由于模型階數的不同,導致預測精度存在差別,通過比較不同灰階預測精度,確定最優灰色系統預測模型以進行非旱地和非水田面積預測。對于高階灰色預測模型GM(1,N)而言,數據樣本數偏少(10個),預測可信度差。因此選用GM(1,1)和GM(2,1)模型來進行非旱地和非水田的面積灰色預測。

3.3.2 其他擬合預測 根據累加數據序列走勢(圖5),分別采用一元線性預測、二元線性預測和非線性預測中指數曲線預測方法對撓力河流域非旱地和非水田的斑塊面積進行研究,并對比驗證不同趨勢預測方法的精度(表3)。預測結果顯示,線性預測和指數曲線預測方法均具有較高的可信度。非旱地面積預測的決定系數均超過0.85,其中二元線性預測的決定系數達到0.96,預測方程為y=(1.24×107)x2+(1.33×107)x+(1.31×1010),指數曲線預測決定系數為0.89,精度偏低;非水田的線性和指數曲線預測方法也具有較高的預測精度,其中二元線性預測精度最高,對應預測方程為y=(1.36×107)x2-(5.58×106)x+(1.98×1010),R2=0.97。因此,選用二元線性預測法進行非旱地和非水田面積趨勢預測。

表3 撓力河流域非旱地和非水田趨勢測算對比特征
3.4.1 凈耕地面積預測 從理論上來講,非旱地和非水田面積是灰色系統的N值無限趨近于11或趨勢預測的x值無線趨近于0時的模型預測值。當GM(1,1)的t值無限趨近于11時,非旱地和非水田面積預測值分別為1 310 956.63 hm2和1 980 505.34 hm2。當多項式預測法的x值無限趨近于0時,非旱地和非水田的趨勢預測值分別為1 311 821.13 hm2和1 982 083.22 hm2。考慮到GM(1,1)和多項式預測法預測精度均較高,綜合二者結果將會有效提高凈耕地面積預測精度,取二者平均值作為非旱地和非水田面積的預測結果,即分別是1 311 388.88 hm2和1 981 294.28 hm2。
3.4.2 預測結果驗證 土地利用變更調查數據中撓力河流域總面積為2 368 135.35 hm2,其中達到圖4標準的所有非旱地面積為1 285 957.70 hm2,非水田面積1 973 681.32 hm2,對應的旱地和水田面積依次為1 082 177.64 hm2和394 454.03 hm2,而預測得到的非旱地和非水田面積依次為1 311 388.88 hm2和1 981 294.28 hm2,凈旱地和凈水田面積為1 056 746.47 hm2和386 841.07 hm2,對應的凈旱地系數和凈水田系數分別是97.65%和98.07%。撓力河流域位于三江平原腹地,境內墾區與農區并存,墾區內小徑、簡易公路等地物信息的空間分布密度低,且其水田分布率顯著高于農區,即對應的凈面積系數應高于旱地,與預測結果相符;流域境內墾區的耕地斑塊規整,其田間溝渠面積為25 102.74 hm2,占耕地和田間溝渠總面積的1.67%,但倘若考慮其他田間信息影像,凈耕地系數應低于98.33%,而預測的凈耕地系數均值為97.91%,預測結果與實際情形基本相符。
在排除面積較大的特殊地塊下,土地利用斑塊面積存在“灰色”特點,可通過等額面積區間非耕地斑塊面積的一次或多次累加處理,以增強數據序列的數理回歸特征,進而提取凈耕地面積。本文以撓力河流域為研究區,在非旱地和非水田的斑塊面積區間Pettitt突變檢測基礎上,劃分合適的區間段以進行灰色模擬預測和多方法趨勢擬合,最終預測流域旱地和水田的凈面積依次為1 056 746.47 hm2和386 841.07 hm2,對應的凈旱地系數和凈水田系數分別是97.65%和98.07%,預測結果與實際情形基本相符。因此,灰色理論假設可應用于旱地和水田面積精準提取,能較好地模擬凈旱地和凈水田面積信息,進而確定對應凈旱地系數和凈水田系數。
數量和空間管理是國土空間管理的戰略方向。灰色系統理論能夠較好地實現凈耕地面積提取目標,但由于小地物尚未達到上圖標準,凈耕地的空間信息表達存在困難。本文僅從面積數值上對凈耕地利用信息進行預測研究。但對于溝渠、田間道路等線狀地物密度高的地區而言,其小地物信息更為豐富,因此可嘗試結合土地利用變更調查數據庫中現有道路、田間溝渠等數據信息來對凈耕地分布信息間接表達,以進行耕地精細化研究。如在柵格尺度下來計算線狀地物的空間密度,對該密度信息進行min-max標準化處理,然后運用柵格圖層疊加算法,在保證空間化的凈旱地系數和凈水田系數均值不變前提下,實現凈耕地系數空間表達,然后采用自然裂點分級法劃分凈耕地系數程度等級,以探索凈耕地的空間分布特點。
《土地利用現狀分類》中耕地一般包括南方寬度<1.0 m,北方寬度<2.0 m固定的溝、渠、路和地坎(埂)等有機組成部分,然而傳統實地抽樣手段多難以準確區分上述耕地有機組成部分。本文提出的基于灰色系統理論凈耕地提取思路,通過預測其他非耕地面積來間接預測凈耕地面積,能夠有效解決上述問題。同時,本文基于現有土地利用變更調查數據庫中耕地數量及空間分布特征,來精細提取凈耕地面積信息,但對應于土地利用調查中存在小地物易納入耕地的情形,其他非耕地調查中也存在小片耕地被納入非耕地情形,后續可配合抽樣調查以進一步完善凈耕地提取的研究角度和思路。