張雅杰,靳 銘,張 豐,孔雪松
(1.武漢大學資源與環境科學學院,武漢 430079;2.武漢大學遙感信息工程學院,武漢 430079)
農用地整治是對農用地及其利用方式的再組織與再優化的過程,包括開發、復墾、整理(高標準農田建設、中低產田改造)等措施,是實現耕地保護、生態安全保障的重要抓手。隨著中國進入增速換擋、發展動力轉換的新常態,農用地生產、生活及生態屬性均被賦予了更加豐富的時代內涵,因地制宜、因時制宜成為當下農用地整治的基本準則。因此,如何科學地確定整治工作的空間組織與工作時序,從而使整治工作有據可依、有序可循,成為迫切需要解決的問題。
在農用地整治推進的過程中,相繼有學者從社會經濟、生態等因子著手,對區域的適宜性條件、限制性因素等實施評價,并依據評價結果對整治區進行劃分。在農用地整治分區方法上,以往研究主要采用K-means算法、自組織映射神經網絡(Self-Organizing Feature Map, SOFM)等傳統方法來實現。隨著研究的進一步深入,國內外學者逐漸意識到傳統聚類算法存在易陷入局部最優等局限,并逐漸采用改進后的聚類算法來進行研究。Ertunc等在對農用地整治項目區內地價影響因素進行分析的基礎上,通過集成K-means、K-medoids、Fuzzy C-means三種算法對整治后的農用地價值進行評估。Xiao等系統分析湖北省土地利用條件等屬性差異,采用SOFM神經網路與層次聚類法(Hierarchical Clustering,HC)將湖北省分為7個整治區。毛祺等基于生態敏感性與生態系統服務,耦合SOFM神經網絡與支持向量機將鄂爾多斯市劃分為11個生態功能分區。相關研究通過使用改進后的算法對研究區的屬性空間進行分析,提升了研究的科學性。但仍存在以下問題:1)對于整治工作的時序差異研究仍需深化;2)忽略了地理要素由于位置相近而可能存在的顯著關聯性;3)聚類方案的質量有待識別。
本文針對當前研究所存在的不足,從農用地整治的空間組織和時序安排兩方面進行思考,綜合考慮聚類單元的生態敏感性、用地適宜性以及整治迫切性,利用兩級選擇性聚類集成的思路,在依據地理及屬性雙重空間構造混合距離的基礎上,利用層次聚類法、SOFM神經網絡、K-means聚類法3種算法生成方案庫。參考帕累托原理確定集成方案的數量,并利用質量指數對方案進行篩選,隨后依據優勝方案進行兩級聚類,形成農用地整治時空配置的分區方案。最后,針對每個分區在農用地整治的工作時序及整治重點兩方面給出了建議。從而為解決當前研究中所存在的不足提供一些方法,并為未來全域國土綜合整治的時空配置工作提供思路借鑒。
懷化市位于湖南省西部,下轄12個縣(市/區)及1個管委會,土地總面積27 572.54 km2,其中農用地占土地總面積的比例達90%以上。懷化市地處中亞熱帶川鄂湘黔氣候區和江南氣候區的過渡部位,境內雨量充沛、光溫條件較為優越、嚴寒酷暑期短。市域內地勢東西兩側高峻、南部突起,向中北部傾斜,地貌類型豐富,以中低山、丘陵為主。充沛的降雨與復雜的地形為土壤侵蝕提供了適宜的環境,為農業的發展設置了障礙。為解決生態安全、耕地保護與經濟發展間日益凸顯的矛盾。2006年以來,懷化市規劃了一系列農用地整治項目,總面積達5 952.10 hm,但由于缺乏科學統一的空間組織與時序計劃引導,項目存在類型單一、規模效益不顯著、空間分布零散的問題。綜合來看,懷化市的自然條件、農用地整治問題等在中國南部的農業生產大市中具有較強的典型性與代表性,以之為研究區,利于探究具有可移植性的地級市農用地整治思路。
研究數據包括土地利用數據、行政區矢量數據、土壤、植被、氣象數據、遙感影像數據、社會經濟數據。其中,土地利用遙感監測數據與行政區矢量數據來源于中國科學院資源環境科學與數據中心(https://www.resdc.cn/),水系矢量數據從第三次全國國土調查數據中提取;土壤數據集來源于國家冰川凍土沙漠科學數據中心(http://www.ncdc.ac.cn/portal/);氣溫與降雨站點數據來源于中國氣象數據網(https://data.cma.cn/),年均潛在蒸散發數據來源于CGIAR CSI數據集(https://cgiarcsi.community/);DEM數據從地理空間云(http://www.gscloud.cn/search)獲取,年度NDVI與植被類型數據來源于中國科學院資源環境科學與數據中心;社會經濟數據來源于《懷化統計年鑒》。
懷化市農用地利用問題表現為:沅陵縣等山區生態空間與生產空間的矛盾日益顯現,生態系統退化隱患較大;農業發展潛力有待進一步挖掘,區域農業生產的比較優勢未充分發揮;農用地整治的統籌性有待提升,整體效益一般;農用地整治的工程措施同質化嚴重,同時空間布局分散,規模效益不明顯。研究基于上述問題,結合懷化市農業發展的限制性因素,從空間及時間兩個維度構建指標體系。在此基礎上,將聚類單元的地理空間與屬性空間進行結合以構造混合距離。最后,采取兩級選擇性聚類集成方法實現農用地整治時空配置。詳細研究方法如下:
為全面解析農用地屬性,識別區域農業資源潛能及限制,在借鑒相關成果的基礎上,圍繞區域生態、用地條件與整治迫切程度,研究提出集成“生態敏感性-用地適宜性-整治迫切性”視角的農用地整治評價框架(圖1)。

圖1 集成“生態敏感性-用地適宜性-整治迫切性”視角的農用地整治解析 Fig.1 Analysis of agricultural land consolidation from the perspective of “Ecological sensitivity-Land suitability-Urgency”
生態敏感性指生態系統對自然環境變化和人類干擾的反應程度。研究從以下方面構建指標(表1):
1)地形條件:一般而言,坡度、高程越大,生態系統越容易受外力干擾而產生退化。同時,坡向是山地生態系統敏感程度分異的重要原因,向陽面的生態系統相對于背陰面更穩定。
2)地表水系:農業生產活動會對周圍的水文系統造成一定影響,且距離越近越易產生影響。
3)植被景觀:植被覆蓋情況的不同往往會致使其生態系統響應程度存在差異。本文借鑒劉思源等的研究成果,認為闊葉林敏感性大于針葉林,常綠林大于落葉林。而在植被類型相同時,植被覆蓋度較高的區域的生態敏感性更低。
用地適宜性指區域進行農業生產的適宜程度。充分借鑒前人研究,研究從以下方面構建指標(表2):
1)用地條件:光溫條件、水源涵養能力、用水便捷程度與土壤條件對農業發展起決定性作用。對于水源涵養,本文采用InVEST模型的Water yield模塊分析。用水便捷度以農用地(不含坑塘水面)和與之最近溝渠的距離的倒數來體現。
2)工程實施可行程度:基于科斯定理進行推論,利益各方人數越多,達成有效協議的困難程度越高。因此,較多的受償農民可能會增加項目推進難度。同時,低收入會增加受償群體尋租的可能性,從而阻礙項目推進。
整治迫切性指實施農用地整治的迫切程度。借鑒前人研究,從以下方面構建指標(表2):
1)整治驅動:運用InVEST模型的Habitat quality模塊計算生境質量。根據其計算過程,低值農用地距離生境脅迫源較近,生產條件退化隱患較大。同時,農用地破碎化與土壤侵蝕是懷化市農業發展的主要限制因素。此外,人均農用地面積是人地關系協調性的表征,在其他條件既定時,優先在用地緊張的區域補充農用地。
2)用地效率:農用地利用效率較低的區域可能存在規模性撂荒、生產設施不完備等情況。對于這些農用地,應及時整治,以保障土地資源的充分、高效利用。
各指標依據式(1)進行歸一化處理,并邀請11位專家對各指標的相對重要性程度進行打分形成判斷矩陣,依據判斷矩陣進行層次分析法運算,最終結果如表1與表2所示。

表1 生態敏感性指標體系 Table 1 Ecological sensitivity index system

表2 農用地整治時空配置指標體系 Table 2 Spatial-temporal allocation index system of agricultural land consolidation

式中x與′分別為歸一化前后的指標,與為相應指標的最大、最小值。
兩級選擇性聚類集成采用基本聚類算法形成聚類方案庫,依據質量指數在方案庫中選擇若干優勝方案進行第二級聚類。本文所使用的兩級選擇性聚類集成方法步驟如下:
1)構建基本聚類算法。此次研究根據算法原理,選擇層次聚類法、SOFM神經網絡以及K-means聚類三種算法,算法構建過程如表3所示。隨后對聚類單元的地理坐標及屬性空間各項指標分別進行歸一化處理;

表3 層次聚類法、SOFM神經網絡及K-means聚類算法偽代碼 Table 3 The pseudo-code of the hierarchical clustering method, SOFM neural network and K-means clustering algorithm
2)構造混合距離。根據地理學第一定律,相近的事物關聯性更加緊密。考慮到相近聚類單元在所構建的屬性空間以外可能存在著顯著性關聯,本文采用混合距離來衡量聚類單元之間的相似性。反映雙重空間的集合X定義如下:



3)運算3種基本聚類算法。隨機輸入屬性向量,基于混合距離衡量匹配點。在不同條件限制下,各基本算法進行有限次的迭代,最終生成第一重的若干聚類方案;
4)對第一重聚類方案進行篩選。本研究利用聚類的質量指數對各方案質量進行量化及排序,其計算過程如式(4)所示。隨后根據排序結果篩選出若干聚類方案;

式中quality(P)是聚類方案的質量指數,是所有聚類方 案數量,NMI(P,P)表示方案P、P之間的歸一化相互信息值(Normalized Mutual Information, NMI)。通過NMI值的計算,可比較不同簇中特定聚類單元的,從而進一步識別各聚類方案之間的交互性,其計算過程如下:


5)依據優勝方案對數據集進行第二級聚類。利用MATLAB R2021a設置循環條件,將具有最大數量相同聚類單元的兩個簇的交疊部分劃分為獨立的新簇,直至形成新的聚類成果。自動聚類過程結束后,依據屬性特征歸并相似性較大的簇。
如圖2所示,研究區三層屬性均具有顯著的空間異質特征,區域內部差異明顯;各屬性均呈現出一定的空間聚集性,但聚集的尺度與水平有所差異;屬性間的空間特征差異顯著,同時彼此之間無明確關聯性。即研究區的屬性空間呈現出較強的復雜性特征,在此條件下,簡單的分類手段已難以滿足配置要求,有必要開展進一步的研究。

圖2 懷化市農用地整治時空配置指標分布圖 Fig.2 Distribution of spatial-temporal allocation indicators for agricultural land consolidation in Huaihua City
將各聚類單元的中心點坐標、各評價指標的標準化值分別作為計算變差函數的地理、屬性空間變量。在此基礎上,利用軟件MATLAB R2021a來構建三種基本聚類算法。從理論上來講,依據聚類單元的相似性進行聚類所生成的簇數目在[2,-1](為聚類單元的總數)范圍時,聚類結果就有一定的意義。但出于對農用地整治工作實際需要、研究尺度等的考慮,此次研究將聚類數目限定在[7,11]范圍內。層次聚類法采用默認參數進行運算,SOFM神經網絡的初始權值為[0,1]的隨機數,地理空間變量及屬性空間變量的權重分別為0.4及0.6,基本學習速率為0.5,最大訓練步數的選擇要結合具體聚類數目下的聚類結果,選擇聚類結果開始穩定后的最大訓練步數。如在SOFM網絡聚類數目為8且其他參數既定的條件下,當訓練步數達到4 000時,聚類結果穩定下來。K-means聚類法除運算次數外均采用默認值,運算次數設置為各聚類數目下聚類結果穩定后的次數。通過運算,最終得到15個聚類方案,225個有效NMI值,如圖3所示。

圖3 聚類方案歸一化相互信息值(NMI值)與質量指數水平示意圖 Fig.3 Diagram of clustering scheme normalized mutual information (NMI) values and quality index levels
根據NMI值計算出各方案的質量指數,隨后將各方案按照對應的質量指數由大到小進行排序。參考帕累托原理,選擇前20%的聚類方案,篩選出聚類數目為8、10、11的層次聚類法的運算成果,如圖4所示。

圖4 依據質量指數篩選出的聚類方案 Fig.4 Clustering schemes filtered by quality index
對上述方案所生成的22個簇進行分析,將具有最大數量相同聚類單元的兩個簇的交疊部分劃分為一個分區。然后根據各分區的屬性特征將300個聚類單元分為近期重點整治區、近期適度整治區、中期重點整治區、中期適度整治區與遠期限制整治區5類,結果如圖5所示。

圖5 懷化市農用地整治選擇性聚類集成與時空配置結果圖 Fig.5 Results of selective cluster ensemble and Spatio-temporal allocation of agricultural land consolidation in Huaihua City
1)近期重點整治區主要分布于中方縣、芷江侗族自治縣,共包含36個鄉鎮,總面積為2 495.67 km2,占全市總面積的9.05%。該區生態敏感性較低、用地適宜性與整治迫切性較高。生態系統穩定、自然條件優越,利于農業發展,但也存在著農用地破碎化、土壤侵蝕等限制因素。未來應結合現行整治政策,以打造高效生產、適應市場的現代農業為目標,以開發補充耕地、農用地提質增量、工礦廢棄地復墾、高標準農田建設項目為主要內容進行項目布局。短期內可以結合優勢產業,進一步發掘當地農業潛力,建設農用地整治示范區,打造懷化市農業生產新高地。
2)近期適度整治區主要分布于會同縣、新晃侗族自治縣、溆浦縣和沅陵縣,共包含81個鄉鎮,總面積8 403.75 km2,占全市總面積的30.48%。該分區生態敏感性與用地適宜性適中,整治迫切性較高。自然條件優越,但土壤侵蝕程度較高帶來生態系統退化隱患。因此,該區域范圍內不適宜開展大規模的用地開發活動。未來應結合區域農業基礎,對保護區外的現狀農用地進行歸并、改造,提高農業生產效率,并采取綜合措施來減少這些區域的土壤侵蝕、地質災害隱患,促進土地利用與生態環境相協調。

表4 懷化市農用地整治分區屬性情況及面積 Table 4 Zoning properties and areas of agricultural land consolidation in Huaihua
3)中期重點整治區主要分布于溆浦縣、鶴城區、洪江市、洪江區,共包含80個鄉鎮、11個街道與1個轄村度假區,總面積為6 225.42 km2,占全市總面積的22.58%。該分區生態敏感性較低、用地適宜性較高、整治迫切性適中。生態系統穩定、自然條件優越、農業發展潛力較高。未來應以進一步改善農業生產條件,減少農業發展限制性因素為工作重點,開展大范圍的破碎土地歸并、高標準農田建設、土壤構型改良等農用地提質工程項目,增加農用地數量,提高其生產規模效益,進一步鞏固全域農業重心地位。
4)中期適度整治區主要分布于通道侗族自治縣,共包含21個鄉鎮、1個林場、1個農場,總面積為2 021.14 km,占全市總面積的7.33%。該分區生態敏感性、用地適宜性、整治迫切性均適中。該區的農用地整治應以“優化生態安全格局與農業生產條件并行”為重點,農用地的提質增量以保障當地生態安全為前提。總體而言,整治力度不宜過大,應結合當前農業發展格局,以現存問題為導向對生態敏感區以外區域的生產條件加以改善。除此之外,可在播陽農場等區域將農業發展與旅游觀光相結合,構建田園綜合體,并以部分收益投入到生態修復與保護中,在提高用地效益的前提下形成良性循環。
5)遠期限制整治區主要分布于靖州苗族侗族自治縣、芷江侗族自治縣、麻陽縣、沅陵縣,共包含68個鄉鎮,總面積為8 426.56 km,占全市總面積的30.56%。該分區生態敏感性較高、用地適宜性較低。在該區域實施農業活動的規模效益低、成本高昂且生態安全難以保障。即區域農業發展潛力不足,進行農用地整治的戰略意義不明顯。因此,不建議在該分區范圍內實施大規模的農用地擴張與建設活動。
為全面解析農用地屬性,研究基于“生態敏感性-用地適宜性-整治迫切性”的視角,結合懷化市用地問題與限制性因素,從時間與空間兩個維度構造評價體系。具體而言,用生態敏感性表征生態保護要求,用地適宜性表征農業生產潛力,對懷化市的農業生產的效益與限制性因素進行識別,從而為整治項目的重點內容與力度提供參考。同時出于行政管理的考慮,用整治迫切性指標為管理者對項目區的優先級劃分提供參考。未來研究可結合農用地整治的多目標化和差異化趨勢,進一步因地制宜地優化和完善評價指標體系。
在農用地整治時空配置的方法上,研究基于傳統聚類算法不兼顧地理空間、易陷入局部最優的問題提出了兩級選擇性聚類集成方法。通過構造兼顧屬性與地理空間的混合距離,充分考慮到相近地理要素的自相關性,從而能夠克服聚類成果集聚性不高的問題。項目區的集聚利于整治工程發揮規模效應,從而極大程度地降低整治成本。但項目區的劃分仍需以區域特征為依據,不應過分追求項目區連片而忽略部分區域的實際屬性,尤其是以行政區為單元進行聚類時,更要注重聚類成果對區域屬性的反映,否則會對決策者造成誤導。同時,新的聚類方法引入了質量指數,通過方案質量識別與優選的方式有效保障了聚類成果的質量,從而為農用地整治時空配置提供更加有效的方案。聚類過程的自動化也充分保障了研究成果的客觀性。但研究在以下方面還存在著進步空間:1)研究在對聚類方法的原理進行分析的基礎上,選用了學術界常用的三大聚類算法。如圖3所示,在懷化市農用地整治時空配置中,各聚類算法的質量指數差異較為明顯,這體現出了基本聚類算法的選擇上存在一定不確定性,但同時也說明了聚類集成策略的意義及方案比選的必要性;2)若要采取大規模計算的思路來進一步提高聚類方法的有效性,有必要找到方案庫容量、方案優選數量與聚類效果的相關性。在理論充足的前提下,可以通過進一步提高運算量來實現聚類質量的突破;3)通過對NMI值的衡量,質量指數能夠依據各簇間的相似性來剔除異常方案。未來的研究可以從更多的方面進行切入對方案質量進行檢驗。總體而言,實例研究驗證了兩級選擇性聚類集成的有效性,在未來的農用地整治等領域中,可以嘗試結合該方法對整治項目進行空間組織與時序安排。
本文綜合考慮生態敏感性、用地適宜性與農用地整治迫切性因素,分層構建了體現聚類單元農用地整治時空特征的指標體系,并基于兼顧地理、屬性雙重空間的混合距離,使用兩級選擇性聚類集成的方法進行農用地整治時空配置研究,在明確各分區特征的基礎上,結合區域發展需求提出農用地整治的重點方向及內容。
懷化市生態敏感性、用地適宜性與整治迫切性均具有顯著的空間異質特征,空間格局差異明顯,彼此之間無明確空間關聯性。在此條件下,如自然斷點等簡單分類方法已不能滿足配置需求,需進一步展開研究;通過兩級選擇性聚類集成的方法將懷化市300個聚類單元分為近期重點整治區、近期適度整治區、中期重點整治區、中期適度整治區、遠期限制整治區5個分區,面積分別為2 495.67、8 403.75、6 225.42、2 021.14、8 426.56 km,分別占全縣土地總面積的9.05%、30.48%、22.58%、7.33%、30.56%;不同算法之間質量指數存在著明顯的差異,這體現了聚類集成與方案優選的必要性;實例結果顯示,在聚類單元較多、屬性空間復雜的條件下,兩級選擇性聚類集成方法仍適用。并且因其基于地理與屬性雙重空間,同時具有兼容不同算法和識別聚類質量的優勢,相較于傳統聚類方法,其所提供的方案更具實踐價值。