陳國平,林伊琳,趙俊三,袁 磊,吳曉偉,李強軍
(1.昆明理工大學國土資源工程學院,昆明 650093;2.昆明冶金高等專科學校測繪學院,昆明 650033;3.云南師范大學地理學部,昆明 650500;4.云南省地礦測繪院有限公司,昆明 650218)
【研究意義】土地利用/土地覆被變化(LUCC)研究是國內外全球變化研究的重點領域之一[1]。其中“開發新的LUCC建模方法和模擬模型”,使LUCC模型能夠更好地被使用,并與其它模型建立聯系,是LUCC科學計劃的主要任務之一,也是土地利用科學研究的重點。土地利用格局變化及動態模擬研究是當前土地科學、地理學等學科研究的熱點問題,也是認識土地利用格局與過程的重要技術手段[2]。【前人研究進展】目前,國內外在土地利用模擬模型探索方面[3]:一是基于計量統計及模型相結合的方法[4-5],二是預先設定規則和情景目標(模式)[6-8],而后構建多情景模型進行多情景模擬。在理論、方法、實踐應用等方面取得了一系列新進展,呈現從單一的非空間模型向非空間模型和空間模型融合演進及功能和作用向多樣化發展的特點。常見的有經驗統計模型、元胞自動機(CA)模型、CLUE/CLUE-S模型、系統動力學(SD)模型和多智能體(MAS)模型等。上述模型多以多元回歸及模擬仿真為基礎,利用經驗概率模擬土地利用空間格局情況,關注于空間全局特征,空間尺度多側重于單一尺度。盡管部分學者已經意識到尺度問題對土地利用研究的重要性,但迄今在方法和實例研究上尚未有實質性突破[9]。【本研究切入點】土地利用的形成受自然、經濟、生態、社會等多種復雜因素的影響,是一種動態演變的過程,具有高度的尺度依賴性、尺度耦合性和非平穩性特征,其形態和狀態可在多種時空尺度上變化[10]。尺度選擇的差異將會對所建立模型的模擬結果有很大的影響,此外,模型在表達局部格局及驅動力因子局部特征方面有一定的局限性,所以在構建多尺度土地利用格局模型時須考慮其局部空間異質性和空間驅動因素的復雜性[11]。此外,基于時空尺度的相關性是自然界存在秩序、格局和多樣性的根本原因[12]。現有土地利用模擬研究大多是運用數學模型,未能定量揭示土地利用格局的尺度效應及影響程度。此外,進行空間分析時未顧及土地利用及驅動因子的局部特征和非平穩性特征,掩蓋了數據內部的自相關特征。【擬解決的關鍵問題】長期以來,耕地保護是中國國民經濟任務的重要內容[13]。鑒于耕地特殊的地位和重要的作用,本文以滇中城市群耕地作為研究對象,通過分析空間多尺度下耕地空間格局的整體和局部聚類特性,構建基于空間自回歸和地理加權回歸的耕地預測模型,對其精度進行對比分析,從而選出精度更高的耕地模擬模型,在此基礎上對現有模型進行改進和優化,以提高模型的尺度適用性和土地空間布局模擬的準確度。
滇中城市群是國家重點培育的19個城市群之一[14],聚集全省主要的生產要素和經濟規模,是最能展示云南繁榮和實力的地區,是帶動全省跨越式發展的強大引擎。2019年城市群GDP 12320.66億元,占全省GDP的53.05%;人口1813.94萬人,占全省總人口的37.56%。
2019年土地利用分類數據來源于土地變更調查制圖綜合數據;高程數據通過SRTM 30 m分辨率的DEM加工得到[13];人口、社會經濟發展等數據來源于歷年《云南省統計年鑒》。
由于數據來源廣泛,數據格式、坐標系及尺度等存在差異。以2019年土地變更調查數據為基礎,采用數據同化技術,將多源數據進行處理[13],如距離數據通過GIS空間分析得到,高程、坡度、坡向通過DEM數據計算,各社會經濟因子進行柵格化處理。
研究尺度不同,研究對象細節程度也不同,進而導致不同的研究結果[15-16]。本研究參考文獻[17]的最優樣方尺寸公式:Q=2A/n(Q為樣方面積,A為研究區面積,n為研究區點的數量),同時參考前人[18-19]在研究面積和尺度選擇上的比例關系,設定500 m×500 m作為基本研究尺度,運用GIS軟件把土地利用數據轉換到研究所需的1、5、10、20、30 km 5種柵格尺度。
1.3.1 空間自相關 空間相關性是根據位置相似性和屬性相似性的匹配情況來分析空間單元在空間上的分布特征[20]。倘若鄰近位置上的數值相似,則呈正空間自相關;數值不相似,則為負空間自相關。本研究涉及的方法包括全局 Moran’sI指數、局部Moran’sI指數、局部G指數和Moran散點圖[13]。
全局空間自相關。全局空間自相關檢驗的是空間鄰接或鄰近的區域單元屬性值空間相關性存在與否[21]。表達式如下:
(1)

局部空間自相關。由于研究范圍內不同的空間單元與鄰域在空間自相關水平上存在一定差異,全局評估不能確切指出聚集或異常發生的具體空間位置[22-23]。為彌補這一缺陷,就必須進行局部空間自相關分析。其方法主要有空間聯系的G統計量[15]、局部指標(LISA)[16]和Moran散點圖[17]3種。
(1)空間聯系的局部指標。空間聯系的局部指標(Local indicators of spatial association,LISA),用以評價觀測單元屬性值與周邊單元屬性值的相近或差異程度。LISA包括局部Moran指數和局部Geary指數,局部Moran指數表達式為:
(2)

(2)Moran散點圖。Moran散點圖可反映空間位置屬性局部自相關性[22],被用來表達局部區域內存在集中聚集或異常特征情況。以4個象限的坐標形式展現,即:第一象限高高聚集(HH),第二象限高低異常(HL),第三象限低低聚集(LL),第四象限低高異常(LH),以表征區域單元與其鄰居之間4種聚集類型的局部空間聯系形式。
1.3.2 空間自回歸模型 Anselin根據解釋變量與因變量之間的空間相關性,得出次序空間線性回歸方程的通用形式[11]:
(3)
式中,yi、xik和εi分別表示因變量、自變量和隨機誤差部分,β0是模型的常數,βk是第k個自變量的回歸系數。
1.3.3 地理加權回歸模型 地理加權回歸(Geographic weighted regression,GWR)由英國地理統計學家Fortheringham提出。該模型考慮了觀測值所存在的較為顯著的空間相關特征和不同影響因素對因變量的影響在空間上的不同,通過使用GWR模型能獲得更高的準確率和更好的擬合優度[24-25]。其模型表達式為:
(4)
式中,(μi,νi)為第i個樣本點的空間位置坐標,βk是隨著空間位置變化的回歸系數,εi是誤差估計項的標準離差。
2.1.1 耕地全局特性整體聚類分析 運用GeoDa軟件和GIS空間分析工具,計算1、5、10、20和30 km 5種尺度下耕地和16個驅動力因子的空間自相關系數Moran’sI值(表1),發現均是隨權重距離的增大而逐漸變小,并且除了坡向、距公路距離和距水系距離3個驅動因子表現出較弱的空間自相關性外,其他13個驅動因子均表現出較強的空間自相關性。表明:①耕地空間格局及其驅動因子具有空間非平穩性特征,空間地理位置對各因子有較大影響;②權重距離越小,空間依賴性越好,權重距離增大,空間異質性加強,且該關系在5種空間尺度下呈高度一致性。

表1 研究區耕地及驅動因子多尺度空間自相關系數Moran’s I
通過對比不同驅動因子在不同空間同尺度下的系數值發現,耕地與高程、坡度、坡向3個因子隨空間尺度的增大而增大。由于空間自相關系數表征的是空間域中某位置上的變量與其鄰近位置上同一變量的相似性,對于某些特定的空間信息,其本身存在一定的空間依賴性,選擇不同的空間尺度對其進行平滑處理,當空間尺度越大時,其融合的信息相對就越多,與鄰近變量的相似性則越大,相似系數也越大。此外,距公路、鐵路、水域的距離、總人口等13個因子則隨著尺度的增大而減小,是因為這些影響因子的空間信息主要受位置信息與另一種變量差值的影響,與尺度變化無關,但與實際的信息差距會越來越大,從而導致其所反映的空間相關系數越小。研究說明:在進行整體聚類分析時,權重值及空間尺度是影響聚類結果的重要因素。因此,有必要進行耕地空間結構和驅動因素的區域特性局部聚類分析。
2.1.2 耕地局部聚類分析 通過G局部統計指數對耕地及驅動力因子區域特性的局部聚類進行檢驗分析,如圖1的LISA集聚圖顯示(注:1 km的格網過于密集,由于分辨率問題,導致格網邊界與研究結果顯示效果不佳,故隱藏該尺度邊界,下同),各尺度下耕地集聚區域呈現一定的相似性,高—高集聚區域多集中分布于研究區的中部、南部和東部,西部和西北部耕地分布較少,呈現低—低聚集特征,且研究區的邊緣存在少量“孤島”現象。雖然隨著空間尺度變化耕地集聚區域的整體特性呈現較高一致性,但具體到空間位置及細節表達程度則存在一定的差異。總體上來看,尺度越大,集聚性越差,顯著集聚的數量越少,其局部空間差異性越不明顯;反之尺度越小,集聚性越明顯,顯著集聚數量越多,其局部空間差異性越顯著。

灰色、白色:不顯著集聚區;綠色:低—高集聚區;紅色:高—高集聚區;藍色:低—低集聚區;淡黃色:高—低集聚區。下同
此外,選擇坡度作為研究對象來說明耕地驅動因素的局部聚類圖特征(圖2)。研究區域屬高原山區,其北部、西部和西北部以山地為主,坡度較為陡峭,圖中表現為紅色集聚區域;中部和東部以壩區為主,地勢相對平坦,坡度平緩,圖中表現為藍色聚集地區。與耕地的空間分布格局對比分析,明顯發現坡度的空間分布格局及尺度特征與耕地的空間分布格局及尺度特征相關性及相似性均較高。不同的地理位置聚集區域呈現空間特征各異的特點,表明坡度空間分布特征具有一定的空間異質性。隨著空間尺度的變化,不同空間尺度坡度分辨率(粒度)隨之發生變化,變化狀況與空間多尺度耕地空間特征聚類情況相似。尺度與分辨率呈反比關系,尺度越小,細節表征越詳細,空間地理位置給出的信息也就越準確。

圖2 多尺度坡度空間特征局部聚類分布
通過前述分析,坡向、距公路距離、距水系距離空間自相關性不明顯,剔除這3個因子后,分別建立研究區耕地時空演變的經典線性回歸模型以及基于空間自回歸的空間滯后模型(Spatial lag)和空間誤差模型(Spatial error),并采用標準誤差(Std.error)、t值(t-statistic)、P值(Probability)以及LIK(Log likelihood,對數似然估計值)、赤池信息準則(Akaike info criterion,AIC)、施瓦茨信息準則(Schwarz criterion,SC)等參數進行結果對比分析。
2.2.1 OLS回歸模型 在最小二乘法模型中,發現人均GDP、人口密度和人均耕地3個變量不顯著(P>0.05),剔除這些變量后,建立耕地OLS模型(表2)。

表2 研究區1 km尺度耕地最小二乘法模型
從t值可以看出,對研究區耕地格局影響最顯著的是坡度、距村莊距離、距鐵路距離等因子,影響較小的有高程、距城鎮距離、農民人均GDP等因子。
采用同樣的方法建立5、10、20、30 km尺度上耕地OLS模型,結果如下:5 km尺度R2= 0.424 526,LIK=661.335;10 km尺度R2= 0.482 097,LIK= 510.390;20 km尺度R2=0.576 697,LIK=203.302;30 km尺度R2=0.550 092,LIK=94.276。用R2作為評價OLS回歸模型的擬合度指標,發現R2值在20 km尺度上最大。若采用LIK作為評價指標,1 km尺度的OLS模型要明顯優于其他尺度。
2.2.2 空間滯后模型 經驗證,在空間滯后模型中,距城鎮距離、總人口、農業人口、人均GDP、人口密度等5個因子變量不顯著,剔除這5個變量后,建立研究區耕地空間滯后模型(表3)。

表3 研究區1 km尺度耕地空間滯后模型
采用同樣的方法在5、10、20、30 km尺度上建立耕地空間滯后模型,結果顯示:5 km尺度R2=0.587 329,LIK=744.321;10 km尺度R2= 0.616 045,LIK= 604.616;20 km尺度R2=0.663 959,LIK=220.018;30 km尺度R2=0.671 084,LIK=104.564。發現若采用R2評價,30 km尺度最優;采用LIK評價,1 km尺度最優。
2.2.3 空間誤差模型 同理,刪除到城鎮距離、總人口、農業人口、人均GDP、人口密度、人均耕地等6個不顯著因子變量后,建立研究區耕地空間誤差模型(表4)。
采用同樣的方法建立5、10、20、30 km尺度耕地空間誤差模型,5 km尺度R2= 0.626 523,LIK= 860.007 658;10 km尺度R2= 0.649 617,LIK= 627.590 531;20 km尺度R2=0.693 935,LIK=224.320 452;30 km尺度R2=0.649 589,LIK=100.760 601。可見,空間誤差模型的擬合度評價與空間滯后模型類似,說明若采用R2評價,20 km尺度最優;采用LIK評價,1 km尺度最優。
對空間多尺度下所構建模型的相關參數的驅動因子的回歸系數、標準誤差、t值、z值及P值分析(表2、表4),發現16個影響因子中有13個驅動因子在OLS模型中通過了顯著性檢驗,空間滯后模型有11個因子通過顯著性檢驗,空間誤差模型則有10個因子通過顯著性檢驗。說明本研究所選取的影響因子對研究區耕地空間格局的分布具有一定的影響力。總體來看,空間誤差模型對驅動因子的差異性變化更具敏感性,其次是空間滯后模型,再次是OLS模型。通過分析各驅動因子回歸系數發現,2個模型中除距村莊距離、平均坡向、農業人口、距農村道路4個因子呈現正相關外,其余因子均呈負相關。同時除常數項外,從3個模型的驅動因素的絕對值大小可以看出地形因素和人類活動對耕地的格局形成具有較大影響力。

表4 研究區1 km尺度耕地空間誤差模型
同時還發現,3個模型中平均坡度均為負值,且在OLS和誤差模型中絕對值均為最大,是因為耕地分布在坡度較小的區域,越平緩越適宜耕地作物的種植,但也易被人類開發。
通過地理GWR可以更好地得到地類在不同地理位置的擬合情況,并且可以得知各影響因素在不同位置的權重[11]。表5和圖3是空間多尺度GWR模型模擬的耕地空間分布情況。耕地的概率大部分集中于0%~30%。
從表5和圖3可以明顯看出,耕地主要分布在滇中中部以東地區,而西北和西南分布較少,基于GWR模型模擬出的5種尺度下耕地空間分布總體狀況和實際情況一致。概率分布介于31%~45%時,模擬概率大于實際概率,并隨著尺度的變大而增加,說明在該概率區間模擬的耕地情況在一定程度上增大了耕地分布概率,提高了耕地的占有面積;當實際概率介于46%~60%和61%~100%時,模擬概率小于實際概率,并隨尺度的變大而減小,說明模擬的耕地情況降低了耕地分布概率,從而降低了耕地的占有面積。綜合分析得出,帶寬隨空間尺度的增大而增大,且GWR模型的模擬概率也會變大,而相對耕地圖斑的空間分辨率則顯著降低。

圖3 研究區多尺度GWR模型耕地空間分布概率
2.4.1 擬合優度對比 從表2及表5計算可以看出,回歸系數最大的是空間誤差模型,其次是OLS,最后是空間滯后模型,其原因是空間滯后模型的一部分預測值是基于空間自回歸進行的。

表5 研究區多尺度GWR模型耕地空間分布概率對比
傳統典型線性回歸模型習慣使用R2來作為擬合優度的評價指標。但對于空間自回歸模型可能并不適合,是因為空間自回歸模型輸出的值是一個偽的R2值[26]。目前,常用LIK、AIC、SC 3個指標來評價空間自回歸模型的擬合優度(表6)。

表6 空間多尺度耕地擬合優度指標對比
從表6中可以看出,同一尺度下空間誤差模型的LIK值最大,而AIC和SC值較小;在所有尺度中,1 km尺度下LIK值最大,且AIC和SC值較小,即LIK值隨著尺度增大而減小、AIC和SC值隨著尺度減小而增大。由此,表明空間誤差模型的擬合度最高。總體看基于空間自回歸模型的解釋能力比典型線性回歸模型(OLS)要強。
對空間多尺度空間自回歸模型和GWR模型模擬的參數進行對比,分析各種模型的優劣及尺度規律(表7)。
根據表7,從R2、AIC和殘差平方和3個模型參數對空間多尺度模型進行對比分析。
(1)R2為回歸模型所涵蓋的因變量方差的比例,值越大越好。通過表7可以看出,各模型在同一尺度,其大小順序為:GWR模型>空間誤差模型>空間滯后模型>OLS回歸模型,且整體上隨尺度的增大而變大。

表7 空間自回歸模型和GWR模型模擬參數對比
(2)AIC值越小,表示模型反映預測數據的效果越好,越大則效果越差。從表7可以看出,在1、5、10 km尺度AIC排序為:OLS模型>GWR模型>空間滯后模型>空間誤差模型,在20、30 km尺度,AIC排序為:OLS模型>空間滯后模型>空間誤差模型>GWR模型。即在1、5和10 km尺度上,空間誤差模型模擬效果最好,在20和30 km尺度上,GWR模型最佳。分析還發現各模型的AIC值均隨著尺度變大而增大。
(3)模型的模擬精度優劣取決于殘差平方和、實際值與測量值之間的誤差的平方和,表現為其值越小模型越好,反之,越大說明模型越差。從表7可以發現以下規律:各模型均隨尺度的增大,其殘差平方和趨于減小;在10和30 km尺度,殘差平方和的順序為:OLS模型<空間滯后模型<空間誤差模型 總體上看,隨著尺度增大,數值趨于平滑,模擬擬合優度會提高,但也會出現實際位置信息與所構建模型時使用的數據有較大差異,即殘差平方和出現增大趨勢[11]。 2.4.2 殘差空間自相關性對比 從各模型殘差的空間自相關性來看,OLS模型的殘差具有顯著的空間自相關性,空間滯后模型和空間誤差模型殘差隨距離的增加表現出空間自相關性漸趨消失。此外,相對來說GWR模型殘差要優于空間誤差模型和空間滯后模型(圖4)。因此,GWR模型最優。 圖4 各模型殘差的空間自相關 2.4.3 影響因子數量及空間尺度對比 土地利用格局具有尺度依懶性,其類型及驅動因子具有空間自相關特征。經分析研究區4種耕地模型在空間多尺度上其影響因子(表8)有以下特征。 表8 研究區耕地模型在不同尺度影響因子數量對比 (1)任意尺度下,耕地均呈顯著狀態(P>0.05),說明耕地分布具有空間自相關性,非離散隨機分布。 (2)同一尺度下,各耕地模型中影響因子變量個數從多到少依次為OLS、空間滯后模型、空間誤差模型、GWR,整體上經典線性回歸模型的因子個數要多于空間回歸模型和地理加權回歸模型。 (3)不同尺度下,同一耕地模型其影響因子變量個數隨尺度變大而趨于減少,且空間滯后模型和空間誤差模型的系數也符合該規律。 (4)相同耕地模型在不同尺度下,或者是相同尺度不同耕地模型,它們的影響因子變量差異較大。此外,相同尺度下,不同的耕地模型有共同的影響因子,總體上隨尺度增大,相同影響變量在減少。如1 km尺度,共同的驅動因素有:平均高程、平均坡度、平均坡向、距公路距離、距鐵路距離、距農村道路、距溝渠距離、距水系距離、距村莊距離、農民人均GDP,說明在此尺度下,地形因素、交通條件及水源條件是耕地分布的主要影響因素;5 km尺度中,有6個共同因子,分別為:平均坡度、距公路距離、距鐵路距離、距溝渠距離、距村莊距離及農民人均GDP;10 km尺度中,有平均坡度、距公路距離及距溝渠距離3個共同因子;20和30 km尺度,各模型僅有平均坡度1個相同的驅動變量。 上述特點可能與耕地分布的空間格局及其規模大小有關。平均坡度是在所有尺度中唯一的共同變量,說明研究區耕地的分布格局受坡度影響最為顯著,這也是高原山區地形破碎的特征所決定的。 從驅動因子選取來看,OLS模型、空間滯后模型、空間誤差模型所使用因變量及驅動因子自變量數據是以整體為研究主體,關注于全局,構建的全局模型所含的信息量較大,模型的擬合度對整體就會呈現較好效果。GWR模型則以局部為研究主體,關注于局部,致使模型的擬合優度可能不是太高,但較好地顧及了土地利用類型及驅動因子的局部特征,可以更好地表現出耕地空間分布的空間多尺度特征、局部非平穩性和空間格局分異特征。綜合以上分析,模型的優劣度總體上對比應為:GWR模型最優,空間誤差模型次之,再次是空間滯后模型,OLS模型最劣。 土地利用/覆蓋變化(LUCC)是地表綜合集成研究的學科基礎和前沿領域[27],在信息獲取、數據處理、驅動力分析和模型建立等方面取得了一系列豐碩成果[28]。但LUCC是一個復雜的系統工程,對其模型及驅動因子的研究和辨識一直是研究的重點和熱點,其模型研究存在數據可靠性差、尺度綜合欠缺和模型校驗簡單等方面的問題[29]。本研究立足于選擇不同的模型來探討耕地演變過程中的空間分布特征及驅動因子,由于不同時空耕地分布及演化的驅動因子亦不相同,不但受自然地形、社會經濟、國家及當地政策影響,還受民族文化、宗教習俗等其他因素制約,而一些因素很難進行量化反映,且隨著時間的變化,部分因素作用可能會發生相互轉移,因此運用大數據挖掘技術來增強和細化影響因子對于模型的構建具有重要的作用。研究表明,不同的研究尺度對于模型的構建以及耕地的模擬和預測精度均有影響,選擇最佳尺度來真實反映耕地特征具有重要的作用,為此構建多尺度多層次時空動態模型是下一步研究的方向和重點。 此外,LUCC、生態系統服務與人類福祉之間存在多層次的復雜非線性關系,且受多種因素影響[30]。LUCC及耕地模型的研究須支撐國土空間規劃、“三線劃定”和國家的糧食安全戰略需要。未來應借鑒可持續科學發展框架,運用大數據挖掘、智能計算等新興技術,構建多目標協同的智能算法模型,為耕地保護和國家政策的制定提供完善的理論依據和技術支持,實現耕地數量質量總體動態平衡的目標。 文章以具有典型代表意義的高原山區土地演變相對劇烈的滇中城市群耕地為研究對象,分析耕地分布及驅動因子的空間相關性,對耕地模型進行精度對比。 (1)對1、5、10、20和30 km 5種尺度和16個驅動力因子進行空間自相關分析。發現:多尺度土地利用格局及驅動因素均存在空間自相關性,耕地空間格局及其驅動因子具有空間非平穩性;權重距離較小,呈現出的空間依賴性較好,隨著權重距離的增加表現出較強的空間異質性。隨空間尺度變化耕地集聚區域的整體特性呈現較高一致性,但具體到空間位置及細節表達程度則存在一定的差異。尺度越大,集聚性越差,越不明顯;反之隨著尺度變小,集聚性越明顯,其局部空間差異性越顯著。 (2)從R2、AIC和殘差平方和3個模型參數對空間多尺度模型進行對比分析。發現:基于R2參數對比,各模型在同一尺度,GWR模型精度高,OLS回歸模型精度最低,且整體上隨尺度的增大而變大;基于AIC參數對比,1、5和10 km尺度上,空間誤差模型模擬效果最好,在20和30 km尺度上,GWR模型最佳,且各模型的AIC值均隨著尺度變大而增大;基于殘差平方和參數對比,各模型均隨尺度的增大,其殘差平方和趨于減小,在10和30 km尺度,殘差平方和的順序為OLS模型最優,其次是空間滯后模型和空間誤差模型,GWR模型最差,在1、5和20 km尺度,恰好相反。 (3)采用空間自回歸模型和地理加權回歸模型2種模型模擬和預測耕地空間分布格局以及耕地變化情況。GWR模型是以耕地局部空間對象作為研究單元,表征的耕地空間局部特征更為詳盡,不僅揭示了地理空間局部特征及地理空間差異性,還能判定不同空間位置模型擬合度的優劣,并可以得到土地利用各驅動因子隨空間位置變化的權重。與空間自回歸模型的擬合度、殘差平方和等指標相比,GWR模型在局部空間特征、模擬精度以及驅動因子系數等方面均具有很好的模型構建能力。

3 討 論
4 結 論