劉 天 林,劉 明 皓,荊 磊,李 婷
(重慶郵電大學計算機科學與技術學院/空間信息研究中心,重慶 400065)
城市快速擴張在創造巨大經濟價值的同時,環境、生態及社會問題也日益突出,特別是行政區劃調整、城市擴張和重點項目建設等違背農民意愿的被動城市化問題已引起學術界的廣泛關注[1]。如何遵循城市化發展規律,因勢利導地制定城市發展規劃,是實現社會、經濟和環境可持續發展必不可少的環節。城市動態模擬是制定城鄉發展規劃的重要工具與手段,可為土地資源合理分配、結構有效調整、生態環境保護和農民安置等社會問題提供決策方案。
自從Chapin等首次將元胞自動機(CA)應用于城市擴張及土地利用/覆蓋研究[2]后,CA逐漸成為國內外相關學者關注的熱點,CA的核心問題是如何有效獲取用地轉換規則[3]。多準則決策較早用于定義非確定性、多維度和多級別的轉換規則,但由此得出的驅動因子權重與實際結果間的因果關系并不清晰[4]。之后,Logistic回歸[5,6]、神經網絡[7-10]、遺傳算法[11]和蟻群算法[12]等智能算法被用于提取更加準確、客觀的轉換規則,體現了其獨特優勢。用地轉換規則獲取過程中,元胞演化機制模擬是CA模型構建的一個關鍵問題, 一些模型考慮到土地利用類型之間轉換的真實情況而引入動態鄰域[13]、自適應競爭[14]和元胞轉換異步[15]等機制,或考慮自然與社會現象的空間分異而合理地引入地理分區[16]理念,或考慮驅動因子的變化而引入城市未來發展規劃等政策因素[17],從而使模擬結果更加精準。但在使用智能算法提取規則進行城市擴張模擬時,對于城市元胞密集程度特別大的區域,由于非城市元胞會同樣被賦予較大的轉換概率,使得模擬結果產生類間模糊,這與傳統CA模型在每次迭代中通過設置某一閾值或選擇轉換概率最大的前N個元胞進行轉換等約束條件有關。這種機制加上鄰域因素影響將導致城市密集區域的非城市元胞優先轉換,并與已存在的城市元胞不斷連接,零散的斑塊整合為較大的斑塊,從而產生城市中心元胞團簇現象[18]。團簇現象在景觀格局上表現為城市斑塊面積變大,數量大幅減少,形狀更加規則,然而在真實的城市擴張過程中,城市元胞密集區域中的部分非城市元胞(如小面積的池塘水域和復雜地形條件下的山體森林等)通常不會發生轉換。限制圖層方法可在一定程度上解決類間模糊而被廣泛使用,但該方法通過植入大面積的規劃要素改變轉換規則,不適合量多面廣的復雜地形下的用地轉換;加之傳統智能算法的元胞轉換策略無法真實模擬城市擴張中的用地演化機制,使得該方法在解決團簇現象方面不理想。
隨機森林(Random Forest,RF)的抗過擬合能力強,訓練速度快,在一定程度上可降低不平衡數據集的誤差,且能度量各驅動因子的重要性,在城市擴張模擬中精度較高[19,20];基于斑塊(Patch)擴張的CA模型能真實體現城市擴張過程,其關鍵是確定每個新增斑塊的面積,而已有研究基于歷史土地利用數據確定斑塊擴張面積[21,22],未考慮驅動因子對城市斑塊擴張的影響程度。綜上,針對傳統CA模型存在的不足,本文耦合隨機森林與基于斑塊擴張的CA模型,在顧及驅動因子重要性基礎上,構建一種基于斑塊最大面積與城市擴張總量的雙約束RF-Patch-CA城市擴張模擬方法,并利用該方法模擬重慶主城都市區2010-2017年城市擴張情況,提取有效的城市擴張轉換規則。
重慶市是成渝雙城經濟圈的核心城市之一,是實施長江經濟帶和“一帶一路”戰略的重要組成部分,是國家推進新型城鎮化的重點區域。2020年5月,重慶市首次明確“主城都市區21個區”的概念,主城都市區位于重慶西部,包括中心城區、同城化發展先行區、重要戰略支點城市和橋頭堡城市四部分,其中中心城區包含“兩江四岸”核心區(圖1)。

圖1 重慶主城都市區示意
考慮到城市擴張的主要動力,本文選擇自然環境、社會經濟和交通作為城市擴張的主要影響因素。研究數據(表1)中,土地利用數據源于全球土地覆蓋高分辨率觀測與監測(FROM-GLC),該數據精度較高,在研究區域內表現出城市斑塊數較多、平均面積較小和分布離散等特點,適用于解決城市中心元胞團簇問題。將表1中的異構數據統一研究區域范圍、空間坐標系和分辨率(100 m),通過水體、路網和興趣點數據計算相應的歐氏距離和點密度,構建統一的驅動因子數據集(圖2)。

表1 研究數據
RF-Patch-CA模型(圖3)運行過程如下:1)通過檢測前后兩期土地利用分類數據變化得到城市用地變化數據,并與相對應的驅動因子數據進行隨機分層抽樣;2)將抽樣后的數據集輸入RF模型進行訓練與測試,通過訓練好的RF模型得到每個元胞的轉換適宜性,并利用袋外數據評價驅動因子的重要性;3)根據城市發展適宜性、鄰域效應與限制因素計算得到總體轉換概率;4)通過驅動因子重要性度量估計斑塊擴張的最大面積,作為基于斑塊擴張的CA模型的局部約束條件;5)由城市用地變化數據統計得到城市擴張總量,作為基于斑塊擴張的CA模型的全局約束條件;6)基于斑塊的配置與迭代對城市擴張進行模擬與參數校驗,得到模擬結果。本文分別在元胞層面與斑塊層面對模型進行評價,并與RF-CA、ANN-CA和Logistic-CA模型相比較,驗證模型的準確性;通過馬爾科夫鏈計算城市未來擴張總量并輸入到模型中,獲得未來預測結果。
CA模型中每個元胞的總體轉換概率取決于城市發展適宜性Ps、鄰域效應Ω與限制因素Pc。城市發展適宜性通過RF算法計算得到,該算法基于集成學習的思想,將多棵決策樹組合成森林,利用多數投票規則得到分類結果[20,23,24],公式如下:
(1)


圖2 城市擴張驅動因子

圖3 雙約束RF-Patch-CA模型結構
元胞i被分為第k種類別的概率計算公式為:
(2)
在城市擴張模擬研究中,元胞i在t時刻轉換為城市元胞的概率Ps(i,t)(亦即元胞i在t時刻的城市發展適應性)可表示為:
(3)
鄰域效應是CA模型的重要組成部分,代表n×n鄰域范圍內中心元胞與周邊元胞的相互作用,具體表現為中心元胞n×n鄰域范圍內城市元胞的密度。元胞i在t時刻的鄰域效應可表示為:
(4)

限制因素約束了特殊土地利用類型向城市的轉換,可表示為:
(5)
式中:Landusek表示第k種土地利用類型;當元胞i在t時刻符合擴張限制條件時,con(·)取值為0,否則取值為1。
考慮到地理和政策因素,本研究規定河流、湖泊和森林保護區不會轉換為城市,因此,元胞i在t時刻的總體轉換概率(未顯式地增加隨機因素,而是在斑塊擴張中通過輪盤賭隱含城市轉換的隨機性)可表示為:
(6)
驅動因子重要性反映了驅動因子對城市擴張的影響程度,本文據此估計每個斑塊擴張的最大面積,作為模型的局部約束條件。假設某元胞擴張形成的斑塊的最大面積由重要性最大的驅動因子決定,具體而言,因為每個元胞的面積相等,所以第i個元胞作為起點擴張形成的斑塊最大面積Amax,i可等價為組成該斑塊的元胞數量,即:

(7)
式中:

模型的全局約束條件表示為:
(8)
式中:A為城市擴張總量,也代表n個起點元胞擴張形成的斑塊實際面積之和;Ai為第i個起點元胞擴張形成的斑塊實際面積。

為驗證重要性最大的驅動因子對城市斑塊擴張的影響程度,本文設計了基于單約束的斑塊擴張流程。該實驗流程相比上述實驗的不同之處在于:1)移除了通過重要性最大的驅動因子計算斑塊最大面積Amax,i的模塊(局部約束條件);2)僅使用輪盤賭機制作為每個斑塊擴張的迭代終止條件。

圖4 基于斑塊擴張的CA模型流程
本文分別從元胞與斑塊層面對模型進行精度檢驗與評價。在元胞層面,總體精度(OA)在數據類別不均衡方面存在局限性,基于混淆矩陣的Kappa系數能更準確地進行一致性檢驗。Pontius等根據實際結果與模擬結果的變化差異提出品質因數(Figure of Merit,FoM)[25],相比OA和Kappa系數,FoM能更準確地反映對復雜地理系統模擬的一致性和準確性,其計算公式如下:
FoM=B/(A+B+C+D)
(9)
式中:A為實際發生轉換、但模擬中未發生轉換的錯誤區域面積;B為實際和模擬中都發生轉換的正確區域面積;C為實際和模擬中都發生轉換,但轉換為與實際不相同的錯誤區域面積,本研究只涉及非城市元胞的轉換,故C=0;D為實際未發生轉換、但模擬中發生轉換的錯誤區域面積。
在斑塊層面上,為精確評價模擬結果的城市元胞團簇程度,選取3種景觀指數:斑塊數量(NP),反映景觀格局及破碎程度;斑塊平均周長面積比(PARA_MN),描述斑塊形狀的復雜度;平均最鄰近歐氏距離(ENN_MN),度量斑塊間的離散和團聚分布。Chen等運用基于以上景觀指數計算得出的景觀相似度αl評價實際圖像與模擬圖像之間的差異[17],其計算公式如下:
(10)
式中:li,s和li,o分別表示模擬圖像與實際圖像的第i種景觀指數;Δli為3種評價指標的歸一化結果。
首先,由2010年和2017年城市土地利用數據經過用地變化檢測得到城市土地利用變化數據,隨機分層抽取10%作為樣本,然后獲取樣本對應的驅動因子數據,由此構建樣本數據集。利用樣本數據對RF模型進行訓練和調優,訓練好的RF模型子樹數量為1 200,子樹的最大深度為40,子樹結點每次分裂時考慮的最大特征數為3。此外,RF模型對驅動因子重要性的計算結果顯示,夜間燈光強度對城市擴張的影響程度遠大于其他驅動因子。考慮到夜間燈光數據在一定程度上反映區域的經濟發展水平與人口密度[26],而城市擴張的主要動力源于社會經濟和人口遷移等因素[27],故本研究用夜間燈光強度約束城市斑塊擴張。在斑塊擴張的迭代過程中,元胞的總體轉換概率由式(6)得到;擴張系數通過校驗確定,本研究取值為25。
以2010年重慶主城都市區為初始狀態,通過雙約束RF-Patch-CA模型得到2017年城市擴張模擬結果,并與傳統CA模型模擬結果和2017年實際結果進行對比(圖5)。從全局看,雙約束RF-Patch-CA模型的模擬結果比3種傳統CA模型更接近實際結果;從局部看,3種傳統CA模型呈現出明顯的城市中心元胞團簇現象,而雙約束RF-Patch-CA模型避免了該現象。圖5d與圖5e的局部結果比較說明,通過考慮驅動因子重要性約束城市斑塊擴張,能使模擬結果更符合實際城市斑塊的分布格局。

圖5 2010-2017年重慶主城都市區城市擴張模擬與實際分布對比
由表2可知,雙約束RF-Patch-CA模型相比單約束模型在OA、Kappa系數和FoM上分別提高了0.0034、0.0359和0.0599,說明考慮驅動因子對城市斑塊擴張的影響程度能有效提高模型的模擬精度。

表2 單約束和雙約束RF-Patch-CA模型精度對比
為進一步驗證模型精度,在元胞層面和斑塊層面將本文雙約束RF-Patch-CA模型與RF-CA、ANN-CA和Logistic-CA模型進行比較(表3、表4)。從元胞層面看,本文模型的OA、Kappa系數和FoM均高于上述3種模型,其中Kappa系數分別提高了0.0222、0.0231和0.0245,FoM分別提高了0.0376、0.0391和0.0414,說明雙約束RF-Patch-CA模型更有利于探索城市擴張轉換規則;從斑塊層面看,3種傳統CA模型的斑塊數遠小于真實斑塊數,斑塊面積更大,斑塊間相對較分散,在城市元胞密集區域呈明顯的團簇現象,而本文模型的3項景觀指數更接近實際值。本文模型景觀相似度為77.48%,相比3種模型分別提高了40.92%、41.16%和32.33%。模型景觀指數和景觀相似度的對比結果充分說明了本文雙約束模型模擬結果有效避免了城市元胞團簇現象,景觀格局更接近實際結果。

表3 雙約束RF-Patch-CA模型與傳統CA模型精度對比

表4 雙約束RF-Patch-CA模型、傳統CA模型和實際結果的景觀指數對比
為更加精確反映斑塊擴張的最大面積對模型精度的影響程度,本文分析不同的擴張系數k(取值范圍為5~50,步長為5)與FoM之間的關系(圖6)。當擴張系數k在5~25區間內,FoM呈明顯上升趨勢;當k=25時,FoM為0.3460,此時模型模擬精度達到最高;當k=30時,FoM開始急劇下降;當k在30~50區間內,FoM總體呈下降趨勢。

圖6 FoM與擴張系數k的關系
根據式(7)可得,擴張系數k與斑塊最大面積呈正相關。當k較小時,斑塊容易擴張至最大面積,模擬結果傾向于根據模型的既定規則轉換;當k較大時,斑塊很難達到最大面積,模擬結果傾向于城市擴張中的不確定性因素;合適的k值能有效平衡兩者間的關系,達到最高模擬精度。
由各個驅動因子對城市擴張的影響程度(圖7)可知:1)夜間燈光強度對城市擴張影響最大,重要性達0.1297,遠大于其他驅動因子。夜間燈光分布體現了社會經濟和人類活動強度在空間上的差異,而城市擴張是經濟發展和人口遷移等因素共同作用的結果。2)到機場距離是影響城市擴張的重要因素。機場一般修建在遠郊地區,城市會盡量避免向機場方向擴張。3)地鐵站的位置也對城市擴張產生較大影響,新建的地鐵站不斷向四周延伸,帶動周邊區域發展,推動非城市用地轉換為城市用地。4)基礎設施(學校、商場和醫院)分布密度對城市擴張具有不同程度的作用。值得一提的是,景點對城市擴張的影響較大,重慶獨特的城市特性與文化背景吸引了大量外地游客,旅游業得到極大發展,對景點周圍的非城市用地轉換產生了一定影響。5)地理環境因素(如高程和坡度)對城市擴張影響相對較弱。大型城市通常位于平原地帶,而重慶以丘陵和山地為主,在復雜的地形地貌上擴張,因此重慶主城都市區在面積擴張方面對地理環境相對不敏感;但在景觀格局方面,重慶主城都市區相比平原地帶的成都市,NP、PARA_MN和ENN_MN在同等城市面積內提高了360、19.532和51.141,說明地形地貌對城市擴張格局有深度影響。
為預測重慶主城都市區未來擴張情況,根據2010-2017年城市變化數據,通過馬爾科夫鏈計算2024年和2031年的城市擴張總量。以2017年模擬結果(圖5e)為初始狀態,通過雙約束RF-Patch-CA模型得到2024年和2031年城市擴張預測結果(圖8a、圖8b),未來重慶主城都市區呈現以城市群為中心向四周擴張趨勢。由表5可知,在未來14年內,中心城區發展速度逐步放緩,同城化發展先行區和重要戰略支點城市保持快速發展勢頭,而橋頭堡城市將保持相對緩慢的擴張趨勢。

圖7 驅動因子重要性

圖8 2024年和2031年城市擴張預測結果

表5 未來模擬情況下各地區的城市用地年均增長率
本文構建雙約束RF-Patch-CA模型,以重慶主城都市區2010年城市土地利用數據為初始狀態,通過城市擴張變化的內在規律挖掘轉換規則,得到2017年城市擴張模擬結果;通過與傳統CA模型的模擬結果進行對比,驗證模型的準確性與適宜性;最后基于雙約束RF-Patch-CA模型預測重慶主城都市區2024年和2031年城市分布格局。
研究結果表明:1)在顧及驅動因子重要性基礎上構建的基于斑塊最大面積和城市擴張總量的雙約束RF-Patch-CA模型,避免了傳統CA模型在城市擴張模擬中存在的城市中心元胞團簇現象,更加精確地模擬出復雜的城市擴張過程;2)擴張系數的敏感性分析表明,模型中引入真實城市擴張中的不確定性因素能夠提高模型性能;3)驅動因子重要性計算結果顯示,夜間燈光強度顯著影響城市擴張格局,地理環境因素對城市擴張面積的影響相對較弱,但對城市擴張形態影響較大;4)2017-2031年重慶主城都市區呈現以城市群為中心向四周擴張趨勢,發展重心將由中心城區逐步轉移至同城化發展先行區和重要戰略支點城市。
本文雖然對城市擴張驅動因子的重要性進行了度量,但未考慮空間異質性問題。驅動因子在不同子區域對城市擴張的影響程度存在差異,如何對研究區域進行合理分區并對每個分區構建不同的轉換規則,需進一步探討。