王曉,張利,陳亞恒
河北農業大學國土資源學院,河北保定071000
基于主成分分析和模糊聚類方法的主體功能分區
王曉,張利,陳亞恒
河北農業大學國土資源學院,河北保定071000
主體功能區劃是協調我國當前經濟快速發展與資源保護問題的有效途徑之一,有助于形成我國區域均衡有序發展的空間格局。論文以冀東山地丘陵區典型縣域盧龍縣為研究對象,從生態環境重要性、社會經濟承載力、土地利用承載力3個方面建立指標體系。運用主成分分析與模糊聚類相結合的方法進行主體功能分區。優化開發區為盧龍鎮、石門鎮,面積為20122.26 hm2;重點開發區為劉田各莊鎮,面積為11094.93 hm2;限制開發區為下寨鄉、雙望鎮、木井鄉、蛤泊鄉、潘莊鎮、印莊鄉,面積為40006.11 hm2;禁止開發區為劉家營鄉、燕河營鎮、陳官屯鄉,面積為24359.25 hm2,分區結果科學、合理,符合實際情況。主成分分析與c-均值聚類相結合拓寬了劃分主體功能區的方法,對落實主體功能區劃具有重要價值和創新意義。
主成分分析和模糊聚類;分區指標;主體功能分區
目前至2020年,是我國全面建設小康社會的關鍵時期,也是城鎮化加快發展時期,區域工業、能源、交通、水利等用地需求大幅度增加,大量農村人口將從農村轉移到城鎮,城鎮居住、基礎設施、公共服務等建設用地和生態用地需求也將大幅度增加,這必將引起空間結構急劇變動[1]。國家“十一五”規劃綱要明確提出,各地要根據資源環境承載能力、現有開發密度和發展潛力,將國土空間劃分為優化開發、重點開發、限制開發和禁止開發4類主體功能區,以促進形成經濟發展與人口資源環境相協調的空間均衡格局。
目前學術界對于主體功能區的研究主要集中在理論創新、區域政策調整、指標體系研究、生態補償機制、主體功能規劃與各級規劃銜接等方面[2-5]。而對于主體功能區劃分的理論研究正處于探索階段,國際、國內也沒有現成的理論和方法體系。一些學者建立了由資源環境、開發密度和發展潛力等多種指標組成的主體功能區劃指標體系,自下而上采用綜合分析法、主要因素法、疊置法、熵權法、生態位劃分法、三維矩陣法、主成分分析法及聚類分析法并結合RS、GIS等綜合集成的方法,相繼開展了省域、市域、縣域尺度下主體功能區劃研究[6-10]。事實上各主體功能區之間的范圍界線沒有明顯的劃分,更多的是一種模糊關系,傳統的定量方法不能對其進行精確地分類。聚類法目前在劃分綜合分區中應用較為廣泛。但對于硬聚類法(HCM),其聚類對象是被嚴格區分出來,一個對象只能劃分到一個類中,原來數據所蘊含的信息損失較多[11]。模糊聚類則是用柔性特征的分類方法將分類對象與聚類中心建立隸屬度關系,故其中又以模糊c-均值聚類法(FCM)應用最廣,而將FCM運用到主體功能分區中,目前國內研究較少。
縣域主體功能分區,不僅有助于全國、省域主體功能分區的深入及落實,還可以宏觀指導縣域城鄉、農業、國土、人口等資源配置,為各部門制定差別化相應政策.本文在前人研究的基礎上采取主成分分析與模糊c-均值聚類相結合的方法,以冀東山地丘陵區典型縣域盧龍縣為研究對象,劃分不同的主體功能區,采取不同的區域發展政策,以求促進盧龍縣人口、經濟、資源與環境和諧發展。
1.1研究區概況
盧龍縣位于東經118°45′54"~119°08′06",北緯39°43′00"~40°08′42"之間,地處河北省東部秦皇島市,東連撫寧縣,北攬長城與青龍滿族自治縣交界,西與遷安市、灤縣隔青龍河、灤河相望,南抵京山鐵路與昌黎縣接壤,是溝通東北與華北交通聯系的咽喉要道。
地勢北高南低,北部多低山,中部多丘陵,南部有部分平原、洼地。地貌分為低山、丘陵、平原洼地3種類型。低山區占地面積100.2 km2,占總面積的10.4%。丘陵區主要分布于縣境中部和低山區中下游坡面上,面積688.4 km2,占總面積的71.7%平原洼地,主要分布在縣境南部,面積172.4 km2,占總面積的17.9%。土質肥沃,地下沙源較豐富,水資源條件較好,為縣內主要糧食產區。隨著河北省經濟重心向沿海、京津地區的產業轉移,以唐秦承為中心的“冀東經濟區”將成為環渤海地區新的經濟增長極,勢必會使該區的空間格局發生巨大變化。
1.2數據來源
本研究土地數據來源于盧龍縣2010年完成的第二次土地調查1:50000農村土地利用現狀調查成果。社會經濟數據來源于權威部門的統計資料。坡度、植被、地質等自然資源數據運用遙感處理軟件ENVI4.7對TM影像數據解譯得出,盧龍縣解譯精度約為85%。
2.1主成分分析的基本原理
為滿足指標體系完備性和針對性,選取指標較多。而指標之間具有一定的相關性,為保證使用精度與范圍,運用主成分分析(Principal Components Analysis,PCA)法將原有多個變化量化為少數幾個綜合指標。
1)建立初始矩陣X,并進行標準化處理。假設分類對象有n個,每個對象有p個分類變量,得到初始矩陣X:

由于變量指標的量綱和指標值的數量級不一致,并會對分析結果產生影響,采用(2)對pnX×進行標準化處理,并得到矩陣*X,

式中xij為第i樣本第j個指標的原始數據值;j為第j個指標的平均值:第j個指標的標準差。
2)建立相關系數矩陣。有了標準化矩陣*
X后,可以運相關系數法計算相關系數矩陣R:

式中rij(i,j =1,2,…p)為矩陣X*中與的相關系數,通過下式計算:

3)計算相關系數矩陣R的特征值和特征向量。
相關系數矩陣的非負特征值λi(i=1,2,…,p),令=0,使λi從大到小順序排列,得到λ1≥λ1≥,…,≥λp≥0,得到特征向量μi(i=1,2,…,p):

4)計算主成分貢獻率及累計貢獻率
第k個主成分ky的方差貢獻率為:

主成分myyy…,,21的累計貢獻率為:α

i值越大,其對應的主成分iy結合pxxx,,,21…信息的能力越強,將主成分按著特征值從大到小排序,一般截取前m個主成分,其中pm<,使得累計方差貢獻率大于85%[12]。這樣用截取的m個主成分代替原p個變量進行分析。
5)計算出主成分分值。
由下式結算得出:

將每個樣本各指標標準化值代入上式,求出各主成分得分。之后利用模糊C-均值算法依據各樣主成分分值進行主體功能分區。
2.2模糊c-均值聚類法(FCM)原理及計算步驟
2.2.1 FCM計算原理模糊聚類分析法,是根據樣本間的親疏關系,按其親屬程度,客觀地劃分類型,得到一個能反映個體親屬關系的系統。模糊c-均值聚類是常用的一種無監督的動態聚類算法[13]。其基本思想是先選擇若干樣本作為聚類中心,再按某種聚類準則(例如最小距離準則等)使其余樣本向各中心聚類,從而得到初始分類;然后判斷初始分類是否合理,若不合理就修改分類,如此反復迭代,直到獲得合理的分類。它不要求用于聚類的變量具有相似的方差或遵從高斯分布,可以較好的解決具有連續性變異的自然現象[14]。

式中:Q為大于等于1的實數指數,iv為第i類的聚類中心。
為求得最合理的聚類中心,常用的目標函數為:

2.2.2 FCM計算步驟
1)選定C(2≤C ≤n),初始模糊分類矩陣H(o),迭代次數L(初始值為0),允許誤差E (>0)和指數)1(≥QQ。在確定)(oH時,i?,k?應滿足如下約束條件:


3)修改)(L
R

4)比較H(L+1)與H(L)大小,當時,則迭代停止;否則取1+=LL,重新開始計算。

2.3分區原則
2.3.1 體現區域發展戰略和規劃要求與區域“十一五”總體規劃綱要和遠景目標相配合,符合其空間戰略布局的思路和要求,將主體功能區劃的初步分區結果進行相應調整,以符合總體規劃。
2.3.2 明確主導功能在特定空間內,社會、經濟、生態等要素的一種或幾種起著主導作用,在分區過程中確定在整體功能中起主導作用的要素,確定特定單元的優勢功能[16]。以求達到地域優勢互補,協調區域共同發展。
2.3.3 保持行政區劃相對完整在縣域范圍內,為便于主體功能分區的規劃與管理,盡量保持主體功能區界線盡量與一定級別的行政界線吻合。這有利于實施對各級政府的責任目標管理,增加可操作性。
2.3.4 高度綜合性依據系統論中的結構功能原理,一定的系統結構決定其功能,結構的合理性、有序性保證了功能的完整性。主體功能區劃必須從經濟、社會、生態耦合作用的角度,考慮單元及其組合結構的完整性,使主體功能區是完整的功能體。
2.4分區步驟
1)構建分區指標體系。收集基礎資料,綜合考慮選取符合盧龍縣實際情況,按照科學性、可比性、易得性和精簡性原則,在生態環境重要性、社會經濟支撐力和土地利用承載力3個方面選取14個評價因子,建立指標體系。
2)運用主成分分析法簡化因子。所選14個評價因子,因為每個因子都在不同程度上反映了分區的某些信息,并且指標之間彼此有一定的相關性,因而所得的統計數據反映的信息在一定程度上有重疊,運用主成分分析法對因子進行簡化。
3)運用模糊c-均值聚類法確定分區。利用MATLAB自帶的RAND函數隨機確定分類矩陣H,選定最大迭代次數為100,允許誤差為10-5,根據主成分分值,利用MATLAB編制FCM程序,多次迭代,求得最小J(H,V),根據最大隸屬度所在分區作為分類依據。
3.1評價因子選取與體系構建
主體功能區劃分的本質是用一套科學的指標體系來綜合評價特定空間的社會、經濟、生態價值,評價不同區域的主導功能差異。根據盧龍縣自然地理背景和社會發展特點,以鄉鎮為單元,保持行政界線完整性,從生態環境重要性、社會經濟承載力、土地利用承載力3個方面篩選14個評價因子,在人口、經濟、資源、環境等各方面協調發展思想的主導下,構建指標體系。
生態環境主要為主體功能區劃分的剛性限制因素,考慮區域的自然環境特征及資料的可取性選取坡度、生物多樣性、水資源涵養、地質災害、土地利用方式等五個因素。
社會經濟為劃分主體功能區中需要把握的重要經濟屬性,對于判斷各樣本現有發展情況影響顯著。選取人口密度、人均GDP、交通便捷度、財政收入增產率四個因素。
土地利用為國土空間布局優化的重要方面,從中選取人均居民點面積、城鎮工礦用地比例、單位建設用地GDP、耕地綜合生產力優勢指數、可利用土地資源量五個因素。

表1 主體功能區劃指標及編號Table 1 Index and numbers of major function oriented zoning
3.2主成分分析法確定主成分
以SPSS11.5為工作平臺,對選取的14個因子進行主成分分析,得出相關系數矩陣,計算各個主成分的特征值及貢獻率。由下表可知第一主成分貢獻率為47.917%,第二主成分貢獻率為23.172%,第三主成分貢獻率為12.449%。這三個主成分累計貢獻率已達83.538%,確定主成分y1、y2、y3。
特征向量即是各因子在主成分上的載荷矩陣,通過載荷矩陣和樣本標準化數值,可以得出主成分得分,由3個主成分來代表所選因子,之后通過模糊c-均值聚類來進行主體功能分區。

表2 特征值及貢獻率Table2 Eigenva lues and contribution ratio

表3 主成分載荷矩陣Table 3 Principal component loading matrix
3.3模糊c-均值聚類方法進行主體功能分區
相比傳統模糊聚類算法,FCM算法將各樣本按一定的模糊隸屬度歸屬到某一聚類中心。結合主成分分析法的分析結果,運用MATLAB平臺首先確定分類矩陣H,初步確定分區數為4,經26次迭代后,得到目標函數),(VHJ的最小值,以此確定各樣本的的隸屬度矩陣,隸屬度最大值所在矩陣作為分區依據,得到分區結果。

表4 各樣本的分類隸屬度矩陣Table 4 Matrix of sub jection degree on samples

圖1 模糊隸屬度空間預測分布圖Fig.1 Predictive maps showing partial memberships of individual fuzzy classes
3.4主體功能分區結果
3.4.1 優化開發區該區域主要包括主要包括西南部的盧龍鎮、石門鎮。隸屬度分別為0.325和0.412。該區域面積20122.26 hm2,占全縣總面積的21.5%。該地區人口密度大,產業聚集度高,單位工業產值處于較高的水平,土地開發強度高,現有開發密度高,因其自身的區位優勢、科技潛力和以往較高經濟水平的積累,使得其區域發展水平較高。該地區應限制占地多、耗能高的工業用地,支持高新技術、循環經濟和現代服務業的發展。并嚴格保護耕地,保留開敞的綠色空間,保護好各項生態用地,促進區域生態環境改善。
3.4.2 重點開發區該區域主要包括劉田各莊鎮。隸屬度為0.416,面積為11094.93 hm2,占全縣總面積的11.61%。該地區資源環境承載力較高,現有開發密度較低,未來發展前景良好。未來發展應優先保障承接優化開發區產業轉移的用地需求,積極引導產業集群發展和集中布局。鼓勵存量建設用地深度開發,統籌安排基礎設施建設用地,推動和加快基礎設施建設。嚴格保護生態用地,切實發揮耕地特別是基本農田在優化城鎮、產業用地結構中的生態支撐作用。
3.4.3 限制開發區該區域主要包括中部的下寨鄉、雙望鎮、木井鄉、蛤泊鄉、潘莊鎮、印莊鄉。隸屬度高于其他鄉鎮,面積為40006.11 hm2,占全縣總面積的41.86%。資源環境約束中等,現有開發強度較低,未來發展潛力中等。在未來開發過程中,應堅持保護優先、適度開發、點狀發展的原則,嚴格控制開發強度,逐步減少城鎮用地和農村居民點用地空間,嚴格限制增加建設用地,引導與主體功能定位相悖的產業向區外有序轉移。
3.4.4 禁止建設區該區域主要包括北部的劉家營鄉、燕河營鎮、陳官屯鄉。隸屬度分別為0.638、0.418和0.706,面積為24359.25 hm2,占全縣總面積的25.49%。主要為坡度大于25°的山地區。具有較為強大的生態功能,在維護區域環境中發揮重要的作用。未來應實行實行強制性保護,嚴禁任何不符合主體功能定位的各類土地利用活動,確保生態功能的穩定發揮。

圖2 盧龍縣主體功能區劃結果Fig.2 Major function oriented zoning in Lulong County
1)將主成分分析與模糊聚類相結合的方法應用到主體功能分區中,從生態環境重要性、社會經濟承載力、土地利用承載力三個方面構建了綜合評價指標體系。評價結果全面、細致準確地劃分了主體功分區。利用模糊聚類進行分區,避免了信息的丟失,符合分區的模糊特征。拓寬了劃分主體功能區的方法,為落實主體功能區劃,協調區域發展,存進資源節約和環境友好,統籌城鄉區域發展的效率與公平關系都具有重要價值和創新意義。
2)盧龍縣主體功能區劃分結果與各區生態環境、社會經濟情況及土地資源狀況相一致,與客觀實際相符合。表明分區方法科學、合理,符合實際情況。主體功能分區作為明顯的區位指向性分區,更加注重從總體空間上協調經濟發展與生態環境矛盾,有別于以往的各類分區。
3)主體功能區劃是戰略性、基礎性、約束性分區,是其他區域規劃在空間開發和布局的基本依據。同時主體功能區劃要以其他區域規劃為支撐,應做好與其他區域規劃的銜接工作。
[1]劉彥隨.區域土地利用優化配置[M].北京:學苑出版社,1999
[2]樊杰.我國主體功能區劃的科學基礎[J].地理學報,2007,62(4):339-350
[3]張學波,武友德.省域主體功能區區劃的理論與方法[J].資源開發與市場,2009,25(12):1092-1096
[4]牛叔文,李永華,馬利邦,等.甘肅省主體功能區劃中生態系統重要性評價[J].中國人口·資源與環境,2009,19(3):119-124
[5]黃亞云,周寅康,金曉斌.基于主體功能區規劃理念的土地利用總體規劃控制性指標分解初探[C]//2008年中國土地學會學術年會論文集.北京:中國大地出版社,2008:40–44
[6]張曉瑞,宗躍光.區域主體功能區規劃模型、方法和應用研究-以京津地區為例[J].地理科學,2010,30(5):728-734
[7]王利,張卓,王丹,等.遼寧省主體功能區劃分方法研究[J].地域研究與開發,2010,29(6):8-11
[8]傅鼎,宋世杰.基于相對承載力的青島市主體功能區區劃[J].中國人口·資源與環境,2011,21(4):148-152
[9]蒙莉娜,鄭新奇,趙璐,等.基于生態位適宜度模型的土地利用功能分區[J].農業工程學報,2011,27(3):282-287
[10]范樹平,程久苗,項思可.基于三維魔方的蕪湖市市域主體功能區劃研究[J].亞熱帶資源與環境學報,2011,6(2):66-74
[11]Mingqin liu,Ashok Samal.A fuzzy clutering approach to delineate agroecozones[J].Ecological Modelling,2002,149:215-228
[12]于秀林,任雪松.多元統計分析[M].北京:中國統計出版社,1999
[13]劉宜平,沈毅,劉志言.一種FCM聚類算法的改進與優化[J].系統工程與電子技術,2000,22(4):1-3
[14]Yang M S,Liu H H.Fuzzy clustering procedures for conical fuzzy data[J].Fuzzy Sets and Systems,1999,106:189-200
[15]王新洲,史文中,王樹良.模糊空間信息處理[M].武漢:武漢大學出版社,2003
[16]朱傳耿,仇方道,馬曉冬,等.地域主體功能區劃理論與方法的初步研究[J].地理科學,2007,27(2):136-141
Major Function Oriented Zoning Based on Principal Components Analysis and Method of Fuzzy-C-means
WANG Xiao,ZHANG Li,CHEN Ya-heng
College of Land and Resources,Agricultural University of Hebei,Baoding 071000,China
Major function oriented zoning(MFOZ)is one of the effective ways to coordinate current rapid economic development and resources and environmental protection,and is the guideline for optimizing the spatial pattern of regional development.Taking Lulong County in Jidong mountainous and hilly region as an example,this paper buit index system from importance of eco-environment,support of social economy and Land use strength.This paper classified MFOZ using the method of principal components analysis and fuzzy clustering means.Optimization development zone is Lulong,Shimen, which has the area of 20122 ha;important development zone is Litiangezhuang,which has an area of 11094.93 ha;lmit development zone is Xazai,Shuangwang,Mujing,Habo,Panzhuang,Yinzhuang,which has an area of 40006.11 ha; development-prohibited zone is Liujiaying,Yanheying,Chenguantun,which has the area of 24359.25 ha.Evaluation results show that the method is scientific,proper and accords with the actual conditions.The method of principal components analysis and fuzzy clustering means broadened the method of classifying MFOZ,which has important value and innovation significance for the implement of MFOZ.
Principal components analysis and fuzzy clustering means;zoning indicators;major function oriented zoning
F301.23
A
1000-2324(2014)04-0568-08
2012-10-25
2012-12-03
河北省高等學校科學技術研究優秀青年基金項目(Y2012015);河北省自然科學基金項目(D2010000795)
王曉(1987-),男,山東省肥城市人,碩士研究生.從事土地信息與管理研究.E-mail:wxguotu@163.com