馬志飛, 李在軍, 張雅倩, 吳啟焰
(南京師范大學 地理科學學院, 南京 210023)
?
基于地理加權主成分的經濟發(fā)展綜合評價研究
——以江蘇省為例
馬志飛, 李在軍, 張雅倩, 吳啟焰*
(南京師范大學 地理科學學院, 南京 210023)
地理加權主成分分析可判別各主成分的方差貢獻的空間變動,并診斷出影響各主成分空間變化的變量.本文在結合傳統(tǒng)主成分分析與地理加權主成分分析技術,選取經濟發(fā)展水平綜合評價指標,對江蘇省63個縣、市的經濟特征進行主因子提取.得到以下主要結論:主成分分析提取得到3個主成分,分別表征經濟增長方式、經濟結構與經濟動力;蒙特卡羅檢驗在0.05水平下,顯著性拒絕主成分的特征值與因子載荷在空間變化上的平穩(wěn)性假設;地理加權主成分的因子載荷主導著不同地區(qū)的經濟結構特征,且呈集中連片分布特性,地理加權主成分的方差貢獻率存在著明顯的南北分異態(tài)勢.可見,地理加權主成分分析可以有效識別各主成分的局域空間變化效應,診斷出影響地區(qū)經濟特征空間變化的主要變量,有利于深化對社會經濟要素空間的分異特征和內在機理的認知與理解.
經濟發(fā)展綜合評價; 主成分分析; 地理加權主成分分析; 江蘇省
區(qū)域經濟系統(tǒng)是多要素(變量)共同影響作用的結果,呈現(xiàn)出迥異的空間格局特征[1].主成分分析技術作為一種傳統(tǒng)而古老的綜合評價方法,被廣泛應用于自然與社會科學多要素交互影響研究[2-3],通過對多元評價指標進行降維處理,提取具有代表性的主成分,并進行合理解釋與分析,從而可以有效的識別多維數(shù)據內部結構的基本特征,適合地區(qū)經濟發(fā)展的綜合評價研究.
而傳統(tǒng)的主成分分析方法假設數(shù)據矩陣協(xié)方差結構在空間變化上是恒定的,盡管各樣本的主成分得分在空間分布上具有顯著的變動,但其內在的特征值與因子載荷在空間上并未變化,故其忽略了主因子載荷向量與方差貢獻的空間變化,是一種建基于全局的統(tǒng)計分析方法[4-10].而世界并非一成不變的均質空間,而是交織著波動與變化,由于空間異質性、空間非平穩(wěn)性及空間相關性的存在,使得地區(qū)單元并不孤立的存在,而是雙向或多向的相互影響、相互作用[11-14],因此,主成分分析對空間數(shù)據變化的解釋呈現(xiàn)有偏的結構特征,不能反映出地理單元綜合評價的空間變化特性,且忽略了地區(qū)特性的空間交互效應.
伴隨著空間數(shù)據分析技術的成熟與完善,社會經濟現(xiàn)象的空間異質性與空間相關性現(xiàn)象被廣泛揭示,空間變化成因機制的解釋也日趨完善,空間誤差回歸、空間自相關回歸、地理加權回歸與空間面板回歸模型得以廣泛應用[15-18].尤其是地理加權回歸分析技術的應用與推廣,使得社會經濟現(xiàn)象空間異質性的解釋得到極大提高,而地理加權回歸分析不能處理多元變量的共線性.因此,將傳統(tǒng)主成分分析技術推廣到空間分析的層面,引起了學者的廣泛關注,非空間的主成分分析技術逐漸被擴展到地理加權主成分分析[19-22].地理加權主成分分析技術可以幫助了解社會經濟現(xiàn)象地理變化的結構特征,識別空間變化主成分的最大因子載荷變量,并可對主成分方差貢獻率的局部空間分布特征進行可視化,優(yōu)化地理加權回歸變量選擇,不僅可以彌補主成分分析的不足,而且增強了社會經濟地理分異現(xiàn)象的分析與解釋.
地理加權主成分分析對人口結構特征與土壤特性的解釋具有明顯的優(yōu)勢[10,23],詳細的解釋了多元變量間的空間變化關系,可以清晰的識別各主成分因子載荷的空間變化特性.而現(xiàn)有綜合社會經濟特征評價的研究僅僅停留在傳統(tǒng)主成分分析的層面,并未考慮到主成分的空間變化,這在一定程度上限制了對社會經濟空間分異特征的認識與解釋.基于此,本文探索性地采用了地理加權主成分分析對江蘇省各縣、市的綜合經濟特征進行評價研究,探索經濟特性的空間變化特征,首先利用主成分分析技術對地區(qū)經濟特性進行主成分提取,然后采用地理加權主成分分析診斷影響地區(qū)經濟特征空間變化的主要變量,捕捉經濟特性的地理分異特征.
1.1 數(shù)據來源
地區(qū)經濟發(fā)展的綜合評價涉及經濟結構、經濟實力、經濟外向型、經濟發(fā)展動力等多方面,本文以2010年江蘇省63個縣、市作為基本研究單元,在參照綜合經濟發(fā)展綜合評價研究的基礎上[24-26],在數(shù)據可獲得性的原則下,最終確定了人均社會消費品零售額(x1)、人均固定資產投資(x2)、人均土地面積(x3)、第二產業(yè)占GDP比重(x4)、第三產業(yè)占GDP比重(x5)、財政支出占GDP比重(x6)、非農從業(yè)人員比重(x7)、工業(yè)企業(yè)利稅總額(x8)、人均進出口額(x9)、人均利用外資水平(x10)、外商投資占總投資比重(x11)共11個變量作為經濟發(fā)展水平綜合評價影響因素,相關的變量來源于《江蘇省統(tǒng)計年鑒》(2011).
1.2 地理加權主成分分析
地理加權的統(tǒng)計概念由Fotheringham,Brunsdon及Charlton與Lloyd等人給出,地理加權主成分分析通過引入地理加權的一系列算式,將變量間地理位置的交互影響作用納入計算,從而有效地解決了多元數(shù)據中的空間異質性問題.通過不同地點的地理加權均值、地理加權方差及協(xié)方差的計算,進而得到地理加權主成分分析的計算結果.

局域協(xié)方差矩陣計算公式為:

(1)


(2)
首先,采用標準差標準化方法對所選變量進行標準化處理,對標準化數(shù)據進行KMO與巴特利球形檢驗,可知KMO值為0.717,巴特利球形檢驗在0.01水平下顯著,表明所選指標適合進行因子分析.采用方差協(xié)方差矩陣的形式進行主成分提取,得到特征值與因子載荷(表1、表2).前3個主成分的特征因子值均大于1,且其累積貢獻率接近80%,說明前3個主成分可以解釋經濟綜合發(fā)展水平的大部分特征.各主因子載荷矩陣表如表2所示.

表1 主成分分析結果

表2 因子載荷系數(shù)
注:最大因子載荷用粗體表示.
由表1知,前3個主成分的累積貢獻率為80%左右,可用來反映經濟綜合發(fā)展水平的主要特征.其中,第1個主成分解釋了數(shù)據結構的53%特性,與非農從業(yè)人員比重及人均利用外資水平有較大的正相關性,分別為0.371與0.363,故第1個主成分可以用來表示經濟增長驅動力.第2個主成分的解釋方差貢獻率為14.5%,與第三產業(yè)占GDP比重呈較大的相關性,為0.513,而與第二產業(yè)所占GDP比重具有較大負相關性,為-0.465,故第2主成分可以用來表征經濟產業(yè)狀況.第三個主成分的方差貢獻率僅為10.6%,而與人均土地面積具有最大的負相關性(-0.684),與其他變量多呈負相關關系,故第3個主成分可代表生產要素構成.
通過對因子得分進行空間可視化(如圖1),可以詳細了解地區(qū)主因子得分的空間分布狀況.由圖1.a可知,第1主成分負得分值最高地區(qū)多位于蘇中與蘇北大部分地區(qū),這是由于第一主成分與非農從業(yè)人員比重密切相關,蘇北、蘇中大部分地區(qū)經濟發(fā)展相對滯后,農業(yè)從業(yè)人員比重較多,而隨著經濟結構的調整,第一產業(yè)所占比重不斷下降,農業(yè)從業(yè)人員多轉向第二或第三產業(yè);正得分值較大的地區(qū)集聚在蘇南的西南地區(qū),多為經濟發(fā)達地區(qū),具有有利的外商投資政策與環(huán)境,對外貿易交流頻繁,外資利用規(guī)模大.由圖1.b可知,第二主成分正的分值多位于蘇北西北部地區(qū),而負得分值基本分布于蘇中與蘇南地區(qū),這與南北地區(qū)顯著的經濟結構差異密切相關.

圖1 主因子得分圖Fig.1 The scores on PC1(a) and PC2(b)
主成分分析通過主要成分的選取,可總體評價識別經濟結構的組合特征,而主因子得分呈現(xiàn)出顯著的空間分異格局,通過Moran’s I計算進一步判斷其局部空間結構,可知第1主成分因子得分的Moran’s I為0.724,在0.01水平下顯著,表明第1主成分因子得分在空間分布上具有顯著的空間相關性,而第2主成分因子得分的Moran’s I為0.043,且沒有通過顯著性檢驗,表明第2因子得分空間分布較隨機,這與各主成分載荷變量的地區(qū)變化及其空間自相關性有關,而傳統(tǒng)主成分分析作為一種非空間統(tǒng)計分析方法,假設地理區(qū)位對社會經濟現(xiàn)象沒有影響作用,故無法識別載荷變量間關系的局部變化.因此,通過地理加權主成分分析進行主成分空間變化的分解,以期找出主導各地區(qū)主成分空間格局的主要變量.
3.1 蒙特卡羅檢驗
在進行地理加權主成分分析,首先采用蒙特卡羅檢驗方法,檢驗主成分的特征值是否具有空間變化的非平穩(wěn)性,原假設認為主成分的特征值在空間上沒有變化,備則假設存在著顯著的空間變化性.結果如圖2所示,由圖2知,局部特征值的標準差的p值為0.02,表明在0.05水平拒絕空間平穩(wěn)性假設,說明主成分的因子載荷、方差貢獻率與特征值均存在著顯著的局部變化特性.因此,使用地理加權主成分分析技術可以清晰的識別這些特性的空間變化.

圖2 地理加權主成分的蒙特卡羅檢驗Fig.2 Monte Carlo test for the first geographically weighted PC only
3.2 地理加權主成分分析結果
地理加權主成分分析可以得到各研究單元的一系列的特征值、因子載荷與成分得分.根據Fotheringham等人的做法,將地理加權主成分的最大因子載荷進行空間可視化(圖3).由圖3.a可知,地區(qū)的最大因子載荷在空間分布上較集中連續(xù),第1個地理加權主成分的最大因子載荷在空間分布上具有明顯的局域特征,其中非農從業(yè)人員比重所占地區(qū)數(shù)量最多,且連續(xù)分布于廣大蘇北地區(qū),這與傳統(tǒng)主成分分析的最大載荷變量(0.371)一致,其次人均利用外資水平主導多數(shù)地區(qū)的地理加權主成分,這與其傳統(tǒng)主成分分析的載荷(0.363)有關,其它人均進出口變量位于少數(shù)蘇南地區(qū),更清晰的說明這些地區(qū)的經濟活動對外交流聯(lián)系較為密切,而工業(yè)企業(yè)利稅總額對南京市與鎮(zhèn)江市具有最大的影響作用.
圖3b為第2個地理加權主成分因子載荷的空間變化,人均土地利用面積、第二產業(yè)占GDP比重與第三產業(yè)占GDP比重是影響地區(qū)主成分的空間變化的主要因素.其中,人均土地利用面積在27個地區(qū)具有最大的載荷值,這些區(qū)域多呈集中連片分布在廣大蘇北地區(qū),第二產業(yè)占GDP比重在33個地區(qū)具有最大的載荷值,這些地區(qū)多位于蘇南大部分地區(qū),同傳統(tǒng)主成分分析的最大負相關變量第二產業(yè)占GDP比重(-0.465)較為一致,表明蘇南地區(qū)的第二產業(yè)所占比重較大,第三產業(yè)占GDP比重主導著3個地區(qū)的經濟結構,這與傳統(tǒng)主成分分析的最大相關性變量第三產業(yè)占GDP比重(0.513)結果存在較大差異.
由圖4可知,主成分的方差貢獻率呈現(xiàn)出明顯的南北分異趨勢,這種相似的分異趨勢同樣體現(xiàn)在其它主成分的局部方差貢獻率,其中方差貢獻率的高值區(qū)多集聚在蘇南的東南部分地區(qū),而方差貢獻率的低值地區(qū)多位于蘇北與蘇中地區(qū),這與經濟變量的冷點區(qū)與熱點區(qū)的南高北低分布相關,方差貢獻率的空間格局進一步證實了區(qū)域經濟變量綜合作用的地理分異態(tài)勢,地區(qū)間與變量間均存在明顯的位置依賴關系.因此,地理加權主成分分析可以替代傳統(tǒng)主成分分析在解釋區(qū)域綜合經濟特征的空間變化上.

圖3 地理加權主成分的最大因子載荷變量的空間分布Fig.3 Variables with the largest loading on the first and the second geographically weighted PC

圖4 地理加權主成分的方差貢獻率Fig.4 Percentage of variance accounted for the first geographically weighted PC
傳統(tǒng)主成分分析是一種非空間統(tǒng)計分析方法,它所提取的主要成分并不依賴地理區(qū)位,沒有考慮到多元數(shù)據結構中的空間異質性問題,這導致空間過程和機理往往被忽略.誠然,這種局限性,無益于對社會經濟要素空間的分異特征和內在機理的認知.而地理加權主成分分析通過引進地理加權的算式,將傳統(tǒng)主成分分析技術擴展到空間主成分層面,有效彌補了傳統(tǒng)主成分分析的不足,解釋了地區(qū)主成分的空間異質性變化趨勢,清晰地診斷出導致各主成分空間變化的主要變量.本文結合傳統(tǒng)主成分分析與地理加權主成分分析,選取經濟發(fā)展綜合評價的11個變量,探索性的分析了江蘇省縣域經濟綜合發(fā)展水平的空間變化,得出以下主要結論.
1) 主成分分析有助于辨識多元變量的綜合特征,最終選取3個主成分,分別表征經濟增長方式、經濟結構與經濟要素投入.主成分是基于全域的統(tǒng)計,忽略了地區(qū)變量空間變化的信息.
2) 空間異質性是普遍存在的,蒙特卡羅檢驗表明主成分特征值在空間變化上是非平穩(wěn)的,即影響主成分變化的變量的載荷在空間分布上并不均衡.地理加權主成分的方差貢獻率呈現(xiàn)顯著的南北分異趨勢.因此,地理加權主成分分析可以有效的診斷出地區(qū)變化的局部空間效應,地理加權主成分的因子載荷呈現(xiàn)出異質性的空間分布特征.
3) 由第1個地理加權主成分的最大因子載荷圖可知,非農從業(yè)人員比重所占地區(qū)數(shù)量最多,這與主成分分析結果較為一致;人均土地利用面積與第二產業(yè)占GDP比重主導著大部分地區(qū)的第2個地理加權主成分,所有最大載荷變量在空間分布上均呈連續(xù)性,這與變量的空間自相關性有關.因此,通過地理加權主成分的因子載荷,可知不同的經濟變量對各主成分的載荷影響并不相同,主導地區(qū)間各主成分變化的載荷變量存在著明顯的空間分異性,地理加權主成分分析可以有效的探索局部地區(qū)的變化特性并找出對各主成分空間變化有顯著性影響的經濟變量.
隨著空間數(shù)據分析技術的發(fā)展與廣泛應用,考慮到空間效應的統(tǒng)計分析將是必然的趨勢,本文將傳統(tǒng)主成分分析擴展到地理加權主成分分析,有效地探索了經濟綜合特性的空間變化.但本文還存在以下不足:研究單元數(shù)量相對較少;且研究指標的選取需要進一步補充;對提取主成分的合理性解釋較為主觀,今后需進一步完善改進.此外,將這一方法推廣到其他社會經濟要素綜合評價中,對于診斷主導各主成分空間變化的主要變量具有重要意義.
[1] 柯文前, 陸玉麒, 俞肇元, 等. 多變量驅動的江蘇省域經濟空間格局演化[J].地理學報, 2013, 68(6):802-812.
[2] JEFFERS J N R. Two case studies in the application of principal component analysis[J].Journal of the Royal Statistical Society Series C(Applied Statistics), 1967, 16(3):225-236.
[3] WU Q Y, CHENG J Q, CHEN G, et al. Socio-spatial differentiation and residential segregation in the Chinese city based on the 2000 community-level census data: A case study of the inner city of Nanjing[J].Cities, 2014, 39: 109-119.
[4] CHARLTON M, CHRIS B, URSKA D, et al. Principal Component Analysis: from Global to Local[C]. The 13th AGILE International Conference on Geographic Information Science, Guimar?es, Portugal, 2010:1-10.
[5] 吳啟焰, 吳小慧, CHEN Guo, 等. 基于小尺度五普數(shù)據的南京舊城區(qū)社會空間分異研究[J].地理科學, 2013, 33(10):1196-1205.
[6] 潘竟虎, 石培基, 董曉峰. 中國地級以上城市腹地的測度分析[J].地理學報, 2008, 63(6):635-645.
[7] 孫姍姍, 朱傳耿, 李志江. 淮海經濟區(qū)經濟發(fā)展差異研究[J].地理學報, 2009, 64(8):924-934.
[8] 劉傳明, 曾菊新. 縣域綜合交通可達性測度及其與經濟發(fā)展水平的關系——對湖北省79各縣域的定量分析[J].地理研究, 2011, 30(12):2209-2220.
[9] OPENSHAW S, CHARLTON M, WYMER C, et al. A mark 1 geographical analysis machine for the automated analysis of point data sets[J].International Journal of Geographical Information Systems, 1987, 1(4): 335-358.
[10] LLOYD C D. Analysing population characteristics using geographically weighted principal components analysis: a case study of Northern Ireland in 2001[J].Computers, Environment and Urban Systems, 2010, 34(5):389-399.
[11] BINBIN L, PAUL H, ISABELLA G, et al. GWmodel: an R package for exploring spatial heterogeneity.GISRUK2013,Liverpool,UK,2013.
[12] BINBIN L, PAUL H, MARTIN C, et al. The GWmodel R package: Further Topics for Exploring Spatial Heterogeneity using Geographically Weighted Models[EB/OL]. arXiv:1312.2753, 2013, 1:18.
[14] GOODCHILID M F. The Validity and Usefulness of Laws in Geographic Information Science and Geography[J].Annals of the Association of American Geographers, 2004, 94(2):300-303.
[15] 程葉青, 王哲野, 張守志, 等. 中國能源消費碳排放強度及影響因素的空間計量[J].地理學報, 2013, 68(10):1418-1431.
[16] 洪國志, 胡華穎, 李 郇. 中國區(qū)域經濟發(fā)展收斂的空間計量分析[J].地理學報, 2010, 65(12):1548-1558.
[17] 梅志雄, 徐頌軍, 歐陽軍. 珠三角縣域城市潛力的時空關聯(lián)結構演變[J].地理學報, 2014, 69(4):497-509.
[18] ANSELIN L. Thirty years of spatial econometrics[J]. Papers in Regional Science, 2010, 89(1): 3-25.
[19] FOTHERINGHAM A S, BRUNSDON C. Local forms of spatial analysis[J].Geographical Analysis, 1999, 31:340-358.
[20] FOTHERINGHAM A S, BRUNSDON C. Geographically weighted Regression: the analysis of spatially varying relationships[M].Chiceste:Wiley, 2002,196-202.
[21] PAUL H, CHRIS B, MARTIN C. Geographically weighted principal components analysis[J].International Journal of Geographical Information Science, 2011, 25(10):1717-1736.
[22] GOLLINI I, LU B , CHARLTON M, et al. GWmodel: an R Package for Exploring Spatial Heterogeneity using Geographically Weighted Models[EB/OL]. arXiv:1306.0413,2013,1:19.
[23] SANDEEP K, RATTAN L, LLOYD C.D. Assessing spatial variability in soil characteristics with geographically weighted principal component analysis[J].Comput Geosci, 2012, 16(3):827-835.
[24] 桑 秋, 張平宇, 高曉娜, 等. 遼中城市群縣域綜合發(fā)展水平差異的時空特征分析[J].地理科學, 2008, 28(2):150-155.
[25] 仇方道, 朱傳耿, 單勇兵, 等. 中國縣域綜合實力評價與區(qū)域分異特征[J].地理科學, 2004, 24(4):392-398.
[26] 趙玉芝, 董 平. 江西省縣域經濟差異特征及其成因分析[J].人文地理, 2012, 27(1):87-91.Geographically weighted Principal Components Analysis of regional development——a case study of Jiangsu Province
MA Zhifei, LI Zaijun, ZHANG Yaqian, WU Qiyan
(School of Geography Science, Nanjing Normal University, Nanjing 210023)
Geographically weighted Principal Component Analysis identifies the spatial variation of variance contribution in each principal component and the main factors dominating them. In the present study, based on the comprehensive evaluation of economic development, the principle components were extracted from economic characteristics of sixty-six counties or cities in Jiangsu Province in combination of the traditional and geographically weighted Principal Component Analysis. Results reveal that three principal components are extracted, representing the growth pattern, structure and stimuli of economy, respectively. The Monte Carlo test shows it unreasonable to ignore the spatial effects of eigenvalues and components loadings. Geographically weighted components loadings dominant the characteristics of economic structures in different region, which appears to be concentrate and confluent. Besides the variance contribution of the indicated components significantly displays the north-south differentiation pattern. These suggest that the geographically weighted principal component analysis is conductive to further understanding the spatial characters and internal mechanism of economic components.
comprehensive evaluation of economic development; Principal Component Analysis; geographically weighted Principal Component Analysis; Jiangsu Province
2015-09-22.
國家自然科學基金項目(41271176);教育部人文社科基金項目(12YJAZH159);國家社會科學基金項目(12BSH027).
1000-1190(2016)02-0276-06
F207
A
*通訊聯(lián)系人. E-mail: chiyanwu@126.com.