齊子翔QI Zi-xiang;呂永強LV Yong-qiang;王亞欣WANG Ya-xin
(①北京物資學院經濟學院,北京 101149;②山東建筑大學測繪地理信息學院,濟南 250101)
“大城市病”表現為人口過度向核心城市集聚,突破承載力上限,從而引發的交通擁堵、環境污染、房價高企、熱島效應等一系列城市治理問題。習近平總書記明確指出城市建設落實到各地就是城市治理問題,要合理進行生產、生活、生態布局,提高城市發展的宜居性和持續性。顯然,地方政府對“大城市病”的治理已成為了城市治理的重中之重和提高百姓生活福祉的迫切需要。論文旨在使用空間計量經濟學方法,實證探查“大城市病”的成因,從而為我國制定區域發展戰略和城市規劃提供決策依據,服務國家十四五規劃。
使用空間計量經濟學研究空間問題可以追溯到Paelinck 于1967 年在法國區域科學年會上的報告[1]。Moran(1947)提出用0-1 連接矩陣表示空間相關關系之后,于1950 年提出了Moran’s I 統計量,用來測度空間自相關[2]。Geary(1954)給出了另一種度量空間依賴的統計量Geary’s C[3]。Cliff 和Ord(1972)提出Moran’s I 可以用于檢驗最小二乘回歸得到的殘差中是否存在空間自相關效應[4]。Ord(1975)提出了空間誤差模型和空間滯后模型并給出了最大似然估計方法[5]。Paelinck 和Klaassen 于1979 年提出了空間計量模型建立的5 個重要研究范疇:空間依賴、空間關系不對稱、其他空間單元的解釋因素、事前事后相互作用的差異以及空間顯式建模[6]。Anselin(1988,2006)認為空間計量經濟學的發展應有別于空間統計,更加側重空間模型的設定、估計、檢驗等計量理論,并對于廣義空間模型的最大似然估計進行了推導和總結[7]-[8]。Pace(1997)推廣了基于LU 分解的最大似然估計快速計算方法[9]。Barry(1999)給出了基于稀疏矩陣對數行列式的蒙特卡羅方法[10],Pace(2004)討論了稀疏矩陣對數行列式的切比雪夫近似[11]。Zhang(2007)討論了高斯過程的對數行列式近似[12]。Bivand(2013)論證了基于高斯空間自回歸模型的雅可比行列式計算方法[13]。Anselin(1980)使用空間兩階段最小二乘法,估計空間滯后模型[14]。廣義矩估計方法最早由Kelejian(1998,1999)提出[15]-[16],并進一步由Kelejian(2010),Drukker(2013)將其完善[17]-[18]。Hepple(1979)討論了空間計量模型的貝葉斯估計[19]。Lesage(1997)將馬爾可夫鏈蒙特卡洛方法和Gibbs 抽樣應用到了空間計量模型的貝葉斯估計當中[20]。得益于計算上的簡化,貝葉斯估計得到了廣泛的應用。例如Wang(2012)基于動態空間離散選擇模型的貝葉斯估計討論了土地利用變化[21]。空間計量經濟學模型的檢驗方法除了Moran(1950)提出的Moran’s I 統計量、Geary(1954)提出的Geary’s C 統計量、Getis(1995)提出的G 統計量以外[22],沃爾德檢驗、拉格朗日乘子檢驗、似然比檢驗同樣也是適用的。這幾種經典的檢驗方式隨著空間計量經濟學的發展也得到了改進。Anselin(1997)構造了穩健的拉格朗日乘子檢驗統計量,極大的方便了實際應用中的模型設定[23]。Baltagi(2001)依據拉格朗日乘子,檢驗函數格式是否被錯誤設定[24]。Anselin(2001)討論了拉格朗日乘子檢驗應用在其他空間誤差自相關的情況[25]。Lauridsen(2006)提出了一個基于LM 檢驗的單位根檢驗[26]。Kelejian(2008)討論了非嵌套假設的檢驗[27]。此外,其他檢驗在各種模型上的適用性也得到了討論,例如Amaral(2014)討論了Moran’s I 在空間Tobit 模型中的性質[28]。以上各種空間計量經濟學方法能否正確估計并檢驗空間效應,關鍵在于針對不同的研究問題,選擇恰當的空間權重矩陣,根據適宜的矩陣設定方式,將空間自相關過程參數化,從而挖掘隱藏在經濟問題中的空間非均衡現象。
本文以北京這個特大城市為例,從市場(流通經濟)、社會(公共服務)和就業(民生問題)三個層面出發,通過空間統計,探查北京是否存在上述三大要素的空間非均衡現象?并結合空間計量模型,加以驗證。
人們的生產和生活離不開流通;流通經濟反映一個城市的貿易狀況和繁華程度。流通業態分為批發和零售。由于篇幅限制,論文以批發企業密度反映市場貿易狀況,使用2012 年北京市1835 家批發企業的POI 矢量數據,利用核密度估計方法,探查北京市流通經濟的空間格局,估計結果如圖1。結果現示:北京市批發企業呈現出沿軌道交通線路集聚的空間格局。流通經濟布局的空間非均衡引致區際流通經濟規模的空間分異。

圖1 北京市批發企業空間集聚格局(2012)
本文得出關于“大城市病”的第一個假說。假說一:北京存在流通經濟布局的空間非均衡;這種非均衡可能是導致“大城市病”的原因之一。
本文涉及的公共服務是指在社會發展領域中的公共服務,主要包括教育、醫療衛生、文化、體育、公共安全、社會福利和社會救助等內容。論文借鑒Getis(1995)[22]提出的局域Gi統計量(式1),使用2010 年北京市67 家三級醫院的日門診量數據,對北京市以醫院為代表的公共服務機構進行空間熱點分析,探查公共服務部門的空間格局。

其中xj為第j 家醫院的日門診量,wij是第i 家醫院與第j 家醫院的空間權重。論文以d=2000 米①為距離閾值構建空間權重矩陣,n 為醫院數量。,統計量z 得分常被用作“熱點”分析的工具。統計量z 得分公式為。②統計量z 得分高且為正時表明高值集聚或熱點的存在;相反統計量z 得分低且為負時說明低值集聚或冷點的存在。論文通過z 得分檢驗統計量的顯著性,當樣本量足夠時統計量z 得分服從標準正態分布。p 值表示統計量z 得分返回的概率,置信度包含了90%、95%或99%三種水平。對于熱點分析來說,p 值表示所觀測到的空間模式是由某一隨機過程創建而成的概率。當p 很小時,意味著所觀測到的空間模式不太可能產生于隨機過程(小概率事件),因此論文可以拒絕統計量不顯著的原假設。熱點分析結果見表1、圖2。

表1 北京市三級醫院日門診量熱點分析表(2010)

圖2 北京三級醫院熱點分析圖
在北京67 家三級醫院中,有50 家醫院是百姓看病的熱點醫院,如圖2 可以清晰看出他們集聚在北京朝陽區、西城區、東城區和海淀區。公共醫療資源在北京核心城區集聚,空間非均衡特征十分明顯。除上述4 區外,北京另外12 個區縣無1 家百姓看病熱點醫院。公共服務的空間非均衡會導致區際公共服務能力的差距。
本文得出關于“大城市病”的第二個假說。假說二:北京存在公共服務的空間非均衡;這種非均衡可能是導致“大城市病”的原因之一。
為刻畫北京就業人口空間變動趨勢,本文對各街道鄉鎮就業密度占北京總就業人口密度的份額應用非參數估計的LOESS 方法,通過曲線擬合各街道鄉鎮就業密度到城市中心距離變化的規律。為方便比較,將LOESS 曲線的平滑系數設置為0.5。通過對比2008 和2013 年擬合的LOESS 曲線,如圖3(橫坐標表示離城市中心的距離,縱坐標表示就業密度份額),可以發現不同空間范圍內人口集聚和擴散的趨勢特征:2008-2013 年間,北京就業密度在全市范圍內進一步上升,向城市中心集聚趨勢沒有改變,從一個側面反映了就業機會的空間非均衡分布。

圖3 2008 和2013 年北京就業密度LOESS 曲線
論文得出關于“大城市病”的第三個假說。假說三:北京存在就業機會的空間非均衡;這種非均衡可能是導致“大城市病”的原因之一。
通過對北京市的空間分析,本文得出了導致“大城市病”的三個假說。針對上述假說,基于全國視角,我們實證檢驗假說是否成立。
目前,國內大部分空間計量研究均是使用面域數據,以邊界相鄰設定空間權重矩陣。這種研究范式的弊端是省域、市域、縣域數據同時涵蓋城市與鄉村,不能在空間上明顯刻畫城市的屬性和特征。
本文數據來源于《中國城市統計年鑒2015》,選取我國大陸地區289 個地級及以上城市作為統計樣本,利用矢量點數據,放棄邊界相鄰的空間權重矩陣設定方式,依據引致被解釋變量空間自相關效應最為顯著的距離閾值,設定空間權重矩陣,以城市年末市轄區人口密度為被解釋變量(popden),刻畫城市人口集聚程度,以市轄區規模以上工業企業數量作為解釋變量(enter),反映就業機會,以市轄區社會消費品零售總額作為解釋變量(sale),表示流通經濟規模,以市轄區醫院、衛生院床位數作為解釋變量(hospi),代表公共服務能力,實證檢驗“大城市病”的成因③。變量解釋見表2,變量描述如圖4。

圖4 變量描述與散點圖

表2 變量解釋
回歸過程使用經典計量方法,還是空間計量方法?需要進行空間自相關檢驗。
①按距離定義的全域空間自相關檢驗。
Moran(1950)[8]提出了全域自相關指數Moran’s I,按照空間賦值狀況測量變量間的相關關系。全域自相關Moran 指數I 的取值在-1 與1 之間,取值大于0 表示正相關,表示相似的值在空間上靠近,越接近于1,相關性越強,也可以理解為集聚;取值小于0 表示負相關,表示相異值在空間上靠近,越接近-1,空間分異越強;如果取值接近于0,表示變量是隨機分布的,不存在空間自相關。全域自相關指數Moran’s I 的計算公式如式(2):

xi是第i 個城市年末的市轄區人口密度(被解釋變量),n 等于城市的總數量。Wij為空間權重矩陣,。論文測量一系列距離的城市人口密度全域空間自相關指數,并選擇性創建這些距離及其相應z 得分④的折線圖。z 得分反映空間聚類的程度,具有統計顯著性的峰值z 得分對應促進空間過程聚類最明顯的空間自相關以及距離閾值d,如圖5。

圖5 按距離定義的全域空間自相關
表3 中列出了十次實驗中,按照距離d 構建空間權重矩陣所得到的全域空間自相關指數和z 得分。其中具有統計顯著性的峰值z 得分出現在第三次實驗中,對應的距離閾值d=1198300.76 米,z 統計量分值d=8.015472,在十次實驗中最高,且大于標準正態分布在顯著性水平為0.05的臨界值1.96,由此判定我國城市人口密度分布存在全域空間自相關,即空間依賴,并在距離閾值d=1198300.76 米時,全域空間自相關程度最為顯著,全域自相關指數Moran’s I=0.047512。之后隨著距離的增大,z 得分快速下降,空間自相關程度(Moran’s I 值)也隨著距離的增大而逐漸衰減。這也印證了地理學第一定律。論文將第三次實驗的結果經標準化后,落在笛卡爾坐標系中,如圖6。

圖6 我國城市人口密度全域空間自相關

表3 按距離全域空間自相關Moran’s I 匯總表
在圖6 中,笛卡爾坐標系的曲線斜率既是空間滯后模型(SAR)及廣義空間模型(SAC)中的空間效應系數ρ(ρ=Moran’s I),也是城市人口密度全域空間自相關指數;而各象限則表示局域空間自相關中各城市的點分布。
②按距離定義的局域空間自相關檢驗。
全域空間自相關指數只能說明具有相似值的變量出現了空間集聚,不能說明這種集聚是由高值,還是低值組成的。Anselin(1995)[29]提出了局域自相關指數Moran’s Ii(Local Moran index),或稱LISA(Local indicator of spatial association),是一種描述空間聯系的局域指標,用來檢驗局域地區是否存在相似或相異的觀測值集聚在一起。城市i 的局域Moran 指數Ii用來度量城市i 和他鄰域城市之間的關聯程度,被定義為式(3):

論文對局域自相關指數Moran’s Ii中空間權重矩陣的設定方法如下:如果兩個城市之間距離(歐氏距離)小于或等于d=1198300.76 米,記wij=1,否則記wij=0。
將圖6 中各象限的局域空間自相關落在地圖上,如圖7:Cluster:High 代表第一象限的城市點數據,表示具備同樣高人口密度的城市集聚在一起;Cluster:Low 代表第三象限的城市點數據,表示具備同樣低人口密度的城市集聚在一起;High Outlier 代表第四象限的城市點數據,表示高人口密度的城市附近毗鄰了低人口密度的城市;Low Outlier代表第二象限的城市點數據,表示低人口密度的城市毗鄰高人口密度的城市;白色的點表示未通過顯著性檢驗的城市。局域自相關檢驗表明我國城市人口集聚在“胡煥庸線”東側,京津冀、長三角以及中原城市群人口分布呈現出高密度集聚,同樣說明了我國城市人口密度呈現出空間自相關,所以需要使用空間計量模型加以解釋。

圖7 我國城市人口密度局域空間自相關(2015)
③空間模型選擇。
本文依據不同空間計量模型的性質,選擇適合本文研究主題的模型。空間回歸是通過將空間自回歸過程加入到模型設定中,來處理空間效應,從而將空間自相關過程參數化的。其中最經典的模型是空間滯后模型(SAR):

和空間誤差模型(SEM):

而這兩者是空間杜賓誤差模型(Spatial Durbin Error Model,SDEM):

和廣義空間模型(General Spatial Autocorrelation Model,SAC):

的特殊形式。空間杜賓誤差模型和廣義空間模型又是廣義嵌套空間模型(General Nesting Spatial Model,GNS)的特殊形式:

廣義嵌套空間模型的其他特殊形式還有空間杜賓模型(Spatial Durbin Model,SDM):

進一步特殊形式是類似于經典線性模型的自變量空間滯后模型(Spatial Lag Of X Model,SLX):

而如果令所有空間自相關系數均為0 就退化成經典線性模型(Classical Linear Regression Model,CLR):

在式(4)-(11)中,ρ、λ 分別為被解釋變量以及模型隨機擾動項的全域空間自相關系數,W 為空間權重矩陣,β與θ 為回歸系數,μ 為存在空間自相關的隨機擾動項,ε為消除空間自相關(空間依賴)后的隨機擾動項。各類模型間的相互關系如圖8 所示。

圖8 空間回歸模型設定
上述模型中,廣義空間模型(SAC)同時將空間效應引入模型的被解釋變量與隨機擾動項中,并在模型變換中使得解釋變量也產生了空間效用(式(12)-(13));由于本文的三個假設將作為解釋變量納入計量模型,而且假設它們都會對人口的集聚產生空間自回歸影響;因此,SAC 模型較適合本文研究主題。

因為散點圖4 顯示被解釋變量與各解釋變量呈線性關系,本文分別選擇SAC、SEM 和SAR 三類線性模型,進行對比回歸。空間權重矩陣的設定方法依然遵從本文空間自相關檢驗部分(2.2 部分)的設定方式,以兩個城市間距離是否達到d=1198300.76 米為閾值。這樣可以最大化模型中空間自相關效應,充分體現人口在城市集聚過程中的空間自回歸機制。
④內生性問題。
由于數據存在空間異質性與空間自相關,使得空間計量模型的隨機擾動項存在異方差與序列相關,OLS 估計量為無效估計量;又因為SAC 和SAR 模型的動力機制是空間自回歸過程,如式(14)所示:

使得模型產生了內生性問題,引致OLS 估計是有偏的;所以,論文將被解釋變量的空間一階滯后項作為工具變量(IV),使用廣義空間兩階段最小二乘法(GS2SLS)進行參數估計。
由于就業機會變量(lnenter)與流通經濟規模變量(lnsale)存在多重共線性,本文將其分開進行空間回歸。估計結果見表4。三種模型估計結果中:lnenter、lnsale 和lnhospi 變量系數均為正,說明就業機會、流通經濟規模和公共服務能力與人口密度正相關,其中lnenter 和lnsale 變量系數通過了顯著性水平為0.05 的T 檢驗,lnhospi 變量系數通過了顯著性水平為0.01 的T 檢驗,說明這三個因素確是導致人口集聚的成因。論文使用Breusch-Pagan 異方差檢驗,P 值為0.0001,拒絕同方差的原假設。模型的隨機擾動項存在異方差,說明引致我國“大城市病”的空間非均衡,不僅可以理解為空間自相關(空間依賴),也是一種空間異質。綜上檢驗,三個假說全部成立。

表4 SAR、SEM、SAC 模型參數估計結果
本文在此忽略SAC 模型被解釋變量以及隨機擾動項中的空間自相關影響,使用經典線性模型和OLS 估計方法,以2015 年289 個地級及以上城市作為統計樣本,進行穩健性檢驗,參數估計結果見表5。表5 中已估參數符號與表4 一致,說明表4 的估計結果是穩健的。

表5 OLS 參數估計結果
本文進一步考慮空間樣本選取對于模型的穩健性影響。本文從2011 年289 個地級及以上城市樣本中隨機抽取100 個,使用OLS 進行穩健性檢驗,參數估計結果見表6。表6 中已估參數符號與表4 一致,說明表4 的估計結果是穩健的。

表6 100 個地級市參數估計結果
Fingleton(1999)[30]最早將時間序列的協整等概念引申到了空間計量經濟學,利用蒙特卡羅模擬的方法研究了偽空間回歸、空間單位根和空間協整。Kosfeld 和Lauridsen(2006)[31]提出了一個基于LM 檢驗的單位根檢驗。Lee 和Yu(2009)[32]研究發現相比于時間序列的情況,空間回歸模型發生偽回歸的現象較弱,但仍然存在。本文使用Kosfeld和Lauridsen(2006)[31]提出的空間單位根檢驗對模型進行穩健性檢驗。若被解釋變量的空間差分是穩定的,即


表7 空間協整檢驗結果
就業機會、流通經濟布局以及公共服務的空間非均衡直接表現為不同城市間平等就業機會、市場繁榮程度以及公共服務能力的差距,而上述三個因素又與人口密度顯著正相關,引致人口非理性遷移與集聚,是造成我國“大城市病”的原因。在以疏解大城市人口,促進區域協同發展,為目標的國家區域政策與地方探索中,首先要解決上述空間非均衡在我國新型城鎮化過程中的對立統一問題。推動產業區際有序轉移、搬遷區域性貿易市場和均衡配置公共服務資源是治理我國“大城市病”,促進經濟社會一體化的路徑選擇。在推動產業轉移方面可以借鑒沈體雁、齊子翔等(2016)[33]提出的人工智能算法,利用經濟工程學思想,通過將北京擬轉出企業與河北承接開發區雙邊匹配的市場設計,疏解非首都功能。
注釋:
①經測算任意兩家醫院的最近距離為18000 米,所以距離閾值取值20000 米。
③2014 年國務院印發《關于調整城市規模劃分標準的通知》,規定城區常住人口100 萬以上500 萬以下的城市為大城市。我國地級及以上城市基本符合這個標準。
④對于Moran 指數的估計結果可以用標準化統計量z 來檢驗其顯著,。z 統計量服從標準正態分布。