摘 要 根據空間效應產生起點及理論基礎的不同,歸納了現有空間計量文獻中鄰接矩陣、反距離矩陣、經濟特征矩陣以及嵌套矩陣等主要權重形式,并總結了其共同點、優缺點、演變脈絡及使用注意事項.針對截面式權重矩陣本身面臨的限制構造了兩種必要的轉換,即通過轉換實現對不同地理區域之間空間效應的考察,以及從截面權重到面板權重的轉換.最后指出研究者應該盡量采用多種新方法來確定空間權重形式以使其更客觀.
關鍵詞 鄰接權重矩陣;反距離權重矩陣;經濟權重矩陣;嵌套權重矩陣
中圖分類號 F064 文獻標識碼 A
Several Types of Weights Matrix
and Their Extended Logic
WANG Shoukun
(School of Economics,Jiangxi University of Finance and Economics,Nanchang, Jiangxi 330013,China)
Abstract According to their different logical origin and theoretical basis,this paper summarized several types of weights matrix in the existing spatial econometric literatures and their extended skeleton,including contiguity based weights matrix,inverseistance weights matrix,economic based weights matrix and nested weights matrix.In addition,it illustrated the advantages and disadvantages of them, and to what we should pay attention when making use of them. Then, this paper introduced two required conversion of the crosssection weights matrix if we want to investigate the spatial effects between different geographical regions and regress spatial panel data model. Finally,it points out that the selecting puzzle about spatial weights matrix will be more and more objective on the basis of the latest literatures.
Key words contiguity based weights matrix;inverseistance weights matrix;economic based weights matrix;nested weights matrix
1 引 言
“地理學第一定律”指出地理空間觀測值都具有一定程度的空間依賴性或空間自相關性特征,亦即一個空間截面上的某種經濟地理現象或某一屬性值與相鄰空間截面上同一現象或屬性值是相關的,而且較近觀測值之間的相關性大于較遠的觀測值.在此思想基礎上發展起來的空間計量經濟學修正了傳統計量理論中樣本觀測值相互獨立的假定,通過將定量化描述的空間結構加入計量模型而使其更貼近客觀經濟事實.
作為目前理論計量經濟學領域討論的熱點之一,空間計量經濟學研究截面或面板數據回歸模型中如何處理空間依賴性(Spatial Dependence)和空間異質性(Spatial Heterogeneity)問題.詳細來講,空間依賴性可以用空間自回歸模型(Spatial Autoregssive Model)和空間誤差模型(Spatial Error Model)來刻畫(LeSage and Pace,2009)[1],而對于空間異質性,只要將空間截面的特性考慮進去,大多可以用經典的計量經濟學方法進行估計.當空間異質性與空間相關性同時存在時,空間變系數的地理權重回歸模型(Geographical Weighted Regression)就成為一種較好的選擇.當然,在建立空間計量模型進行分析之前一般需要先采用Moran’s I指數等指標進行空間相關性的預檢驗.
可以說,空間計量經濟學不僅解決了標準計量方法在處理空間數據時的偏誤問題,更為重要的是為測量這種空間聯系及其性質提供了全新的手段.然而,進行空間計量分析時,為了將空間交互作用納入到回歸模型中來,首要也是最為核心的步驟是要建立一個能夠有效表達空間交互作用的的權重矩陣.權重矩陣表征了空間截面單元某些地理或經濟屬性值之間的相互依賴程度,是連接理論分析上的空間計量經濟模型與真實世界中空間效應的紐帶.能否構建并選擇恰當的空間權重矩陣直接關系到模型的最終估計結果和解釋力(Chen,2009[2]).當然,不同的空間權重矩陣,反映的是研究對象背后不同的經濟學原理與視角,同時也對應著研究者對于空間效應的不同認識(Kostov,2010[3];朱平芳、張征宇、姜國麟,2011[4]).
本文對現有文獻的邊際貢獻在于,根據空間效應發生的起點及理論基礎的不同,歸納了現有空間計量研究文獻中出現的鄰接矩陣、反距離矩陣、經濟特征矩陣以及嵌套矩陣等主要空間權重矩陣形式,并進一步總結出這些截面空間權重矩陣的共同點、優缺點、逐步演變的脈絡及使用時需要注意的問題.依據在研究過程中遇到的一些限制,本文還構造了空間截面權重矩陣的兩種轉換,即通過權重矩陣轉換實現對不同地理區域之間空間效應的考察,以及從空間截面權重到空間面板權重的轉換.
2 截面空間權重矩陣的一般說明、
存在類型以及評價
空間計量實證文獻中經常出現的權重矩陣一般包括鄰接權重矩陣、反距離權重矩陣、經濟權重矩陣以及嵌套矩陣等.在具體介紹這些權重矩陣形式之前,先說明它們的基礎形式,即一個對角線元素為0的空間截面對稱矩陣,如式(1)所示.本文首先對該基礎形式進行一般化的說明,然后再分別介紹由此衍生的具體矩陣形式.
對于式(1)所示的空間截面權重矩陣基礎形式,有四點需要說明:①矩陣元素均被設定為已知常數,即矩陣元素均假定為是外生的.這就排除了空間權重矩陣參數化的可能,也意味著權重矩陣僅是關于空間截面i與j之間空間交互結構信息的量化形式;②矩陣對角線元素都是0.這意味著任意一個空間截面都不能與自身發生空間聯系;③矩陣特征根是已知的.這使得空間回歸模型的對數似然方程可以被精確計算出來;④矩陣元素均要做行和單位化處理,即按照公式W′ij=Wij/∑jWij將權重矩陣W每行之和為設置為1.這樣做的好處是,一方面,行和單位化后空間權重矩陣就變為了零量綱,這時權重矩陣就只反映空間相關結構;另一方面,在空間自回歸模型中,權重矩陣行和單位化之后便可將空間效應項解釋為其空間相鄰單元的加權平均值.需要注意的一點是,Parker(2011)[5]指出行和單位化雖然并不會改變空間單元之間關聯效應的相對大小,但是卻會在一定程度上改變其總體值.
2.1 空間鄰接權重矩陣述評
國外文獻中最早的空間計量模型是從鄰接矩陣(Contiguity Based Spatial Weights Matrix)開始的(Getis,2009[6]),鄰接矩陣在國內應用也最為廣泛(呂冰洋、余丹林,2009[7];任英華等,2010[8];王美今等,2010[9];魏浩,2010[10]).鄰接權重矩陣分為一階鄰接和高階鄰接兩類.其中,一階鄰接矩陣(First Order Contiguity Matrix)也叫二進制鄰接矩陣(Binary Contiguity Matrix),它假定空間截面之間只要擁有非零長度的共同邊界時,空間交互作用就會發生,賦值規則為相鄰空間截面i和j有共同的邊界用1表示,否則以0表示.進一步,設置一階鄰接矩陣時可以采用Rook鄰接或者Queen鄰接兩種規則.Rook鄰接規則僅把有共同邊界的空間樣本定義為鄰接單元,形式為:
其中,i,j為空間截面編號,i,j∈[1,n],n為空間截面個數.與此不同,Queen鄰接規則會將與某一空間樣本擁有共有邊界以及共同頂點的空間樣本均定義為其鄰接單元.由此可見,基于Queen鄰接規則的空間樣本常常與其周圍空間單元具有更加緊密的關聯效應.
作為一階鄰接矩陣的擴展,當研究者認為空間效應不僅發生在擁有共同邊界或共同頂點的空間截面之間,而是在某既定空間截面周圍的一定距離范圍D之內空間效應都存在,超過了給定的閾值距離則區域間的空間作用則可以忽略,則有:
2.2 反距離權重矩陣述評
空間反距離權重矩陣(Inversedistance Based Spatial Weights Matrix)假定空間效應強度決定于距離,空間單元之間距離越近則空間效應越強.空間反距離權重矩陣一般化的表達形式為:
其中,a和b分別為外生的距離摩擦系數和邊界共享效應系數;dij代表空間截面i和j之間的距離;βij為兩者共享邊界的長度占樣本i總邊界長度的比例.該變量出現的原因在于研究者認為若空間截面公共邊界的長度不同其空間作用的強度可能也不一樣,從而需要將共有邊界的長度納入權重計算過程中以使權重指標更加準確.當然,對于多數研究而言,將邊界共享效應系數b設定為0較為多見.
正如前文所言,在式(4)這種權重設置中,矩陣元素取決于空間截面之間距離的定義,可以依據經緯度數據計算其地表距離,或計算空間截面之間的公路、鐵路等不同交通方式的距離.對于中國空間區域經濟研究而言,較多文獻是通過緯度(Latitude)和經度(Longitude)位置計算省會城市地表距離來構建權重(Yu,2009[12];鐘水映、李魁,2010[13]).當然,也有文獻采用中國省會城市間的鐵路距離來構建反距離權重矩陣.陳繼勇等(2010)[14]在假定空間效應僅發生在擁有共同邊界的空間截面之間的前提下,依據式(4)令a=1且b=0形成了如下反距離權重矩陣:
2.3 經濟權重矩陣述評
盡管地理上的鄰接或反距離矩陣是考察空間相關性的起點,但是地理因素并不是產生空間效應的唯一因素.在空間計量模型設置過程中,還可以從經濟屬性角度設置空間權重矩陣.比如在區域經濟學研究中,區域單元的經濟發展水平、居民的文化素質、社會環境甚至風俗習慣等諸多因素都會使得空間單元之間產生交互影響.具有相似文化背景的空間單元之間更能夠實現隱性知識的傳播與交流,而經濟水平相似的空間單元則能夠更好地吸收與利用經濟資源從而趨近規模收益遞增狀態.
需要指出,國內學者使用經濟權重矩陣(Economic Based Weights Matrix)的頻率遠大于國外學者,通常做法是基于空間單元的某項產生空間效應的經濟指標的絕對差異來構建,取值為該經濟指標之差絕對值的倒數,形式為:
其中,X是研究者所選擇的形成空間矩陣元素的經濟變量,常用的包括人力資本量、外商投資額、人均或總量GDP等,而研究者之所以選取經濟變量X的原因在于認為該變量是形成空間效應的主導因素.經濟權重矩陣與地理權重矩陣的一個重要區別在于,經濟發展相對速度的不均衡會使得不同空間單元經濟屬性是動態變化的,而這個特征對于空間單元的地理屬性而言并不存在.這就對空間效應的研究帶來了干擾,學者們往往以損失一部分時間信息為代價,采用空間樣本時間段內的經濟變量算術均值來構建截面權重矩陣.在本文第三部分中會指出,已經有學者嘗試在空間面板計量模型中引入具有時變特征的權重矩陣形式.
從式(9)可以看出,空間單元之間的經濟變量值越接近即差異程度越小,其空間效應強度就越大.這意味著該形式的經濟權重矩陣直接繼承了構建反距離權重的思維(即距離越近,空間效應越強).顯然,經濟聯系的復雜性使得這種思維并不準確.實際上,空間單元之間經濟變量差異較大時所展示出的空間關聯是否比差異較小時展現出的空間效應弱這個問題的答案,并不是顯而易見的.詳細來講,同樣是存在較強的空間關聯的情況下,經濟稟賦不同的兩個空間單元之間可能是通過橫向產業間分工而產生空間關聯,這時兩者的經濟屬性很可能會趨同;也有可能是通過縱向產業內分工而產生空間聯系,這時兩者的經濟屬性很可能會越來越不同.如果以上懷疑成立的話,研究者就必須更加謹慎地使用經濟權重矩陣.
另外,朱平芳、張征宇和姜國麟(2011) [4]采取了不同于式(9)形式的經濟權重矩陣形式,他們根據不同空間單元經濟變量X的相對差異而不是絕對差異來構造經濟權重矩陣,形式為:
其中,Xi是所選擇的空間單元i的經濟變量,Ji是所有與i具有共同邊界的空間截面集合.容易發現,式(9)這種經濟權重的形式可以自然地成為一個行和單位化的矩陣.
2.4 嵌套權重矩陣述評
當研究者認為空間效應中同時蘊含著距離因素與經濟因素時,就用到了嵌套矩陣(Nested Weights Matrix).嵌套矩陣將反距離權重矩陣和經濟特征權重矩陣有機地結合起來使用,其目的在于盡量準確地刻畫空間效應的綜合性及復雜性(Parent and LeSage,2008) [17].
3 關于截面空間權重矩陣的兩種轉換
3.1 通過轉換實現對不同區域之間空間效應的分析
在區域經濟學研究中,經常需要按照類似的地理位置、經濟或人口規模等標準將不同的空間單元劃分為不同的區域,并進而研究區域內部和區域之間的空間效應.對此類問題的研究可以通過對空間權重矩陣加以轉換來實現.
如果僅關注某一地理區域內部各樣本之間空間效應,那么空間權重矩陣的轉換較為簡單,只需將其他區域樣本的空間權重元素設置為0即可.如果研究者關注的是區域之間的空間效應,則轉換就相對復雜些(Ledyaeva,2009[20]).概括來講,需要將各地理區域內部的各空間單元權重設置為0,同時將來自不同地理區域的空間單元權重按照前文所述的鄰接矩陣、反距離矩陣、經濟特征或者嵌套權重矩陣的賦值規則進行構建.為了說明便利,假設要考察我國東部與中部區域之間的空間效應,并假設省區1、2、3位于東部,省區4、5、6位于中部,則我們需要將位于不同區域的下列矩陣元素w14-w16、w24-w26、w34-w36、w41-w43、w51-w53、w61-w63按照某一賦值規則設置,其他元素則賦值為0,形式為:
3.2 通過轉換實現對空間面板計量模型的分析
本文第二部分中歸納的空間權重矩陣均為截面矩陣,且采用空間單元某一年數據或者多年數據均值來構建.采用這種截面權重的空間計量模型一方面忽視了變量在時間序列上的相關性,另一方面也使得數據信息沒有被充分利用從而增加了計量結果的偶然性和隨機性.當研究者將面板數據模型的優點和截面空間計量模型的優勢結合起來而構建空間面板計量模型時,就有必要把空間權重矩陣從截面形式擴展到面板形式.
需要注意的是,面板數據集的排列方式不同,其所對應的面板權重矩陣格式也不相同.如果面板數據的布局是:先排放第一個時間節點上所有空間單元數據,再依次按照時間順序向下排列第二個至第t個時間節點上的所有空間單元數據,那么,此時空間面板權重矩陣W是一個nt×nt的矩陣,其中,n為空間單元數,t為時間序列數.形式如下:
其中,W1到Wt分別表示各個時間節點上的截面空間權重矩陣.依據前文,這里Wt可以是鄰接或反距離權重矩陣,這時自然滿足W1=…=Wt;Wt也可以是經濟權重矩陣或者嵌套矩陣.此時研究者為了維持空間權重矩陣的穩健性,一般會通過采用樣本期內經濟變量均值的方式使得權重統一起來.值得特別指出的是,Lee and Yu(2012)[21]已經開始研究具有時變特征的空間面板權重矩陣及其相應的空間模型估計方法,他們指出當權重矩陣隨著時間有較大的改變時,此時再設置不變的空間權重矩陣將導致較大的估計偏差.
4 總 結
構建空間計量模型時首要也是最為核心的步驟是要建立一個表達空間交互結構的的權重矩陣,能否構建并選擇恰當的空間權重矩陣直接關系到模型的最終估計結果和解釋力.本文歸納了現有空間計量研究文獻中出現的鄰接矩陣、反距離矩陣、經濟特征矩陣以及嵌套矩陣等主要的空間權重矩陣形式,并闡明了各種權重矩陣的優缺點以及演變脈絡.然后,本文陳述了空間權重矩陣的兩種必要的轉換,即通過權重矩陣轉換實現對不同地理區域之間空間效應的考察,以及從空間截面權重到空間面板權重的轉換.
需要強調的是,本文第二部分所歸納的矩陣形式均是研究者根據自身對于空間效應的主觀認識以及各自的研究目標而外生地設置的.實際上,最理想的空間權重矩陣構建方法是通過殘差估計或半參數估計等方法來實現,而不是由研究者主觀地外生給定,但實際研究中往往由于空間分布不確定性(Spatial Uncertainty)與空間非平穩性(Spatial Nonstationarity)等原因使得估計空間權重非常困難.
既然大多數研究者不得不使用現有的多種類型的外生空間權重矩陣,那么,如何選擇合適的權重矩陣形式就成為備受關注的前沿問題,甚至已經成為空間計量經濟學研究面臨的一個重要的方法論問題.幸運的是,對于如何合理選擇空間權重矩陣的研究正在逐步涌現.LeSage and Fischer(2008)[22]依據最小化AIC信息準則的方法尋找使得各種空間計量回歸模型擬合優度(Goodnessoffit)最好的權重矩陣;Kostov(2010)[3]、Chen(2012)[23]證明可以利用自相關與偏相關函數分布圖來選擇不同的空間鄰接矩陣.與此同時,空間濾波實驗法(Spatial Filtering)、搜尋演算法(Search Algorithms)以及熵計量技術(Entropy Econometrics Techniques)的應用已經被證明有益于空間權重矩陣的選擇(Gumprecht et al.,2009[24];Vázquez,2011[25]).
雖然,以上這些權重矩陣選擇方法所獲得的空間效應系數可能僅僅是最優值而不是真實值,即采用這些方法未必能夠找到真實世界中的空間依賴和社會交互關系(SangYeob Lee,2009[26]),但是相信在這些文獻探索的基礎上,空間權重矩陣的選擇必將越來越客觀并逐步接近其真實狀態.只是在現階段的大多數時候,根據權重矩陣是否易于構建并主觀地選擇權重矩陣已經成為通行的做法.
參考文獻
[1] J P LESAGE, K R PACE.Introduction to spatial econometrics [Z].Boca raton:CRC Press/Taylor Francis,2009.
[2] Yangguang CHEN. Reconstructing the mathematical process of spatial autocorrelation based on the moran statistic [J].Geographical Research, 2009, 28 (6):1449-1463.
[3] P KOSTOV.Model boosting for spatial weighting matrix selection in spatial lag models [J]. Environment and Planning B:Planning and Design, 2010,37(3):533-549.
[4] 朱平芳,張征宇,姜國麟.FDI與環境規制:基于地方分權視角的實證研究[J].經濟研究,2011(6):133-145.
[5] D PARKER.A brief introduction to spatial econometrics [Z].Lecture notes, URL: classweb. gmu.edu/dparker3/lumta_present/spat_econ_intro.pdf, 2011.
[6] A GETIS. Spatial weights matrices[J].Geographical Analysis, 2009, 41(4):404-410.
[7] 呂冰洋,余丹林.中國梯度發展模式下經濟效率的增進[J].中國社會科學,2009(6):60-72.
[8] 任英華,徐玲,游萬海.金融集聚影響因素空間計量模型及其應用[J].數量經濟技術經濟研究,2010(5):104-115.
[9] 王美今,林建浩,余壯雄.中國地方政府財政競爭行為特性識別:“兄弟競爭”與“父子爭議”是否并存[J].管理世界,2010(3):22-33.
[10]魏浩.中國30個省市對外貿易的集聚效應和輻射效應研究[J].世界經濟,2010(4):68-74.
[11]Richard HARRIS, Victoria KRAVTSOVA. In search of “W”[J]. Spatial Economic Analysis ,2011,6(3):249-270.
[12]Yihua YU.CHINA_SPATDWM:Stata module to provide spatial distance matrices for Chinese provinces and cities[Z]. Statistical Software Components S457059, Boston College Department of Economics,2009.
[13]鐘水映,李魁.人口紅利、空間外溢與省域經濟增長[J].管理世界,2010(4):14-35.
[14]陳繼勇,雷欣,黃開琢.知識溢出、自主創新能力與外商直接投資[J].管理世界,2010(7):30-42.
[15]符淼.地理距離和技術外溢效應——對技術和經濟集聚現象的空間計量學解釋[J].經濟學,2009,8(4):1550-1566.
[16]潘文卿.中國的區域關聯與經濟增長的空間溢出效應[J].經濟研究,2012(1):54-64.
[17]O PARENT, J P LESAGE.Using the variance structure of the conditional autoregressive spatial specification to model knowledge spillovers [J].Journal of Applied Econometrics, 2008, 23(2): 235-256.
[18]李婧,譚清美,白俊紅.中國區域創新生產的空間計量分析[J].管理世界,2010(7):43-54.
[19]張征宇,朱平芳.地方環境支出的實證研究[J].經濟研究,2010(5):82-94.
[20]S LEDYAEVA.Spatial econometric analysis of determinants and strategies of foreign direct investment in russian regions[J]. World Economy, 2009,32(4):643-666.
[21]Lungfei LEE,Jihai YU.QML estimation of spatial dynamic panel data models with time varying spatial weights matrices[J].Spatial Economic Analysis , 2012, 7(1):31-74.
[22]J P LESAGE, M M FISCHER.Spatial growth regressions: model specification, estimation and interpretation[J].Spatial Economic Analysis, 2008, 3(3): 275-305.
[23]Yanguang CHEN.On the four types of weight functions for spatial contiguity matrix [J]. Letters in Spatial and Resource Sciences, 2012,5(2):65-72.
[24]D GUMPRECHT, W MULLER, Juan RODRIGUEZDIAZ. Designs for detecting spatial dependence [J].Geographical Analysis, 2009, 41:127-143.
[25]E F VZQUEZ.Updating weighting matrices by cross entropy[J].Investigaciones Regionales, 2011, 21:53-69.
[26]SANGYeob Lee. Bias from misspecified spatial weight matrices in SAR models: Theory and Simulation Studies[Z].Working paper from http://www. bss.sfsu.edu,2009.