摘要:在經濟和社會學的學者研究的領域中,充滿著各種各樣具有空間特性的社會、政治、經濟現象。這就要求人們利用一些空間分析的工具去理解現象。對空間相關性的認定和度量就是進行空間數據分析的前期準備,重要操作層面上的問題就是包含在模型中的空間相關性的結構應以什么樣的方式表示出來。
關鍵詞:空間相關性;計量經濟;空間統計學
中圖分類號:F224.9
文獻標識碼:B
在經濟和社會學的學者研究的領域中,充滿著各種各樣的復雜的社會、政治、經濟現象。其中的很多現象,例如城市化,經濟發展,技術創新的擴散,都是跨地理空間分布的。這就要求理論框架和數據分析的能力要能包括社會現象的地理特征。對空間相關性的認定和度量就是進行空間數據分析的前期必要準備,無論是在空間統計學還是空間計量學中,一個非常重要的操作層面上的問題就是包含在模型中的空間相關性的結構應以什么樣的方式表示出來。空間相關性的度量主要是涉及三個方面:空間相鄰,空間相鄰矩陣,空間權重矩陣。
一、空間相鄰
空間相關性的概念意味著需要決定在某一個空間系統中那些空間單位對要考慮的特定的空間單位有影響。

為了在這個概念上加上一個空間的色彩,將這個概念進一步的引入空間分析的范疇,又可以定義如下:

其中djj是i和j在空間距離的一種度量,εi是每一個空間單位i的一個關鍵中止點,在有些情況下對所有的i都是相同的。潛在的度量djj的尺度可以是歐式距離,也可以是通常的明可夫斯基距離。
這個替代性的概念通過把統計上的相關性和空間概念結合起來在空間數據集中引入了一個附加的結構。從這個定義可以看出,有些空間單位盡管從條件概率的角度說對研究的特定單位有影響,但由于它們不滿足距離上的限定,從而被排除在外。雖然這個定義排除了這樣一些空間單位,但這僅意味著它們不是最近的鄰居,它們還可以在更高階的鄰居的范疇內被包括進來,也許它們對研究單位的影響是通過與它們相鄰的其他單位來施加影響的。
二、空間相鄰矩陣
對于空間相關性,或更確切地說對于空間自相關的最初的度量標準是由Moran和Ceary在21世紀50年代前后提出的,這個度量是建立在空間單位的二進位的相鄰概念的基礎上的。按照這個概念,潛在的相鄰結構是由0和1兩個數值來表示的。比如說如果兩個單位有一個共同的非零長度的部分,那么它們就被認為是相鄰的,就被賦予1這個數值。
這個相鄰的概念很明顯假定了一個地圖的存在,從而邊界可以被確認。對于一個被不規則排列的空間地區單位來說這個定義是相當清楚的,但對于像規則的方格或一群不規則排列的點來說,是否相鄰的決定并不是唯一的。

例如,考慮一個表示在圖1中的規則方格和相應的質心。在單位a和其他相鄰的單位之間的共同部分的確定有幾種不同的方式。例如,它可以被看作是一條共同的邊界,如果是這樣的話,單位b就可以被看作是相鄰的。另外一種方式是以有共同的頂點為基礎來考慮,那么單位c就可以被看作是與單位a相鄰的。或者這兩種方式都被認可,那么單位b和單位c都可以認為與單位a相鄰。與國際象棋相類似,它們分別對應于車(rook),主教(bishop)和皇后(queen)的移動規則。
當空間單位是由空間中規則或不規則分布的點組成時,比如地圖中的城市,相鄰的意義可以由網絡中或圖中點與點之間的最短距離引出來,如在圖1中方格中擺放的點。如果他們之間的距離在一個給定的距離之內,那么它們被認為是相鄰的。例如單位B都在以質點A為圓心的一個直徑的范圍內,它們都被看作是與單位A的相鄰的點。
上述定義的都是一階相鄰的情況,還可以以一種類似的方式去考慮多階的相鄰問題。在描述該概念時可以借助一種遞歸的形式。當某些空間單位是與k—1階相鄰單位點相鄰,而沒有與更低階的相鄰單位點相鄰時,稱這些空間單位點與筆者研究的特定的那個空間單位點是k階相鄰的。例如,在圖1中,單位c和單位d都是單位s的二階相鄰的點如果按照車(mdc)的移動方式來定義一階相鄰的話,因為它們都是單位b的一階相鄰的點。

與在圖和網絡理論里采用的方法一致,相應的空間結構也可以以,種相鄰矩陣的形式表現出來。有點類似于投入產出表,在這個矩陣中,每個空間單位既表示成行也表示成列。在每一行中,非零的元素代表與該行所表示的單位相鄰的空間單位。例如,表1表示用車(10dc)的移動方式來定義一階相鄰。我們規定,一個空間單位不與它自己相鄰,所以矩陣中對角線的元素是零。
但這個相鄰矩陣的使用也有些不盡如人意的地方。比如說,二進位的相鄰可以有很多種定義方式,這顯然不是我們想要的性質。而且,對于包括在計量模型中的空間作用聯系,這種相鄰性只能提供一種簡單的描述。可能幾種不同的空間單位的排列方式,通過相鄰矩陣來表示的時候,得出一個完全一樣的矩陣。
三、空間權重矩陣
在20世紀七八十年代,Cliff和Ord對這個簡單的二進制的相鄰的概念進行了擴展,將反映兩個空間單位潛在互相作用的更具一般性的度量納入了相鄰的范圍。,他們提出了一個空間權重矩陣,也被稱為Cliff-Ord權重矩陣。但應采取何種方式去設定這個矩陣中各個元素的數值也是空間計量學中最困難和最有爭議的問題之一。
最初Cliff和Ord提出的方法考慮了將兩個空間單位之間的距離和它們的共同邊界的相對長度結合起來。這種空間權重矩陣可以表示如下:

其中dij是空間單位‘和/之間的距離,島是空間單位i和j共同的邊界長度占單位6總長度的比重。口和b是兩個參數。由于空間單位i和j可能會有不同的邊界長度,因而這個方法求得的矩陣并不是個對稱矩陣。采用相同的思路,Dacey將空間單位的相對面積也作為一個因素考慮到權重矩陣中去了。他定義的矩陣如下:

其中由是用二進制相鄰表示的,是空間單位/的面積在整個空間單位面積總和的比重,βii是空間單位i和j共同的邊界長度占單位‘總長度的比重。
以上這些權數都與地圖中的空間單位的有形特點緊密相連。同二進制相鄰的方法—樣,當這些空間單位是由點所構成的時候,它們的使用價值不大,因為邊界的長度和面積在很大程度上是人為決定的。而且要考慮的空間互相作用的現象是被一些純粹的經濟因素決定,因為它們與在有形地圖上的空間邊界結構沒有什么關系,所以這些確定權數的方法也不能有較現實的實際意義。
在大部分地域科學的應用中,這些權重矩陣都是以距離和相鄰關系為基礎的。在很多情況下,這些距離可以以運輸時間,兩地距離長度,或多維縮放分析導出的結果為基礎。在大部分空間社會經濟分析的應用中,權重矩陣都是由一些社會網絡理論的概念決定的。
在權重矩陣中所包含的參數會導致一些問題。由于這些權重被假定是外生的,參數的值要被事先確定,這就對結果的估計和解釋造成了一些問題。尤其是由于估計的正確性在很大程度上是決定于空間的結構是否被正確的反映到權重矩陣中,最后的結論可能會被事先不正確的假定所扭曲。有時會有這樣的尷尬局面,想要從數據中發現的空間結構在數據分析執行之前就被假定為已知的了。
總地看來,對于在空間計量分析中應采用哪一種權重矩陣的形式人們還沒有形成統一的意見。筆者認為包括在空間權重矩陣中的空間相關性結構應被審慎的選擇,應該符合一些空間互相作用理論和社會經濟背景。由于空間計量學與空間統計學不同,前者更側重于模型驅動的方法,這就決定了在應用和選擇空間權重矩陣時,要結合相關的空間經濟理論,并以研究問題的目的和對象特點,來決定方法的選擇。