摘要:從空間自相關的基本構成出發,提出了一種測度名義尺度的空間自相關指數——自鄰接指數,給出了基于名義尺度下全局空間自相關和局部空間自相關的測度方法,并在ArcView平臺下通過Avenue二次編程進行了算法實現。最后通過例子展示了自鄰接指數在土地利用格局分析中發揮的重要作用。
關鍵詞:名義尺度; 空間自相關; 自鄰接指數; GIS
中圖法分類號:TP391文獻標識碼:A
文章編號:1001-3695(2007)01-0069-03
地理實體之間總是表現出一定的空間關聯性。Tobler提出著名的地理學第一定律[1]:“空間實體總是相互關聯的,特別地,距離較近的實體間這種關聯表現得更為顯著。”在此基礎上,Cliff提出空間自相關的概念[2],其定義為“一個空間單元內的信息與其周圍單元信息的相似性”[3]。作為空間統計學中的研究熱點,空間自相關分析在區域經濟、應用生態、景觀分析、預防醫學等領域已取得較好的研究成果[4~7]。與此同時,關于空間自相關的算法研究在近年來逐漸得到重視。Zhang等人在ArcView中通過Avenue語言實現了Moran’s I等空間統計運算[8];毛亮等人在MapInfo中通過MapBaisc語言實現了基于實體的空間鄰接指數和鄰接概率矩陣的運算[9]。
目前的空間自相關研究還存在諸多不足,如在地理學研究中按照屬性表達的差異,可以將地理數據劃分為名義尺度、二元尺度、順序尺度、間隔尺度和比例尺度五類[10]。目前的空間自相關研究大多是面向解決后三類尺度上的定量、半定量空間統計問題,而對于定性空間統計問題的方法研究則相對薄弱,僅停留在較簡單的二元尺度上,對名義尺度少有涉及。由此,本文試圖提出一種基于名義尺度的空間自相關測度方法,并給出相應算法實現。
1基于名義尺度的空間自相關測度方法
空間自相關是從數理統計的相關概念發展而來,卻又有別于經典統計的相關,在一般相關的基礎上,加入了空間相鄰這一影響因素。現今使用的空間自相關指數測度方法,是建立在基于矩陣運算的一般交叉積統計(General CrossProduct Statistic)的基礎上[11],如式(1)所示。
式(1)中,Wij代表統計單元在空間上的臨近度,Cij代表統計單元在屬性上的相似度。圍繞對空間臨近矩陣和屬性相似矩陣的不同定義,產生了眾多空間自相關指數計算方法,常見的空間自相關指數Moran’s I[12],即可看成作為屬性相似測度的自相關系數矩陣與作為空間臨近測度的空間鄰接矩陣相互乘積的歸一化結果。
1.1全局自鄰接指數
目前空間自相關指數的構造大多是通過差值大小來反映屬性的相似度。名義尺度數據即用數字表示地理實體、地理要素、地理現象或地理事件的狀態類型[10],這類數據相互之間無法進行比較運算,故有必要對名義尺度數據的空間自相關指數進行重新構造。根據式(1),空間自相關系數由空間臨近矩陣和屬性相似矩陣這兩大部分組成。對于名義尺度數據來說,屬性相似矩陣的構造相對簡單,可以表示為
其中Ai(i = 1,2,…,n)為地理實體i所擁有的屬性值。
另一方面是對空間臨近矩陣的定義。從總體上講,W矩陣中鄰居可以通過鄰接關系或是距離關系來定義。前者的鄰接關系又可以分為基于拓撲的表示和基于邊界的表示,后者的距離定義又可以分為中心點距離定義和邊界距離定義。由于屬性相似矩陣所表達的信息相對簡單,因此有必要選擇表達信息較為豐富的W矩陣。在此選擇的鄰接指數是景觀生態學中提出的概念,反映了空間格局的異質性程度,本質上屬于邊界表示的空間鄰接關系型空間臨近矩陣,相比于一般鄰接矩陣具有較為豐富的信息,其定義可由式(3)給出[13]。其中Pij表示i, j兩個地理實體間的公共弧段長度,Pi為實體i的周長(式(4))。
綜上所述,若同時考慮依據式(1)~式(3)將空間臨近矩陣和屬性相似矩陣進行乘法運算,則得出基于名義尺度數據的空間自相關指數N,可表達為
因為N是由鄰接指數的概念演化而來,又代表了地理實體間的自相似性,所以將N反映出來的關系稱為空間自鄰接。顯然,此處N是一個反映全局空間自相關的指數,因而稱N為全局自鄰接指數。式(5)中N的取值在(0,1)之間,且取值愈大,說明全局自相關性愈強。
1.2局部自鄰接指數
全局空間自相關指數僅說明各統計單元在空間上是否相關,但無法描述各單元在空間上的相關模式。針對這一問題,Anselin提出局部空間關聯指數(Local Indicators of Spatial Association, LISA),并對LISA結果在空間上實現了可視化[14]。LISA本身是針對定量數據的研究提出來的,而在定性數據的空間自相關測度中,同樣需要對LISA進行研究。
對于局部自相關指數的構造,依然遵循全局自相關指數采用的構造原則。事實上,式(2)、式(3)分別反映了局部單元i與臨近單元j之間的空間臨近狀態和屬性相似狀態,因而局部自鄰接指數Ni可以表示為
式(6)中Ni的取值在(0,1)之間,且取值愈大,說明該地理實體的局部空間自相關性愈強。將式(5)與式(6)相對照,全局自鄰接指數可以表達為各實體局部自鄰接指數加權之和。
2基于名義尺度的空間自相關算法實現
對應于空間自相關指數的構造原則,自鄰接指數的計算也可分為兩大部分:空間臨近矩陣即鄰接指數的生成和屬性相似矩陣的判別。在此基礎之上,根據式(5)、式(6),可以實現基于名義尺度的全局和局部空間自相關指數計算。
2.1空間鄰接關系建立
計算空間鄰接指數的前提條件是建立空間拓撲關系,圖1給出的是ARC/INFO拓撲關系存儲示意。圖1(a)為線、面的空間分布示例;圖1(b)為對應的多邊形屬性表(Polygon Attri ̄butes Table, PAT),每一多邊形均具有各自的屬性特征;圖1(c)為對應的弧段屬性表(Arc Attributes Table, AAT),每一弧段均有對應的左、右鄰接多邊形。
基于上述拓撲信息,可以計算每一多邊形的所有鄰接對象,構建如表1所示的多邊形鄰接鏈表(Polygon Neighbors List, PNL)對結果進行存儲。固定左鄰接多邊形編號,對所有記錄遍歷查找右鄰接多邊形列,將符合條件的多邊形加入鄰接多邊形鏈表中。基本算法如下:
2.2鄰接指數計算
基于構建的鄰接多邊形鏈表,查詢AAT中相應弧段的長度,
建立多邊形鄰接弧段鏈表(Polygon Neighbor Arcs List, PNAL)。PNAL的表結構如表2所示。根據鄰接多邊形編號逐一搜索相應弧段,提取相應弧段的長度,存儲到鄰接弧長數據項中。該項與待計算多邊形周長進行比值運算,即可得到各多邊形之間的鄰接指數。相應算法描述如下:
2.3屬性相似矩陣判別與自鄰接指數生成
根據PAT中的待計算屬性項,對PNAL中的鄰接多邊形鏈表逐項進行判別,凡是不滿足屬性相同條件的鄰接多邊形均應舍棄。由此得出多邊形自鄰接弧段鏈表(Polygon Auto Neighbor Arcs List, PANAL),如表3所示。
表3多邊形自鄰接弧段鏈表
多邊形編號多邊形周長自鄰接多邊形自鄰接弧長多邊形自鄰接指數
……………
210420.2
……………
對表3中每行記錄所保留下來的多邊形自鄰接指數進行求和,即生成每一空間單元的局部自鄰接指數。對表3的遍歷運算即可得到全局自鄰接指數結果。上述步驟涉及的關鍵算法描述如下:
(1)自鄰接弧段鏈表生成算法
3應用示例
下面選擇某區域土地利用現狀作為數據源,在ArcView中采用Avenue語言[15],對基于名義尺度數據的空間自相關指數測度算法進行了實現。
圖2為試驗區域的土地利用現狀,按土地利用方式劃分為八種類型,分別是耕地、園地、林地、其他農地、集鎮及工礦、道路、未利用地、河流。從地類分布上看,試驗區域以耕地分布為主,可以看作是景觀格局中的基質元素,園地、林地及集鎮工礦等用地成斑塊狀鑲嵌其中,而未利用地、道路、河流所占比例相對較小。
從上述格局分析得出的定性判斷,可以通過進一步的空間自相關分析給出定量化證據。根據全局空間自相關統計,可以得出試驗區域的自鄰接指數N=0.427,說明實驗區域整體上同類地塊之間存在一定的集聚效應,具有較為明顯的空間自相關性。為了進一步說明區域內部的空間自相關格局,對試驗區的局部自鄰接指數進行了計算,并將結果按0.2的間隔進行分類。圖3是相應的灰度分級圖。在此基礎上,將圖2與圖3疊置分析,則可得到不同地類的局部空間自相關統計(表4)。
表4不同地類的局部空間自相關統計表
表4中的自相關指數結果合理地反映了空間積聚狀態,對于該試驗區,直接指示了土地利用的集約和整合狀況。計算結果表明,各種用地類型局部自相關指數存在差異。按照自相關指數特征可以分為三類:①以耕地為代表,具有顯著的自相關性,Ni均值高達0.603,這說明耕地分布相對集中,成連片格局。②除耕地外的農用地以及集鎮工礦、未利用地為代表,指數變化范圍明顯,而均值較小,低于0.2。其中最低的為未利用地,說明其分布最為破碎。值得注意的是,集鎮工礦的指數較低,進一步分析可以發現,指數按照城鎮用地、農村居民點、工礦用地以此遞減,說明此處建設用地,尤其是工礦用地有待整合。③道路與河流的指數結果較為特殊,一方面均值不太顯著,另一方面變化幅度不大,且最大值較小。這與其形狀特征存在較大關聯,道路與河流均屬于線形地理要素,與其他地理要素之間鄰接較大,故自相關指數一般不明顯;而道路相比于河流,線形特征更為明顯,因而自相關性更弱。
4結束語
本文通過定義自鄰接指數,實現了一種基于名義尺度數據的空間自相關指數的測度方法。經過對試驗數據的分析,發現自鄰接指數可以反映出空間關聯特征,并具有較好的可視化效果。
對于這方面的研究,本文只是一個初步的探討,大量的后續工作有待開展:①W矩陣存在較多的定義方式,不同方式下的自鄰接指數會發生怎樣的變化有待研究;②本文的研究是基于矢量數據開展的,對于柵格數據的名義尺度數據空間自相關測度,尚需從別的角度進行討論;③自鄰接指數存在尺度效應,除了空間尺度與時間尺度的影響外,人為引起的名義尺度數據分類尺度也是引起指數變化的重要因素,如何選擇合適的尺度進行研究值得探索。
參考文獻:
[1]Tobler W R. A Computer Movie Simulating Urban Growth in the Detroit Region[J]. Economic Geography, 1970, 46(2):234240.
[2]Cliff A D, Ord J K. Spatial Autocorrelation[M]. London: Pion, 1973.
[3]王勁峰, 李連發, 葛詠,等. 地理信息空間分析的理論體系探討[J]. 地理學報, 2000, 55(1): 92103.
[4]陳斐, 杜道生. 空間統計分析與GIS在區域經濟分析中的應用[J]. 武漢大學學報(信息科學版), 2002, 27(4): 391396.
[5]何田華, 楊繼, 饒廣遠. 植物居群遺傳變異的空間自相關分析[J]. 植物學通報, 1999, 16(6):636641.
[6]曾輝, 江子瀛, 孔寧寧,等. 快速城市化景觀格局的空間自相關特征分析——以深圳市龍華地區為例[J]. 北京大學學報(自然科學版), 2000, 36(6): 824831.
[7]范新生, 應龍根. 中國SARS疫情的探索性空間數據分析[J]. 地球科學進展, 2005, 20(3): 282291.
[8]Zhang Z Q, Griffith D A. Developing Userfriendly Spatial Statistical Analysis Modules for GIS: An Example Using ArcView [J]. Compu ̄ter, Environment and Urban System, 1997, 21(1): 529.
[9]毛亮, 李滿春, 劉永學. 基于實體數據模型的空間鄰接定量分析探討[J]. 計算機應用研究, 2005, 22(4): 203204.
[10]徐建華. 現代地理學中的數學方法(第2版)[M]. 北京: 高等教育出版社, 2002.
[11]Hubert L J, Golledge R G, Costanzo C M. Generalized Procedures for Evaluating Spatial Autocorrelation [J]. Geographical Analysis, 1981, 13(3): 224233.
[12]Moran P A. Notes on Continuous Stochastic Phenomena[J]. Bio ̄metrika, 1950, 37(12): 1723.
[13]劉永學, 張忍順, 李滿春. 江蘇淤泥質潮灘遙感影像特征與信息提取方法研究[J]. 遙感信息, 20-04, (1): 2326.
[14]Anselin L. Local Indicators of Spatial Association: LISA [J]. Geographical Analysis, 1995, 27(3): 93115.
[15]王盛, 黃詩峰, 楊存建. Avenue程序設計環境[M]. 北京: Arc/Info中國技術咨詢與培訓中心, 1998.
作者簡介:
朱士松(1982),男,碩士研究生,主要研究方向為地理信息系統應用與開發;李滿春(1964),男,教授,博導,主要研究方向為遙感和地理信息系統;劉永學(1976),男,博士,主要研究方向為地理信息系統設計與開發。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文