鄧韜 鄭貴華
摘 要:敘述了GIS(地理信息系統)的功能及其技術特點、數據分層,并分析了地理數據的組織與數據結構。
關鍵詞:GIS數據組織數據結構GIS技術特點
中圖分類號:P208 文獻標識碼:A 文章編號:1674-098X(2012)06(b)-0115-02
GIS(地理信息系統)是基于計算機軟硬件的、用于處理和管理與空間地理位置有關的綜合空間信息系統,它是計算機圖形學、數字圖像處理和數據庫技術相結合的產物,是集計算機科學、測繪遙感學、地理學、環境科學、空間科學、信息和管理科學于一體的新興邊緣學科。
1 GIS的功能及其技術特點
GIS可用來管理和分析一切與地理空間分布有關的環境、地質勘查、礦產資源管理、測繪、土地管理、公安、消防、電訊、國防、交通、教育等各個領域。GIS可定義為一個具有空間地理信息輸入、存儲、分析、輸出功能的系統,是一個支持空間決策的系統。GIS按一定的空間拓撲關系,描述和存儲各種空間要素,利用數據庫管理系統的成熟技術,將地理屬性數據管理和空間數據的拓撲關系相結合,使系統變得實用、靈活。GIS的功能大致可劃分為數據輸入、編輯,地圖繪制,圖形、數據輸出,地圖管理,空間數據拼接和提取等空間分析、計算,投影坐標轉換,網絡功能,數字地面模型等。
GIS的顯著特點,就是在合理的空間拓撲關系上實現了地理的描述性屬性數據和空間數據的有機連接,在屬性數據管理上,運用了流行的關系數據庫技術,使得GIS與外部關系數據庫的連接十分容易。
2 GIS的空間數據組織與數據結構
GIS主要包括空間數據和與之相關聯的屬性數據。空間數據主要是指構成地圖對象的幾何圖形,它主要由點、線、面等目標構成。屬性數據主要由與地圖對象相關聯的文字信息、圖像、聲音、視頻等構成。
在地理信息系統中,一般對地圖進行分層組織。不同的圖層,一般包含不同類型的地圖對象。例如在一幅城市建設的地圖上,可以將交通道路專門放在一個圖層中,而將主要建筑物放在另外一個圖層中。這樣做,便于對同一類地圖對象進行信息處理,而不受其它類型的對象干擾。例如,當用戶只關心城市的交通狀況時,就可以關閉建筑物等其它圖層,只顯示和查詢處理交通層。當然,也可以將多個圖層結合起來進行較復雜的信息處理。
地圖圖層由地圖目標對象構成,而地圖目標對象主要由點、線、面等基本目標組成,這些點、線、面都有它們的幾何屬性。這些幾何屬性描述了地圖對象的坐標信息、顏色、線型、填充模式等特征。此外,地圖對象還具有與之相關聯的文字、圖像、聲音、視頻等屬性信息。由于這些屬性信息都是與具體的地圖目標對象相關聯的,所以根據地理信息的這一特征,我們可以應用面向對象的方法來組織地理數據。
2.1 數據結構
數據結構是指數據之間的相互關系,即數據的組織形式,它是描述地理實體數據本身的組織方法,稱之為內部數據結構。GIS內部數據結構主要有柵格數據結構、矢量數據結構兩大類。其兩類數據結構均可用來描述地理實體的點、線、面三種基本類型。
1)柵格數據結構
柵格數據結構是通過空間點的密集而規則的排列表示整體的空間現象的,其數據結構簡單,定位存取性能好,可以與影像和DEM(數字高程模型)數據進行聯合空間分析,數據共享容易實現,是地理信息系統重要的一種空間數據存儲結構。
柵格結構是最簡單、最直接的空間數據結構,也稱之為網格結構(raster)或像元結構(Pixel),它是將地球表面劃分為大小均勻緊密相鄰的網格陣列,每個網格作為像元或者像素,由行、列號定義,并包含一個代碼,表示該像素的屬性類型和量值。因此,柵格結構是以規則的陣列來表示空間地物或現象分布的數據組織,組織中的每個數據表示地物或現象的非幾何屬性特征。
柵格結構中,點用一個柵格單元表示,線狀地物則用沿線走向的一組相鄰柵格單元表示,每個柵格單元最多只有兩個相鄰單元在線上,面或區域用記錄有區域屬性的相鄰柵格單元的集合表示,每個柵格單元可有多余兩個的相鄰單元同屬一個區域。任何以面狀分布的對象都可以用柵格數據逼近。遙感影像就屬典型的柵格結構,每個像元的數字表示影像的灰度等級。
柵格結構表示的地表是不連續的,是量化和近似離散的數據。柵格數據的比例尺就是柵格大小與地表相應單元大小之比。
2)矢量數據結構
矢量數據結構是通過記錄坐標的方式,盡可能地將點、線、面地理實體表現得精確無誤。其坐標空間假定為連續空間,不必像柵格數據結構那樣進行量化處理。因此矢量數據能更精確地定義位置、長度和大小。矢量結構的特點是定位明顯、屬性隱含。
點實體,矢量結構中只記錄其在特定坐標系下的坐標和屬性代碼;線實體,就是用一系列足夠短的直線首尾相接表示一條曲線,當曲線被分割成多而短的線段后,這些小線段可以近似地看成直線段,而這條曲線也可以足夠精確地由這些小直線段序列表示,矢量結構中只記錄這些小線段的端點坐標,將曲線表示為一個坐標序列,坐標之間認為是以直線段相連,在一定精度范圍內可以逼真的表示各種形狀的線狀地物;“多邊形”在地理信息系統中是指一個任意形狀、邊界完全閉合的空間區域。其邊界將整個空間劃分為兩個部分:包含無窮遠點的部分稱為外部,另一部分稱為多邊形內部。區域的邊界線,可被看作是由一系列多而短的直線段組成,每個小線段作為這個區域的一條邊,因此這種區域就可以看作是由這些邊組成的多邊形了。
2.2 數據組織
數據是現實世界中信息的載體,是信息的具體表達形式,為了表達有意義的信息內容,數據必須按照一定的方式進行組織和存儲。數據庫是為一定目的服務,是以特定的數據存儲的相互關聯的數據集合,是數據按照一定的格式存放的倉庫。GIS的數據庫是某一區域內關于一定地理要素特征的數據集合。空間數據庫與一般數據庫相比,具有數據量特別大,不僅有地理要素的屬性數據,還有大量的空間數據,其數據應用廣泛。
數據庫中的數據組織一般可分數據項、記錄、文件和數據庫四級。數據間的邏輯關系為一對一的關系,一對多的關系,多對多的關系。
數據項是定義數據的最小單位,也叫元素、基本項、字段等,數據項與現實世界實體的屬性相對應,數據項有一定的取值范圍,稱為域。
記錄是由若干相關聯的數據項組成,是處理和存儲信息的基本單位,是關于一個實體的數據總和,構成該記錄的數據項表示實體的若干屬性。為了標識每條記錄,都必須有記錄的標識符,也叫“關鍵字”。
文件是一給定類型記錄的全部具體值的集合,文件用文件名稱標識。常用的數據文件有順序文件、索引文件、直接文件和倒排文件。
順序文件:是最簡單的文件組織形式,對記錄按照主關鍵字的順序進行組織。當主關鍵字是數字型時,以其數值的大小為序;若主關鍵字是文字型的,則以字母的排列為序。
索引文件:除了存儲記錄本身(主文件)以外,還建立了若干索引表,這種帶有索引表的文件叫索引文件。索引表中列出記錄關鍵字和記錄在文件中的位置(地址)。讀取記錄時,只要提供記錄的關鍵字值,系統通過查找索引表獲得記錄的位置,然后取出該記錄。
直接文件:又稱隨機文件,其存儲是根據記錄關鍵字的值,通過某種轉換方法得到一個物理存儲位置,然后把記錄存儲在該位置上。查找時,通過同樣的轉換方法,可以直接得到所需要的記錄。
倒排文件:是帶有輔索引的文件,其中輔索引是按照一些輔關鍵字來組織索引的。倒排文件是一種多關鍵字的索引文件,其中的索不能唯一標識記錄,往往同一索引指向若干記錄。因而,索引往往帶有一個指針表,指向所有該索引標識的記錄。通過輔索引不能直接讀取記錄,而要通過主關鍵字才能查到記錄的位置。
由于地理信息具有多維結構,而柵格結構中賦予每一個柵格的屬性值是唯一的,這就要用多個柵格層數據來存儲同一個地理區域的不同側面信息。那么,如何在計算機中合理地組織這些柵格層數據以達到最優存儲,空間最小,存取效率最高,如果每層像元的位置一一對應,則有三種可能的組織方式。
方法一:以像元為記錄序列,不同層上同一像元位置上的各屬性值表示為一個列數組。N層中只記錄一層的像元位置,節約大量存儲空間,因為柵格個數很多。
方法二:以層為基礎,每層每個像元的位置、屬性一一記錄,結構最簡單,但需要存貯空間最大,浪費存儲。
方法三:以層為基礎,每層內以多邊形為序記錄多邊形的屬性值和多邊形內容像元的坐標。將同一層屬性的制圖單元的N個像元的屬性只記錄一次,便于地圖分析和制圖處理。
3 結語
矢量結構精度高,存儲量小,易于建立拓撲關系,擅長管理線狀物和拓撲搜索,易于網絡分析,空間位置表達明顯,屬性隱含,圖形顯示質量好。但數據結構復雜,疊加操作困難,空間分析能力差、數學模擬困難、技術復雜(特別是軟硬件)。
柵格結構精度稍低,圖形數據量大,難于建立拓撲,屬性表達明顯,位置隱含,圖形顯示的可視性不如適量結構。但數據結構簡單,易于遙感,空間操作分析容易和便于地表模擬,數學模擬方便,有發展潛力。
地理信息系統的主要任務是處理大量的空間數據以獲得支持管理決策所需要的信息,就必然要存儲和利用大量的、各種類型的數據。建立一個良好的數據庫結構和文件組織形式,使其能夠迅速、準確的進行空間分析、計算處理和查找所需要的數據,是衡量一個系統的主要標志之一。
因此,在設計數據庫結構和組織文件形式時,應根據不同用途,使用要求、數據量、設備、技術水平等方面的條件來確定數據結構的組織形式、文件結構、文件類型、文件載體、文件維護等一系列要求,使系統具有處理速度快、占用存貯空間少,操作處理過程簡單、查找容易、系統開銷和費用低等特點。
參考文獻
[1] 龔健雅.地理信息系統技術[M].北京.科學出版社,2001.
[2] 王亞民.現代地理信息系統及其應用[M].西安電子科技出版社,2006.
[3] MAPGIS地理信息系統參考手冊[S].中國地質大學(武漢)信息工程學院.