楊阿蘭
(三門峽職業技術學院,河南 三門峽472000)
測繪地理信息系統基于地理科學,結合數據庫和地理信息創建系統,利用計算機使系統對地理信息進行收集、加工與存儲。地理信息系統可以對地理信息進行收集,對地物進行定位,并且實現城市規劃[1]。目前,地理信息系統的應用已滲透到城市管理與建設的各個方面,系統自身的性能也不斷完善,能夠對復雜、大量的地理信息進行處理。
測繪地理信息聚合系統總體框架包括通過表現層、業務邏輯層、數據層,如圖1所示。
1)數據層:測繪地理信息聚合系統中的數據來源于互聯網,如相關領域單位的官網、主流新聞網站、測繪地理信息單位官網等。

圖1 系統總體架構
2)業務邏輯層:主要業務包括信息查詢、信息展示、網頁解析、信息存儲、主題詞配置等。
3)表現層:由測繪地理信息展示系統與采集子系統構成。信息采集子系統由業務邏輯層采集入口設置、主題詞配置、信息存儲、網頁解析等業務功能集成,利用C/S架構開發,收集互聯網測繪地理信息;信息展示子系統由業務邏輯層信息查詢與展示業務功能集成,使用B/S架構進行開發,為公眾用戶提供測繪地理信息查詢功能[2]。
測繪在數字化城市建設過程中有重要作用,在測繪過程中應用地理信息系統存在歷史必然性。但是,要求對測繪體系進行完善,創建全新的測繪體系。在創建數字化城市的過程中,要求為測繪工作創建數據處理平臺,使其具備數據存儲、收集功能,可生成成品數據。數據庫是地理信息系統的核心,可以對地理空間信息進行收集,完善基礎數據庫資源,實現數據處理平臺的創建,利用繪圖與表格統計的方式展現城市地理空間分布,從而生產數據。通過地理信息系統實現模型創建,如景觀模型、地圖模型。景觀模型是系統設計的重要模型,通過地圖模型可以得出地圖信息,并通過場地模型收集的影像數據展現地圖。在數據處理過程中,需要篩除干擾性信息,實現信息數據化,分析數據的價值,賦予數據相應的功能,實現數據處理,建立地理信息服務平臺。
測繪地理信息聚合系統主要由GIS平臺、操作平臺、應用軟件與數據庫系統構成。在設計系統過程中,需考慮以上4方面內容。軟件體系的構成[3]如圖2所示。

圖2 系統軟件體系
3.1.1 數據庫系統
測繪地理信息聚合系統數據主要包括屬性數據與空間數據,早期GIS系統通過文件的方式實現數據存儲,將非空間數據和屬性數據存儲于數據庫系統中。但是,數據的鏈接較困難,既增加了用戶操作難度,又限制了系統功能。在新一代支持空間數據商用數據庫的開發過程中,可以通過數據庫對所有數據進行存儲,并且可以實現各個系統的無縫鏈接。另外,可以實現開放式GIS的跨平臺操作,對城市基礎地理信息系統服務功能與目標定位進行優化。同時,在新一代城市基礎地理信息系統創建過程中,利用空間型商用數據庫十分必要??傮w來說,可以利用對象-關系形式統一管理空間數據和屬性數據。
3.1.2 操作系統
操作系統為微軟公司Windows系列,近期,Linux系統的使用也越來越廣泛,如果實際項目對系統的可靠性、安全性與系統性存在較高要求,可以使用Unix操作系統[4]。
3.1.3 GIS平臺
現代商業化GIS軟件產品較多,通過相互融合與借鑒,其在功能方面具有趨同傾向??傮w分析,每個GIS軟件供應商皆提供單機版本GIS、控件GIS、網絡GIS等產品。各種GSI平臺略有差別,但大量GIS工程案例顯示,GIS平臺并不是測繪地理信息集合系統設計和開發創建成敗的主要原因[5]。因此,選擇GIS平臺時需充分考慮以下因素:(1)城市規模;(2)技術適用性,不僅要分析目前需求,還要具備超前性;(3)性能價格比與承受能力;(4)GIS平臺整體技術架構與體系,平臺供應商技術、服務、經濟實力與可持續發展;(5)實用性。
3.1.4 應用軟件開發
以用戶需求為依據開發應用軟件,通過GIS空間與GIS平臺實現二次開發。開發工具不僅可以使用標準計算機語言,還能使用GIS平臺自身專用開發工具。應用軟件大部分可直接面向用戶,主要功能為圖形操作、統計分析、查詢、輸入輸出、可視化顯示等,利用應用軟件集成數據庫、OA、GIS等系統。
在文本或者主題中抽取地名地址皆屬于非結構化的地理信息,其缺乏空間地理坐標,需進行空間定位。測繪地理空間框架基礎地理信息數據含有超過6×105條的地名地址數據,存儲數據包括地名地址名稱、地理實體名稱與空間坐標信息,將其作為空間參考庫匹配地名地址,掛接各個行業數據屬性信息,從而實現空間定位。
地名地址的匹配方式主要包括模糊匹配與精確匹配,精確匹配指網頁文本具備詳細地理信息空間定位;模糊匹配則能針對網頁文本描述不全或粗略的地理信息進行空間定位。在匹配地名地址過程中,網頁文本地名地址描述與標準化描述不同,進而增加了地名地址匹配的難度,因此,要求將標網頁文本的地名地址準化。在程序中將地名地址描述為可擴展樹狀模型,切分網絡文本地名地址,根據樹狀模型從上到下依次匹配,在上級節點成功匹配后,繼而搜索下級節點進行匹配,直到地址參考庫中無法尋找地名地址描述。以權重群概況對此地名地址描述進行確定,使此時地名地址參考庫的行業數據與坐標信息屬性信息相互連接,進而進行空間坐標定位。
多元空間數據在一處匯聚時,呈現出不同的數據結構、高維數據、度量單位和投影體系,因此,需要清理空間數據。已經抓取的網頁文本數據內容較為繁雜,部分內容為冗余數據,甚至完全無關,其對具有價值的信息產生影響。如部分文本中含有非線性數據信息,且無法直接使用,則應進行數據清洗,使數據維度降低。不同行業的數據特征各不相同,需要對行業數據特征信息進行挖掘,從而發現行業數據信息規律。本文利用支持向量機監督分類方法對數據進行挖掘,基于經濟風險與統計學習最小化,可使非線性、小樣本、高維模式識別問題得以解決。通過支持向量機核函數創建區分不同行業的數據信息,隨機抽取10 000條以上的行業數據記錄樣本,統計各行業關鍵詞出現的頻率;隨后創建訓練樣本特征空間分詞庫;最后,利用支持向量機分類方法分類位置文本。中文分詞詞庫對照見表1。
屬性數據與空間數據的組織為系統建設的重點,合理的數據庫結構、適當的數據組織能提高系統運行效率,便于系統使用。通過應用需求分析,可以根據地物特征進行系統數據分層,以地物空間分布地域單元、同異性、同質性、完整性實現分區。在相同關系數據庫中實現空間數據和屬性數據的存儲,為了提高數據查詢與檢索效率,需要在數據庫中通過統一的尺寸進行存儲。為了使數據使用更便捷,應充分調用城市空間數據。

表1 中文分詞詞庫對照
3.4.1 數據分層
地形圖是空間定位的主要工具,應用范圍廣泛??紤]到對目前、未來的潛在應用,地形圖需基于物理分層和邏輯分類進行創建。物理圖層由控制點、道路中心線、線狀地物和面狀地圖構成;邏輯分層是指以國家標準分類代碼為依據進行地圖分層,如城市規劃圖、道路紅線圖及管線圖等。
3.4.2 庫結構設計
庫結構設計需要通過數據庫創建表格對象,對整數字段進行存儲,隨后進行圖形、屬性、顯示符號等信息的添加。在數據庫設計過程中,需要充分考慮國家標準分類代碼體系,利用地方標準進行補充和完善,并通過系統的特殊業務進行設計。
3.4.3 存儲方式
傳統GIS是指通過文件的方式進行空間數據的存儲與快速查詢。因此,數據量較大時,會影響空間數據的檢索、顯示與查詢速度。為了提高系統的運行效率,要求利用劃分單元和分層的方式進行數據存儲。
地理信息聚合系統需要計算機軟件及硬件的支持,否則,無法實現地理空間信息數據收集和處理。完成數據收集后,面臨數據處理問題,可利用數據加工與處理專業軟件完成。地理空間信息數據傳輸到地理信息系統之后無法直接使用,要先對數據進行預處理和編輯,之后進行數據建模,利用拓撲方式和圖形結合對數據進行全面分析。在數據處理過程中,地理信息系統的主要優勢是可以利用其分析屬性,得出數據的關聯性。如果收集的信息較復雜,且關系較明顯,需通過建模方式對數據進行處理。由于不同的城市對測繪的需求不同,在數據處理前,應基于差別較大的數據對模型進行分析,從而使測繪結果能滿足不同的實際需求。
地理信息系統具有強大的功能,即對數據進行收集和處理,并對地理空間進行全面的分析。軟件分析數據可以利用定性、定量的方法對空間位置進行描述,并與各學科進行綜合,除了使用地理學,還包括區域學、物理學等知識和理論??臻g地理描述還需利用統計學和拓撲學,因此,只有全面掌握相關知識,才能保證空間定位和測繪的精準性,為后續的測繪工作打下基礎。
地形圖是進行空間定位,反映地物空間分布的主要工具,使用范圍較為廣泛。地形圖包括物理分層,根據邏輯分類建庫。物理圖層主要包括面狀、線狀地物和道路中心線、交叉口等;邏輯層分類根據國家標準分類代碼進行地形分層。
在現代城市化進程中,需深入了解整體地理信息系統,只有全面掌握地理信息系統相關理論,才能將地理信息系統應用于城市規劃中。城市地理信息系統較為復雜,與城市建設密切相關。因此,在城市化進程中,需要與國際接軌,通過地理信息系統促進城市化發展,提高城市化水平,為有效管理城市提供技術支持。