宋曉紅,張立朝,祿豐年,李向陽,付治河,王 品
(1.河南省測繪地理信息局信息中心,河南鄭州 450003;2.河南省測繪地理信息局,河南鄭州 450003;3.河南省基礎地理信息中心,河南鄭州 450003)
地理國情普查中多源異構數據整合研究
宋曉紅1,張立朝2,祿豐年2,李向陽3,付治河3,王 品3
(1.河南省測繪地理信息局信息中心,河南鄭州 450003;2.河南省測繪地理信息局,河南鄭州 450003;3.河南省基礎地理信息中心,河南鄭州 450003)
地理國情普查及監測是測繪地理信息面臨的又一新的重大發展戰略,既是對現有基礎地理信息數據的整合、提取和加工,又是與其他專業部門業務數據的融合和集成。地理國情普查主要針對我國陸地范圍內的地表自然和人文要素,將其分為12個一級類、56個二級類、127個三級類,在數據庫中共有34個層,其數據具有分類全、涉及面廣的特點。不同于傳統的基本比例尺地形圖測繪,地理國情普查需要最大限度地整合、利用現有的基礎地理信息數據源。因此,本文提出一種面向地理國情普查的多源異構數據整合解決方案,從技術路線、技術實現等方面分析其實現細節。
地理國情普查;多源異構;數據整合;解決方案;技術路線
地理國情普查的重要數據包括地表覆蓋分類數據和地理國情要素數據兩類。就其數據格式而言,地表覆蓋分類數據和地理國情要素數據按任務區域集成為一個整體,并按圖層統一存儲在ArcGIS Geodatabase數據庫中。從數據結構看,其數據分層、屬性表結構都與1∶5萬、1∶1萬等基本比例尺地形圖不同。地理國情普查的主要數據源包括遙感影像數據,1∶5萬DLG、1∶1萬DLG、1∶1000和1∶500矢量地形數據庫,高精度數字高程模型,第一次全國水利普查、第二次全國土地調查數據等專題數據資料,以及其他參考資料。本文旨在研究并提出整合、集成、融合上述數據源的解決方案,以形成1∶1萬基本比例尺地形圖等數據源與地理國情普查、監測的數據快速聯動更新機制。
河南省是全國地理國情普查第一批試點中的兩個重點試點省份之一,試點區域為鄭州市全市域,共計7500 km2,其中,金水區作為地理國情普查三級類試點區域。目前,搜集到的主要數據源包括World-View-2多波段衛星遙感影像,全色衛星遙感影像數據,國遙0.5 m分辨率航空遙感影像,資源三號衛星遙感影像,1∶5萬DLG數據,人、縣、年快速更新的1∶1萬DLG數據庫,1∶1000、1∶500矢量地形數據庫,第二次全國土地調查、第一次全國水利普查等專題數據,林業資料,民政資料,城區圖,旅游圖等。
1.試點項目建設內容
1)收集鄭州市域的控制資料,完成遙感影像處理、正射影像圖制作。
2)地理國情普查地圖制作,包括將提取的基礎數據、專題數據套合正射影像,依據正射影像采集更新基本國情要素,地表覆蓋分類結果處理、編輯,基本國情要素、地表覆蓋數據內業檢查及修改、普查底圖數據制作。
3)外業核查,包括外業路線設計、基本國情要素、地表覆蓋數據的核查,以及樣本數據、地物點、專業資料的檢查和修改。
4)內外業數據整合、本底數據庫建立,包括內外業數據整合、編輯、入庫,以及地表覆蓋數據庫、基本國情數據庫、路網數據庫、水系數據庫、樣本數據庫等的建設。
5)按鄉(鎮)行政單元(或街道單元)收集人口資料,形成人口分布等數據集。
6)元數據制作,包括地理國情基本要素、地表覆蓋、DOM、遙感解譯樣本數據等數據制作。
7)地理國情普查數據統計、分析、制圖及報告編寫。
2.試點項目總體方案
試點項目以遙感影像數據為基礎,收集1∶5萬、1∶1萬、1∶1000、1∶500等基本比例尺地形圖數據,以及第二次全國土地調查、第一次全國水利普查、林業、民政等專題信息數據,通過多源異構數據整合,并與遙感影像數據疊加,數據庫形成地理國情內業框架數據,按照地理國情普查的內容要求,使用ArcGIS或Geoway軟件進行地理國情普查內業編輯處理,制作普查外業工作地圖,經過外業核查、調繪與屬性調查、內業處理形成地理國情信息數據庫;基于地理國情信息數據庫,進行統計、分析、制圖及報告編寫。其總體方案如圖1所示。
現有基礎數據源分析是地理國情普查的重要環節,是多源異構數據整合的前提和基礎。現有基礎數據源主要包括遙感影像數據、基礎地理信息數據及專題數據。
1.遙感影像資料分析
河南省地理國情普查試點項目主要利用World-View-2多波段衛星遙感影像、WorldView-2全色衛星遙感影像、國遙新天地航空影像、資源三號衛星影像實現對鄭州全市域的覆蓋。
1)WorldView-2多波段衛星遙感影像,時相不早于2011年,地面分辨率為1 m。
2)WorldView-2全色衛星遙感影像,時相不早于2011年,地面分辨率為1 m。
3)國遙新天地航空遙感影像,時相不早于2011年,地面分辨率為0.5 m。
4)資源三號衛星遙感影像,時相不早于2011年,地面分辨率為2.1 m。
2.基礎地理信息數據
(1)1∶1萬DLG數據庫
試點項目使用1∶10 000 DLG數據庫數據作為主要基礎數據源。該數據庫是以按2011年8月我省修測方案成圖的1∶1萬地形更新圖數據為基本數據源(金水區除外),包含2012年11月依據所搜集的最新公路、水系、地名等資料建立起來的全要素地形數據庫,其現勢性基本滿足此次地理國情普查試點項目的要求。
(2)1∶500和1∶1000 DLG數據庫
金水區1∶500和1∶1000大比例尺地形圖數據資料是金水區基本數據源。據統計,1∶500、1∶1000矢量地形數據庫為2009年按照數字鄭州總體方案成圖的大比例尺地形圖數據建成的數據庫,該數據庫為全要素地形數據庫,覆蓋金水區范圍。
(3)1∶5萬DLG數據
1∶5萬DLG成果可與1∶1萬基礎數據資料結合,作為相關要素屬性采集的重要參考數據源,如河流。國家測繪地理信息局1∶5萬更新工程的有關資料中,道路也可作為相關要素屬性采集資料,如鐵路。
(4)高德地名數據
覆蓋鄭州市域的高德地名是城鎮功能單元采集的數據資料源。
3.專題數據
(1)第二次全國土地調查資料
覆蓋整個鄭州市的第二次全國土地調查資料,一是作為行政境界的基本數據源,二是作為地表覆蓋(LCA)屬性獲取的依據。
(2)第一次全國水利普查資料
覆蓋整個鄭州市的第一次全國水利普查等專題數據是普查水系及附屬設施的重要基礎數據源,但該數據與地理國情信息普查中水系的分類體系、標準不完全相同,普查時需對相關數據進行整合與補充。
(3)其他專題數據
覆蓋整個鄭州市的林業資料是森林覆蓋的數據源。民政資料是人口統計的基礎數據源。鄭州市城區圖、旅游圖等專題地圖用于獲取相關要素信息。此外還有與鐵路、公路、水運附屬設施、空運設施等相關的專業資料。
4.其他參考資料
1)收集的統計、民政等相關部門資料。
2)網絡公開發布的相關信息。
目前關于多源異構數據集成、整合技術的研究主要集中在:一是面向多數據庫系統的映射模式,這種模式要求數據源映射到每一個數據模式,各數據源之間提供相互訪問的接口,且擴展增加數據源比較困難;二是基于全局數據模型的中間件模式,這種模式一般需要使用關系數據模型作為全局數據模型,而關系數據模型在描述半結構化數據及地理空間信息數據方面力不從心。地理國情普查中的基礎地理信息數據來源廣、數據結構復雜,而且可能存在坐標系統、投影等方面的差異,因此本文提出一種適合我省地理國情普查的多源異構數據整合技術路線。
1.地理國情普查多源異構數據整合技術路線
設計
由于地理國情普查數據結構已經明確,因此,地理國情普查數據整合的主要工作在于將搜集到的基礎地理信息數據及部門業務數據一一映射到地理國情普查數據模型中,有效地利用現有資源。本文在科學分析現有數據源的基礎上,將地理國情普查數據模型作為目標數據模型,通過明確現有數據源數據模型與目標數據模型之間的映射關系(主要是數據表結構、字段之間的映射關系),采用數據聚合架構模式,以計算機自動處理的方式實現地理國情普查中多源異構數據整合。其中,確定基礎數據源數據模型與目標數據模型之間的映射關系是實現多源異構數據整合的基礎,采用數據聚合機構模式實現計算機自動整合是技術路線的關鍵。多源異構數據整合技術路線如圖2所示。
2.地理國情普查多源異構數據整合實現
由于地理國情普查多源異構數據整合映射存儲的僅僅是基礎數據源數據模型與目標數據源數據模型之間的表結構及字段的對應關系,因此基礎數據源的增加或減少只需相應地增加或刪除映射關系即可。同時,目前許多主流的地理信息數據處理軟件(如Geoway或ArcGIS等)都可以方便地讀取該配置文件,因此,地理國情普查多源異構數據整合不僅具有計算機自動處理的特點,還具有擴展性強、可操作性強的特點。地理國情普查多源異構數據整合實現如圖3、圖4所示。

圖2 多源異構數據整合技術路線

圖3 地理國情普查多源異構數據整合生成的地理國情普查框架數據效果

圖4 地理國情普查最終成果
河南省地理國情普查試點項目的實施為河南省全面開展地理國情普查提供了經驗、技術和人才積累。由于試點項目時間緊、任務重,再加之針對地理國情普查自動解譯的軟件尚不成熟,因此河南省地理國情普查試點項目沒有使用衛星影像的自動解譯。隨著全省地理國情普查的全面實施,應把衛星遙感影像的自動解譯作為地理國情普查信息獲取的重要途徑,開展相關試驗和研究,總結出適合河南省實際的地理國情普查、監測技術路線。另一方面,在基于衛星遙感影像的自動解譯方面,可以將整合、提取后的基礎地理信息數據作為自動解譯的輔助數據,以提高自動解譯的準確度和效率;同時,可以考慮通過引入語義信息,實現智能化的映射方案規劃及數據整合。
[1] 李德仁,眭海剛,單杰.論地理國情監測的技術支撐[J].武漢大學學報:信息科學版,2012,37(5):505-512.
[2] 付治河.基于地理國情監測的城市擴張分析研究[J].測繪通報,2013(3):98-101.
[3] 譚文彬,劉斌,張增祥,等.近三十年來昆明市建成區擴展遙感監測與分析[J].地球信息科學學報,2009 (1):117-124.
[4] 中國測繪宣傳中心.地理國情監測研究與探索[M].北京:測繪出版社,2010:80-89.
[5] 張靖,程希來.多源異構數據整合應用研究[J].成都信息工程學院學報,2009,23(3):254-258.
[6] 賀永鑫.異構數據集成平臺研究[D].太原:中北大學,2010.
[7] 陳永東.面向物流的多源異構數據的整合與互操作技術的研究[D].上海:上海交通大學,2005.
[8] 史文中,秦昆,陳江平,等.可靠性地理國情動態監測的理論與關鍵技術探討[J].科學通報,2012,57 (24):2239-2248.
[9] 張立偉.面向服務的異構數據集成[D].濟南:山東大學,2008.
[10] 李玉翠.多源異構數據集成技術研究[D].西安:西安電子科技大學,2009.
[11] 孫顯,王宏琦,張道兵,等.基于多特征融合的城市遙感圖像自動解譯方法[J].光子學報,2010,39(1):178-182.
[12] 楊桄,張柏,王宗明,等.基于多源信息空間的遙感影像自動解譯研究[J].東北師范大學學報:自然科學版,2006,38(1):131-135.
Research on Multi-Source Heterogeneous Spatial Data Integrating Oriented Geographic Conditions Survey
SONG Xiaohong,ZHANG Lichao,LU Fengnian,LI Xiangyang,FU Zhihe,WANG Pin
P208
B
0494-0911(2014)09-0104-04
2013-08-09
礦山空間信息技術國家測繪地理信息局重點實驗室開放基金(KLM201204)
宋曉紅(1960—),女,河南鄭州人,工程師,研究方向為測繪地理信息技術與應用、地理國情普查與監測。
張立朝引文格式:宋曉紅,張立朝,祿豐年,等.地理國情普查中多源異構數據整合研究[J].測繪通報,2014(9):104-107.
10.13474/j.cnki.11-2246. 2014.0307