邱程錦,徐慧珺
(江蘇省基礎地理信息中心,江蘇 南京 210000)
智慧城市目前已成為現代信息科技集中應用與展示的重要載體,是促進經濟、社會建設升級的重要支撐[1]。2017年,國家自然資源部在2015版大綱的基礎上,出臺了《智慧城市時空大數據與云平臺建設技術大綱》(2017版),突出了時空大數據與云平臺兩個重要內容的建設[2]。
目前,很多學者對智慧城市時空信息云平臺的建設開展了研究,例如覃融等介紹了柳州智慧時空信息云平臺建設探索與實踐的經驗[3];張鵬程等從時空云平臺基礎設施與服務方面做了研究[4]。這些研究多數針對云平臺方面的建設,而對時空大數據的整合、匯集、處理、集成等方面缺少系統的介紹。作者在負責了智慧新沂、海安、洪澤等市縣云平臺數據建設工作的基礎上,歸納了市縣智慧城市時空信息云平臺中的數據建設內容,總結了多源異構數據在整合、處理、集成方面的關鍵技術,以期為后續的智慧城市時空信息云平臺數據建設提供參考。
智慧城市時空信息云臺集成的數據主要包括:歷史與現狀的基礎地理信息數據、歷史與現狀的公共專題數據、智能感知數據、空間規劃數據等4種類型。本文依托基礎地理信息數據,對公共專題數據、智能感知數據和空間規劃數據進行時空化,通過管理分析系統經數據引擎實現對大數據的一體化管理??傮w建設內容如圖1所示。

圖1 時空大數據建設內容
基礎地理信息數據主要包括:多時期多類型的矢量數據、電子地圖、影像數據、數字高程模型數據、地名地址數據、三維模型數據、新型測繪產品數據、地理實體數據及其元數據。
1.1.1 矢量數據
市縣智慧城市時空信息云平臺主要收集整理了“十五”、“十一五”、“十二五”、“十三五”等多期1∶1萬、1∶5萬基礎測繪數據,同時匯集整理了2015—2020年地理國情數據。在項目實施過程中,根據市縣具體情況更新了1∶1000大比例尺DLG數據。這些數據跨時較長,測繪基準與標準各不統一,需進行一定的處理后才能集成在平臺中使用。上述數據主要來源于省自然資源廳與地方自然資源局。
1.1.2 影像數據
影像數據主要包括歷年航攝影像圖、歷年衛星圖。按傳感器類型不同,收集的影像有航攝影像、BJ、GF1、GF2、ZY3、ALOS、SPOT、keyhole4、keyhole9等多種類型影像。影像的分辨率有0.1、0.3、0.8、1、2、5.8、6、10 m等。影像的現勢性從1966年跨越至2020年,時間序列豐富。上述數據主要來源于省自然資源廳與地方自然資源局。
1.1.3 數字高程模型
數字高程模型數據主要源于2015年地理國情普查,部分市縣可搜集到機載LiDAR制作的DEM數據。DEM的格網單元有2、5、10 m等,現勢性為2012年、2015年左右。
1.1.4 地名地址與POI數據
地名數據主要依據民政局共享的地名數據和基礎測繪中提取的地名數據,一般包括地名的基本信息以及地名的來歷、含義、歷史沿革等。POI數據庫的擴充和完善主要通過市縣多尺度地名數據分庫內容提取,民政部門地名數據整理以及外業調繪等方法采集。該數據一般覆蓋整個市縣區域,現勢性定期更新。
1.1.5 非傳統地理信息數據
主要包括三維模型數據、傾斜攝影數據、全景數據、街景數據、電子地圖、地理實體數據等。這些數據對重點區域、重點要素的管理提供支撐。
公共專題數據主要來源于地方統計局、工商局、大數據中心、公安局、民政局、水利、統計、教育等部門,主要有地下管線、宏觀經濟、人口、土地利用、旅游景點、學校分布數據等。公共專題數據類型多樣,普遍缺少空間信息,需進行統一規范處理后集成入平臺使用。
空間規劃數據包括土地利用總體規劃數據、生態紅線數據、城市總規數據等,數據一般來源于市縣自然資源局、生態環境局等相關單位。
智能感知數據主要來源于地方各部門的實時數據,主要包括的類型如表1所示。

表1 物聯網節點感知數據
由以上總結的時空大數據建設內容可以看出,平臺集成的數據類型豐富、格式多樣、來源廣泛;部分數據因時間跨度較長,采用的測繪基準、標準不一致。這些數據統一集成到平臺內需進行一定的處理,主要步驟包括:統一數據格式、一致性處理、空間化等流程。
對不同地理信息數據進行無損格式轉換,對于無拓撲關系的圖形數據如CAD格式的數據,將其轉換至地理信息數據,并構建相應的拓撲關系。格式統一后,將地理信息數據合并、自動接邊,實現數據表格自動屬性賦值。對于表格、文檔等自身沒有空間坐標信息的數據,如地名地址數據,可根據屬性項進行提取,形成地理信息數據;二、三維圖形數據源需要統一至常見的地理信息數格式;非圖形數據統一至結構化或非結構化的數據格式;流式感知數據源統一至常見視頻格式。
對于基礎測繪數據、專題數據、規劃數據等采用以下處理流程進行一致性處理。
(1)統一空間基準。收集到的數據坐標系統主要有1980西安坐標系、WGS1984、CGCS2000,部分數據為淮安地方坐標系。首先對數據進行坐標系統轉換,確保各數據源統一采用2000國家大地坐標系,高程基準統一采用1985國家高程基準。
(2)統一數據結構。不同時期的數據的標準有所不同,如“十五”、“十一五”、“十二五”期間的基礎測繪成果采用了不同的數據分層與編碼,在項目實施過程中,首先統一各類成果的數據結構,以便于提取分析利用不同時期的數據。通過對不同數據源中的同類要素進行分析比對,提取有效圖層,對提取出的要素進行分層合并,并提取有效屬性,進行屬性結構的規整,形成結構統一、標準統一的數據庫。
數據建設過程中實現了將非空間數據,依托地名地址匹配引擎,賦予空間屬性,滿足政府各委辦局相關業務數據的“落地”需求。主要技術流程如圖2所示。

圖2 空間化流程圖
(1)地址、交易點等具有空間位置坐標的數據,可依據坐標匹配定位進行數據空間化及其他屬性字段,同時根據地圖服務標準接口實現在線“落地”。
(2)住宅、人口統計等蘊含地名地址信息的數據,首先需要識別萃取出地名地址信息,建立含有地名標識的切分序列與邏輯組合關系,然后基于分詞、本體和詞語相似性等多種匹配,利用局部模糊匹配后的歧義消除方法,實現高效、精準、實用的地名地址匹配。
時空信息云平臺是履行自然資源管理“兩統一”職責的技術支撐,是能夠為城市管理提供一張底板、一個平臺、一套數據的重要平臺。目前時空信息云平臺在數據建設方面主要表現為集成基礎地理信息數據,匯聚智能感知實時數據以及公共專題數據和空間規劃數據,以及將其時空化形成時空大數據及其管理分析系統。在之后的建設中,應根據本地的信息化基礎,優先開展空間規劃數據及智能感知實時數據的建設,完善智慧城市頂層設計,使時空大數據逐步完善和豐富。