張丹丹,李 曼,傅征博,李浩川
(1. 中國國土資源航空物探遙感中心,北京 100083; 2. 國家信息中心,北京 100045)
城市群已經成為推進我國新型城鎮化的主體形態,國務院提出將在“十三五”期間建設19個城市群[1]。城市群多是我國工業化、城鎮化高度集聚的地區,人地相互作用尤為活躍,人地關系矛盾日益突出。我國地質構造復雜、地震活動頻繁、活動斷裂發育[2],城市群中平原區地面沉降、地裂縫、地下水超采等環境地質問題突出,山區地震、崩塌、滑坡、泥石流等地質災害多發,生態地質環境脆弱,海岸帶地區海水入侵、海岸侵蝕淤積、海平面上升等環境地質問題嚴重,礦區等城市存在采空塌陷、巖溶塌陷[2-3]。城市群的規劃、建設和管理需要“跨城市、全鏈條、自適應、多目標”的空間信息服務和應用模式,地質環境信息及服務作為其中最為基礎性和先行性的鏈條,迫切需要全面融入城市群的規劃、建設、管理的各個領域和環節,通過GIS、數據庫、可視化、大數據、云計算等現代信息技術,積極引導城市群地質資源合理利用,規避城市群地質安全風險,有效防范突發性的地質災害,全面支撐城市群規劃、建設和管理。
城市群地質環境演化數據主要是通過多源遙感監測并輔以地面調查等方式獲得的。數據類型主要包括遙感對地觀測數據、基礎地質數據、地形地理數據、地質環境演化專題產品、地質環境演化綜合產品、城市群發展數據、互聯網數據等。地質環境演化時空大數據分類見表1。
(1) 遙感對地觀測數據,包括光學、雷達影像數據兩大類。光學影像既有亞米級的高分二號影像,也包括低分辨率的鎖眼衛星影像數據,主要用于活動斷裂、崩塌、滑坡、泥石流、海岸灘涂等典型地質環境要素的監測。長時間序列的不同分辨率的雷達影像主要用于點、線、面等不同尺度地面沉降的監測。這類數據具有時效性強、重訪周期短、數據體量大等特點。以地面沉降監測為例,僅華北平原地區一年的地面沉降監測所需要的雷達影像的數據量就超過了1 TB。
(2) 城市群發展數據,包括交通流量、社會經濟、產業布局等統計數據。這類數據反映了城市群發展及人地關系是否協調,是城市群地質環境演化遙感監測研究不可缺少的數據,具有海量性(尤其是交通流量數據)、相關性、及時性、可比性等特點。
(3) 地質環境演化專題產品,主要包括崩滑流等典型地質環境演化要素分布、地面沉降速率等數據產品。
(4) 地質環境演化綜合產品,包括地面沉降速率等級、地質環境承載力評價、地質環境適宜性評價等專題圖件產品,是時空大數據綜合分析的產品。
綜上,地質環境演化數據具有海量、異構、長效性、高準確性、高價值等特點[4],是時空大數據的一種,因此,其數據的存儲管理、處理、分析等都宜采用大數據的技術方法。

表1 地質環境演化時空大數據分類
圍繞城市群空間規劃、建設、管理及“多規合一”“大城市病”治理等多領域決策對地質環境演化空間信息服務的迫切需求,依托大數據和云計算等技術,構建城市群地質環境演化空間信息智能服務體系,為城市群經濟區規劃、交通等基礎設施運營管理、產業升級轉移等應用提供地質環境演化數據、產品、模型、分析挖掘及應用多層次的空間信息服務,提升地質環境演化空間信息服務城市群經濟區規劃、建設和管理的支撐能力。城市群地質環境演化空間信息智能服務體系包括基礎支撐層、大數據采集與處理層、數據組織與管理層、計算與分析挖掘層、大數據服務層、大數據應用層6部分。城市群地質環境演化空間信息智能服務體系框架如圖1所示。

圖1 城市群地質環境演化空間信息智能服務體系框架
基礎支撐層是支撐整個城市群地質環境演化的傳感網絡及軟硬件設施,包括衛星、航空、低空、地面的各類傳感器,以及服務器、云存儲、通用軟件、專業軟件、網絡等云計算平臺環境。衛星不僅包含光學、雷達等遙感衛星,還包括導航衛星、通信衛星。
地質環境演化大數據采集及處理層借助空天地各類傳感器網絡及智能終端、互聯網等手段獲得的時空大數據,包括通過各級地質監測部門建立的地面沉降監測系統、地下水環境監測系統、突發地質災害監測系統、平原區活動斷裂監測系統、土壤地質環境監測系統、重大構筑物及地下空間地質安全監測系統、重大線性工程地質安全監測系統等獲取的數據,在云計算平臺下進行各種數據處理后形成多源、長時序的遙感影像增值產品、地面沉降、地質災害分布等數據產品。
大數據存儲與管理層基于統一時空框架、統一分類編碼、統一數據模型,綜合利用關系數據庫、NoSQL數據庫、共享文件系統及分布式數據存儲系統等,實現分布式存儲環境下多源異構的地質環境演化大數據一體化存儲。存儲與管理的數據包括遙感對地觀測數據、基礎地質數據、地形地理數據、地質環境演化專題產品、地質環境演化綜合產品、城市群發展數據、社交網絡數據等幾大類。
地質環境演化大數據計算與分析挖掘層面向大數據存儲層各類數據庫中存儲與管理的數據,用深度學習、關聯規則、時空預測、時空融合、時空聚類等時空大數據分析挖掘技術[5-7],研究服務于城市群規劃、建設與管理的模型及分析計算方法。主要構建的模型包括地面沉降發育演變模型、地面沉降與地下水的耦合機理模型、典型地質環境要素自動識別模型、地質環境演化預警模型、地質環境適宜性評價模型、地質環境承載力評價模型、地質環境與城市群發展的協調度模型等。
地質環境演化的大數據服務層依托底層的時空大數據和構建的數據模型,形成多層級、多類型、多鏈條的空間信息服務模式,既提供基礎的地質環境演化數據服務、元數據服務、產品服務,還提供專業性較強的模型服務、數據分析挖掘服務和應用服務。
地質環境演化大數據應用層通過大數據存儲與管理層、計算與分析挖掘層與服務層的智能組合,為城市群輔助空間布局、重大工程選址、城市群規劃與管理、輔助產業升級轉移、優化國土空間開發利用等城市群規劃、建設與管理多領域、多環節的應用提供智能化的地質環境演化及預警等服務支撐。
數據的采集是城市群地質環境演化空間信息服務的基礎。借助于光學、雷達影像等多源遙感數據,在突破相干目標短基線InSAR時序分析、多軌道、長條帶InSAR數據集成處理[8]、基于深度學習的典型地質環境演化要素自動識別等技術的基礎上,開展活動斷裂、崩塌、滑坡、泥石流、地裂縫、岸線變遷等城市群地質環境演化典型要素遙感監測,以及大區域、城際間重大線性工程沿線和大型工程地下空間地面沉降的監測。同時結合地面的各種傳感網絡、群測群防體系、導航、通信、互聯網等數據,實現城市群點、線、面監測互補,提升城市群的微觀、中觀和宏觀不同尺度的持續監測與動態預警能力,是城市群地質環境演化空間信息服務的重要技術支撐。
圍繞城市群地質環境演化海量、異構、多源、多時相數據組織與管理的需求,綜合MongDB、Hadoop等分布式數據存儲技術[9-10],實現分布式環境下多源異構的數據一體化存儲。在傳統關系數據庫、文件系統基礎上,采用混合存儲架構,擴展并綜合利用NoSQL數據庫、分布式文件系統,構建彈性可擴展的存儲模型,形成面向地質環境演化大數據的關系數據庫集群、NoSQL數據庫集群、共享文件系統集群、分布式文件系統集群,并在此基礎上提供規范化的數據存取接口。其中,空間數據、結構化屬性數據存儲采用大規模并行處理架構關系數據,服務數據、瓦片數據、文檔數據等采用分布式NoSQL數據庫,影像實體、圖片等多媒體數據采用共享文件系統及分布式文件系統存儲。地質環境演化大數據存儲結構如圖2所示。

圖2 地質環境演化大數據存儲結構
針對地面沉降速率等海量矢量地質環境演化數據瀏覽顯示效率低、交互性差等問題,借助海量矢量數據分級索引技術來實現海量矢量數據的動態符號化,以及大體量矢量數據在大中小比例尺區間內的全程高效瀏覽和實時查詢,提升瀏覽和實時查詢檢索的效率。空間索引方法大致可分為線性索引、網格索引和樹形索引3大類[11]。線性索引結構直觀簡單,但對海量的矢量數據管理效率較低。網格索引效率較高,但是當矢量數據增多時會因矢量要素分布不均勻而需要重構。樹形索引是應用最為廣泛的數據索引。結合地面沉降等地質環境演化矢量數據的特點,研究基于尺度的高維索引方法來實現矢量數據的在線壓縮和復現,實現對不同數據內容、同一數據不同層次的聯合檢索[12],可大大提升數據的動態渲染及檢索效率。
地質環境演化時空大數據挖掘技術,主要是通過關聯規則挖掘、分類、預測、聚類等時間序列和空間結構數據挖掘方法[5-7],從非線性、海量、高維和高噪聲的地質環境演化時空大數據中,提取出對城市群規劃、建設與管理有用的數據間的內在聯系、隱含信息、時空模式和知識等[13]。如在綜合水準、GPS、基巖標-分層標,以及InSAR監測的地面沉降數據和長時間序列的地下水位動態監測數據,實現典型沉降區內多類型、多尺度、多源異構數據的無縫融合。對區域內長時間序列的地下水水位與不同地層地面沉降量的相關性進行分析,構建基于多源數據識別的地面沉降-地下水水位模型,實現區域地質背景下的地面沉降全過程演化和趨勢預測,進而在發育特征與模型預測互饋的動態過程中進一步揭示地面沉降的內在規律與機制。
城市群地質環境條件和演化特征是區域經濟開發的客觀約束,同時,區域經濟開發也改變著城市群的地質環境條件,是城市群規劃、建設必須考慮的基礎要素。本文結合城市群地質環境演化大數據的特點及城市群經濟區規劃、建設與管理對地質環境演化空間信息服務的需求,提出了一種面向城市群多目標應用的地質環境演化空間信息智能服務框架,形成了時空大數據驅動的地質環境演化空間信息綜合應用服務新模式。該框架具有良好的實用性和可擴展性,為滿足我國城市群經濟區層面的規劃預先協調、建設執行監督、運行評估預測、相互作用預判等,對地質環境演化空間信息服務提供了技術方法支撐。
參考文獻:
[1] 劉士林,劉新靜.中國城市群發展報告[M].北京:中國出版集團東方出版中心,2016.
[2] 王思敬.中國城市發展中的地質環境問題[J].第四紀研究,1996,16(2):115-122.
[3] 中國地質調查局.城市地質調查總體方案(2017—2025年)[M].北京:[s.n.],2017.
[4] 張繼賢,顧海燕,魯學軍,等.地理國情大數據研究框架[J].遙感學報,2016,20(5):1017-1026.
[5] 吉根,林趙斌.面向大數據的時空數據挖掘綜述[J].南京師范大學報(自然科學版),2014,37(1):1-7.
[6] LAXMAN S S,SASTRY P S.A Survey of Temporal Data Mining[J].Sadhana,2006,31(2):173-198.
[7] 劉大有,陳慧靈,齊紅,等.時空數據挖掘研究進展[J].計算機研究與發展,2013,50(2):225-239.
[8] 葛大慶.區域性地面沉降InSAR監測關鍵技術研究[D].北京:中國地質大學(北京),2013.
[9] 陳崇成,林劍峰,吳小竹,等.基于NoSQL的海量空間數據云存儲與服務方法[J].地球信息科學學報,2013,15(2):166-174.
[10] 呂雪鋒,程承旗,龔健雅,等.海量遙感數據存儲管理技術綜述[J].中國科學(技術科學),2011,41(12):1561-1573.
[11] 徐道柱,焦洋洋,金澄.分布式空間數據庫中矢量數據多級空間索引方法研究[J].測繪工程,2017,26(10):1-6
[12] 程昌秀.矢量數據多尺度空間索引方法的研究[J].武漢大學學報(信息科學版),2009,34(5):597-601.
[13] 李德仁,張良培,夏桂松.遙感大數據自動分析與數據挖掘[J].測繪學報,2014,43(12):1211-1216.