尹 峰,李儉康,劉中秋
(1. 湖北省空間規劃研究院,湖北 武漢 430070;2. 武漢吉威空間信息技術研究院有限公司,湖北 武漢 430014)
2009 年湖北省土地調查數據庫管理系統建設完成,首次實現了對TB 級全省土地調查成果數據的集中管理。2018 年自然資源部“兩統一”和“多規合一”職責的確立,以及隨之而來的第三次國土調查、實景三維中國的建設目標,從數據庫管理內容、海量數據存儲管理、高性能訪問與決策支持應用、二三維一體化展示等方面對湖北省級土地調查數據庫提出了更高要求。因此,如何在充分繼承和挖掘現有數據成果的基礎上,對現有湖北省級土地調查數據庫進行升級與優化,以滿足新形勢下湖北省自然資源管理事業的現實需求,成為當前湖北省級國土調查數據庫建設中亟待解決的難題。
針對不同專題、不同結構下多時態國土調查成果數據的高效管理和應用問題,相關學者從軟件平臺選型、國土調查時空數據庫更新方法和應用模式等方面展開了研究,如在軟件選型方面,相關研究分別探索了 基 于 Oracle Spatial[1]、ArcGIS[2]、MapGIS[3]和 Geoway Forland[4]等不同軟件平臺的國土調查數據建庫方案;解蕾[5]、鐘星[6]、何大金[7]、戴海倫[8]和方川[9]等則先后研究了土地調查時空數據庫的更新策略。從數據庫管理系統的空間尺度來看,現有研究主要集中在省級[10-13]和縣級[2,5-6,14]國土調查數據庫的研究。近年來,隨著傾斜攝影測量和實景三維技術的發展,面向自然資源三維立體時空數據庫的研究也開始得到關注[15-16]。
總體上看,現有的關于國土調查數據庫在軟件選型、建庫更新和決策應用方面的研究為新形勢下湖北省級國土調查數據庫建設提供了重要研究基礎和參考;而湖北省級國土調查數據建庫與優化升級在海量時空數據高效管理與更新、二三維場景數據一體化可視化和開放環境下土地大數據決策支持技術等方面依然亟待研究。因此,本文在對建庫、管理和應用需求分析的基礎上,設計了湖北省級國土調查數據庫的優化升級技術路線,并對國土調查海量數據高性能存儲管理、基于國土調查時空大數據的分析決策支持和國土調查成果數據二三維場景一體化顯示等關鍵技術進行了研究。研究成果預期將服務于湖北省第三次國土調查成果數據庫的優化升級。
自2009年第二次土地調查以來,歷經9次年度土地變更調查,目前湖北省級國土調查數據的總容量已達到6 TB。隨著第三次國土調查成果數據、高分辨率遙感圖像、無人機航測影像和三維數據模型的入庫,湖北省級國土調查數據庫的存儲對象和容量將呈指數級增長。湖北省級國土調查數據庫已無法滿足新形勢下自然資源管理事業對海量多源異構自然資源時空數據的高效存儲管理、國土調查成果數據的二三維一體化顯示、自然資源大數據智能化分析決策等需求。
1)國土調查海量成果數據的高效存儲與管理。湖北省級國土調查數據庫面臨著存儲空間不足、時空數據關聯分析欠缺、功能擴展難和管理與訪問效率低等問題,難以滿足新形勢下國家、省、市、縣的4 級聯動與更新和自然資源管理業務的擴展需求。
2)國土調查成果數據的二三維場景一體可視化。由于影像切片數據集個數較多,三維平臺的啟動時間較長,且矢量數據無法加載到三維平臺上進行瀏覽。現有數據庫管理系統無法實現從“地塊—村—鄉鎮—縣—市—省”多尺度對自然資源管理業務中產生的多類型基礎數據進行高效查詢與可視化。
3)自然資源大數據智能化分析決策。為了有效挖掘數據與利用數據價值,迫切需要改造當前以圖層為管理和應用的模式,建立國土調查數據對象級的完整的時空序列對應關系,按照“大數據、大分析”的思想,實現基于對象的時空分析,進行一體化管理、應用與分析,以應對日益增長的自然資源管理業務決策支持需求。
針對湖北省級國土調查數據庫當前運行維護所面臨的壓力以及自然資源管理決策支持的需求,新形勢下湖北省級國土調查數據庫優化升級的總體目標和任務包括:①改造數據庫系統結構,使之在數據存儲、兼容性和可擴展性等方面的能力得到增強;②優化系統性能,提高數據查詢、瀏覽、統計、分發的響應時間與效率;③拓展決策支持功能,通過數據結構與性能的提升,豐富數據庫系統基于國土調查時空大數據服務于自然資源管理決策支持的能力;④提升國土調查海量基礎數據二三維動態渲染與服務發布能力,實現國土資源基礎數據的多樣化、個性化和高效可視化。
根據湖北省級國土調查數據庫的優化升級目標,湖北省級國土調查數據庫管理系統的優化升級主要包括數據庫存儲模型與結構改造、數據庫兼容性擴展、數據庫分析決策功能提升、基礎技術平臺升級和數據庫性能優化5個方面的內容,總體技術路線如圖1所示。

圖1 湖北省級國土調查數據庫升級優化技術路線
1)數據庫存儲模型與結構改造。構建時態數據模型和增量更新數據模型,在當前以國土調查數據為主的基礎上,整合地理國情、林草水濕等多源異構自然資源管理數據;形成集關系型、NoSQL、影像編目庫等于一體的多維多粒度分布式數據存儲模型,提升平臺對海量多源異構時空數據的存儲與管理能力。
2)數據庫兼容性擴展。為滿足“大數據、大分析”的發展需求以及提供更快速、便捷和優質的國土調查數據服務,對系統接口進行兼容性擴展,通過服務接口、共用工具銜接、數據雙向調用、數據編目與元數據等手段,實現與土地基礎數據集成管理系統和業務平臺的數據調用。
3)數據庫分析決策功能提升。基于改造后的國土調查海量數據存儲時空數據模型,全面提升自然資源時空大數據服務于自然資源管理決策的能力。在對數據庫現有查詢、統計等基礎功能進行優化的基礎上,集成基于時空數據挖掘方法的土地利用時空變化模擬和多情景優化決策模型。
4)基礎技術平臺升級。為發揮新技術、新方法在海量時空數據存儲管理方面的優勢,對現有數據管理平臺的基礎軟件進行升級,以支持系統數據存儲能力和訪問性能的提升。
5)數據庫性能優化。數據庫的數據訪問與查詢性能直接關系到數據庫中基礎數據成果的應用效率。本文基于虛擬化環境,綜合利用并行運算、數據庫集群和數據切片技術,對數據存儲管理效率、查詢瀏覽效率、統計分析效率、數據分發效率和遷移部署效率進行組織管理優化、應用分析優化和快速服務優化,以提高國土調查管理系統性能,實現快速高效的數據管理、應用、分析和服務。
針對高效存儲管理國土調查、地理國情、林草水濕等來源、類型、數據結構不同的海量國土調查相關成果數據的需求,本文采用混合存儲架構,分別利用數據庫、文件存儲系統進行海量多源異構數據的高效安全存儲。其中,屬性數據、矢量數據、遙感圖像、矢量瓦片、影像切片等利用Oracle 數據進行集中管理,并存放于Oracle RAC(Real Application Cluster)集群上,以應對海量數據高檢索、高并發和高IO的需求;其他大型文件采用共享文件存儲和分布式文件存儲。針對不同類型的數據,根據其數據量、數據結構、數據應用場景等選擇最優的存儲方式。總體存儲架構如圖2所示。

圖2 多源異構國土調查大數據存儲策略
為應對湖北省級國土調查數據庫高效服務于分析決策的實際需求,采用開放環境的土地基礎大數據處理分析技術,將國土調查、地理國情、林草水濕等多專題數據納入到數據庫中進行集中管理。湖北省級國土調查數據庫的土地大數據分析技術總體架構如圖3所示,主要包括設施層、存儲層、計算層、模型層等,其中設施層為計算資源與存儲資源,針對不同的數據類型,采用不同的數據存儲方式,實現數據的塊存儲、文件存儲和對象存儲,針對不同的應用場景,劃分出高性能計算集群、分布式計算集群和GPU計算集群;存儲層根據不同的數據類型和應用場景,采用空間數據庫、共享文件系統、非關系型數據庫與分布文件系統對各類基礎數據進行存儲;計算層通過耦合高性能計算、分布式計算和內存計算等計算框架,自適應選取計算策略,并動態分配系統計算資源,為上層應用提供魯棒、高效的應用分析服務;模型層以模塊化思想提供數據模型、算法模型和應用模型,可利用可視化方法快速搭建空間分析算法工作流。

圖3 土地大數據分析技術總體架構
在統一的數據庫平臺和場景下,從“地塊—村—鄉鎮—縣—市—省”多個尺度實現不同類型、多源異構數據的高效二三維一體化展示,是湖北省級國土調查數據庫優化升級的重要目標和難點問題。針對湖北省級國土調查數據庫中存儲的各類數據的特點和應用需求,本文提出了虛擬金字塔技術(圖4)。

圖4 面向國土調查海量二三維數據一體化顯示的虛擬金字塔模型
如圖4 所示,模型通過耦合矢量瓦片標準、Arc?GIS 標準、影像切片標準創建瓦片和數據服務,從而實現對不同類型數據成果的高效一體化可視化。上述異構金字塔都有各自的分級標準,全球瓦片格網劃分起算點、瓦片編碼和屬性規則,空間范圍,編碼規則和屬性信息。湖北省級國土調查數據庫管理系統的三維展示引擎采用虛擬金字塔技術,對各類異構金字塔數據進行組織與管理,邏輯上抽象成虛擬金字塔,三維場景中展示時通過虛擬金字塔進行相應異構數據的調用和渲染。
為實現不同類型數據在統一平臺上的高效集成可視化,本文基于虛擬金字塔模型,采取圖層數據分離和邏輯耦合技術,實現了各類數據成果分別基于Arc?GIS Server、矢量瓦片服務、影像切片服務的混合接入和集成展示,如圖5所示。

圖5 基于虛擬金字塔模型的二三維數據一體化組織
為測試湖北省級國土調查數據庫的關鍵技術性能,本文搭建了小型計算集群,硬件配置為:①數據庫服務器3 臺,硬件參數為64 核主頻2.1GHz 的CPU、128 G內存、9 TB存儲;②測試客戶機兩臺,硬件參數為4核主頻3.33 GHz的CPU、內存16 G,硬盤2 TB。在數據存儲方面,數據庫的核心文件數據采用NAS存儲設備進行存儲,可滿足局域網內PB級的數據存儲、擴容。NAS存儲服務器與數據庫服務器和客戶機之間通過萬兆光纖交換機進行高速互聯,實現局域網內數據的高速共享與互訪。在測試數據方面,選取全省2019年的土地利用變更調查數據進行驗證,其中矢量要素1 086萬個,數據量為14 GB;柵格數據約為1.39 TB。
從數據查詢、空間分析與服務分發性能測試等方面來看,優化升級后的湖北省級國土調查數據庫對省級矢量要素的查詢與統計耗時在5 s以內,縣級尺度矢量要素的任意空間范圍、多個圖層、跨區縣的查詢統計耗時可控制在3 s以內,省級尺度的空間疊加分析耗時可控制在1 min以內。在國土調查柵格和矢量數據分發性能測試中,按任意范圍跨武漢市、宜昌市兩個市分發5個縣的柵格數據(數據量為69.1 GB),平均每個縣約耗時5 min,矢量數據分發平均每個縣耗時僅20 s。
在全省尺度的國土調查成果數據可視化性能測試方面,通過虛擬金字塔技術的應用,實現了多源異構國土調查數據成果的二三維一體化場景展示(圖6)。其中,在海量矢量數據的高效可視化方面,實現了GB 級別的矢量數據秒開,無縫漫游效率視覺無延遲;單節點支持200+并發訪問,響應時間在1 s以內。

圖6 全省尺度國土調查成果數據可視化效果
本文主要針對湖北省級國土調查數據庫優化升級中面臨的主要問題和挑戰展開了研究工作。針對“兩統一”新形勢下自然資源管理的應用決策支持需求和國土調查成果數據的基本特點,分別提出了多源異構國土調查數據存儲技術、國土時空大數據高性能分析技術和二三維海量國土調查數據可視化技術。結果表明,優化升級后的湖北省級國土調查數據庫管理系統在海量多源異構國土調查成果數據高效存儲、高性能分析與二三維一體化展示方面的性能與功能基本達到了預定的設計目標。研究成果預期將服務于湖北省第三次國土調查和年度變更調查成果數據的管理與應用。