田朝暉,秦曉莉,范 琰
(湖南省國土資源規劃院,湖南 長沙410004)
當前,致力于大數據、人工智能、普適計算、萬物互聯和無窮感知的信息革命正在以前所未有的廣度和深度影響和改變著人類的生產與生活方式[1]。這一變革同樣也影響著國土空間規劃行業未來的轉型與變革,需要規劃信息者借助新技術、新技能不斷創新思想,使計劃更加科學有效。為使在大數據環境下的國土空間規劃工作變得更有效率,迫切需要建立一個以大數據為支撐的,集信息采集、儲存、應用和科研協同為一體的,以“自動化、大數據、復合型、交互性和增長性”為特征的智慧信息平臺,提高國土空間規劃的質量和效率。
在信息化平臺建設過程中,面對海量的、高速增長的和多源化的數據,如何有效地整合和共享數據資源,如何為平臺建設提供可靠的數據支撐,如何保障數據的安全等,這些與大數據治理相關的一系列問題不斷顯現。因此,有必要開展大數據治理研究,并提供一套有效的數據治理方案,以解決信息平臺項目建設中的實際問題。
數據治理體系是數據有效利用的基本保障,建立一套完整的數據治理體系,并形成與之相配套的組織治理機構、流程制度及支撐工具,從而實現對數據的標準、模型、采集、集成、安全等方面進行統一管控,最終確保數據治理環境的可靠、高效、安全。對于信息化平臺的建設而言,數據治理體系主要包括元數據管理、數據資源目錄管理、數據標準管理、數據模型管理、數據質量管理等[2]。
按照目前國土空間規劃的工作要求,建立一套涵蓋數據“采、存、通、用”全生命周期的、多模式混合的數據治理系統(見圖1)。治理思路涵蓋“采”“存”“通”和“用”四個流程,其中“采”和“存”重點解決數據來源問題,并實現數據的及時采集、集中存儲;“通”主要統一各種來源數據的標準,用于解決數據質量問題;“用”則著重解決數據價值轉化的問題,通過開展各類開發應用,從而為各業務部門具體開展工作提供個性化支撐。

圖1 數據治理設計思路
數據治理主要包括四個方面的內容(圖2)。

圖2 數據治理框架
1.2.1 數據集成
按照一定數據目錄結構進行存儲和集成。如有效整合現有數據、遺留數據及外部應用數據;提高辦事效率,解決企業內外數據信息孤島問題。
1.2.2 數據匯總
按照特定標準對原始數據進行處理、清洗、轉換,實現原始數據到標準數據的匯總。
1.2.3 數據治理
通過制定相關的組織、制度和流程以及數據標準,完成對數據的治理。主要是對數據環境的治理,包括主數據治理和元數據治理。
(1)主數據治理:通過主數據管理工具(MDM)統一進行維護,采用編碼規則、數據校驗等功能對數據進行校驗、查重、匹配、合并等操作,確保數據一致性、完整性和準確性。
(2)元數據治理:元數據是描述諸如信息資源或數據之類的對象的數據。它的作用是識別數據,跟蹤數據使用中的變化,以實現簡單有效地管理大量基于信息的數據[3]。數據治理主要用來明確業務數據從哪里來、誰來使用及數據間的關聯,可以提供數據源管理、分析數據血緣關系、分析數據影響等,實現對復雜數據環境的監控管理,為平臺提供安全可信的數據,為數據倉庫的運行與維護提供有效支撐。
1.2.4 數據應用
由查詢統計、監督評估、大數據分析、知識管理、電子檔案管理等部分和日常應用管理組成。
數據治理應遵循如下原則[4]:
1.3.1 有效性原則
數據治理過程中應體現數據的質量、標準及管控價值的有效性和高效性。
1.3.2 統一性原則
數據平臺應體現標準、架構、元數據、質量流程、資產價值的五統一。
1.3.3 開放性原則
應體現人人參與數據治理、人人參與數據運維的開放性思想。
1.3.4 價值化原則
應最大化平臺的數據價值,實現數據資產的價值核心。
1.3.5 安全性原則
應建立一套有效的從平臺到數據、從運行安全到數據安全的技術防護體系,保障平臺數據的安全可控。
隨著自然資源機構的改革,自然資源各部門的業務、關系、管理等迫切需要對信息化建設的內容、方向等方面進行重構、整合與優化,這不僅僅是簡單的人員整合和部門機構改革,更是自上而下的業務變革與技術革命。與此同時,國務院、自然資源部及各級政府出臺了一系列有關信息化建設的指導意見和通知,要求借助GIS、大數據、物聯網新技術,建立起一套能夠實現全面覆蓋的動態化、精細化自然資源信息化管理平臺。此外,以互聯網、大數據、人工智能等新一代技術發展與應用為基礎的“智慧社會”的崛起,為當前正在開展的國土空間規劃編制與信息化建設工作提供了新環境,也提出了新的要求。在此背景下,可以說智慧規劃信息平臺建設適逢其時。
數十年來,全院積累了包括基礎測繪、基礎土地、基礎地質、礦產資源、地質災害等大量信息數據,涵蓋空間矢量、柵格影像、電子檔案、統計表格及視頻圖片等各種類型。然而,數據在管理與應用上存在著許多問題,主要表現為:數據涉及省、市、縣多個級別,其比例尺、精度坐標系和空間維度不統一;信息孤島大量存在,找尋、共享難度大;缺乏對大數據的有效管理和檢索,“數據有,但不好找”;缺乏數據到價值的轉化渠道,“不知道能用數據做什么”。因此,數據的治理勢在必行,通過數據治理過程,全面梳理院內各類數據,建設各類數據的審核管理、元數據管理和維護機制,維護數據的完整性、準確性以及一致性,實現數據的全生命周期管理,從而使得數據標準、數據內容以及數據質量都能夠得到持續地提升,保證數據資產的長久價值。
2.3.1 數據治理架構
數據治理架構主要包括數據采集、數據治理、數據標準制定、數據使用和數據全生命周期管理等,整體架構如圖3所示。

圖3 平臺數據治理架構
2.3.2 數據標準規范建設
如表1所示,數據標準規范體系建設分為5大類,13小類。參照國際、國內行業等標準,并結合院內的實際需求來確定統一的數據標準、坐標體系、轉換規則、資料目錄及數據共享規則,以達到解決數據統計口徑不一、數據定義不明、數據內容謬誤及各部門間數據屏障等問題。

表1 信息平臺數據標準規范體系表
2.3.3 數據集成入庫
構建涵蓋基礎地理、自然資源、空間規劃、實施評價以及社會經濟等在內的多源時空大數據庫。平臺數據以統一的編碼規則、數據校驗方式向數據中心進行注冊,支持矢量數據、柵格數據和屬性數據等,導入數據時嚴格按照制定的數據標準進行匹配檢查,對于缺失的非重要字段、圖層,系統自動完善數據的元數據信息。
2.3.4 元數據管理
元數據管理是指對元數據標準的管理,可參考《地質信息元數據標準》(DD2006-05)、《基礎地理信息數字產品元數據》(CH/T 1007-2001)、《國土資源信息核心元數據標準》(TD1016-2017)等標準進行管理。將與國土資源數據有關的信息進行整理、制作和入庫,例如數據的內容、覆蓋范圍、質量、管理方式、所有者、提供方式等。管理主要包括三個功能模塊:元數據實體管理、元數據關系梳理、元數據應用(詳見表2)。

表2 元數據管理功能模塊分類表
2.3.5 構建數據資源目錄
以反映業務需求和應對應用需要為導向,結合國土空間規劃對數據的新要求和新標準,分析各種類型數據之間的層次、類別和關系,系統化地梳理與空間規劃有關的數據,制定統一的數據資源編碼和分類體系,建立包含現狀、規劃、管理、經濟社會等數據資源目錄。
2.3.6 海量數據專業可視化展示
面向平臺數據可視化的需求,圍繞基礎數據、成果管理、數據分析三個方面,采用可視、交互的方式直觀地展示數據信息?;诤A繑祿绊椖慷鄻有裕纬蓴祿Y產,分析應用全面掌控數據來龍去脈,獲得更多的數據洞察力,進而挖掘出隱藏在資源中的價值。
2.3.7 打造智慧規劃信息服務高地
匯集整合各業務部門數據、城市各類基礎信息和手機信令大數據等,構建“一張圖”地理空間大數據體系[5],建立起支撐自然資源管理、國土空間規劃的底板數據庫。借智慧型信息化平臺建設之機,加強智慧規劃所需的專業技術與管理人才的培養,最終打造形成“大數據時代”新形勢下自然資源和空間規劃建設管理所需的智庫。
2.3.8 數據安全管理
數據安全管理是通過建立完善的數據安全管控體系,降低數據泄露風險,實現數據資產的安全防護。主要包括安全管控機制建設、數據訪問權限管理、數據脫敏管理、數據分級分類管理和數據安全審計等方面的內容。
數據治理工作是一個龐大的工程,本文設計并闡述了智慧型信息化平臺建設過程中數據治理方面的實際需求,取得了一定的工作成果,但也存在著一些不盡如人意的地方,需要改進與完善。從理論依據與實際業務需求來看,由于大數據治理仍處于新生狀態,仍需要在不斷的發展過程中去探索和完善。