文|李思思
近年來國家數字政府及智慧城市建設步伐加快,數據要素作為一種新型生產要素,是國家重要的基礎性戰略資源,其有效性對于利用信息化技術實現政府管理與服務模式創新具有十分重大的意義。為解決政務數據應用及共享過程中數據質量低、不規范等問題,本文從數據治理的必要性入手,研究數據治理流程及總體功能架構,積極探索數據治理在提升數據有效性中發揮的作用,最終通過數據治理持續提升和優化數據質量,從而賦能政務服務及政務治理等應用場景,助力推進國家數字政府及智慧城市發展。
政府的IT系統經歷了數據量高速膨脹的時期,海量的、分散在不同角落的數據導致了數據資源利用的復雜性和管理的高難度。政府機關無法從統一的業務視角概覽整個機關內部的數據信息。對外提供服務的為一個個獨立的系統,系統與系統之間的關系、標準數據從哪里獲取均無從知曉。
圍繞數據生產要素,制定數據管理體系,并通過數據建模挖掘不同場景中的數據價值,為輔助決策提供支撐,全面提升政府服務治理能力;使數據成為國家重要基礎性戰略資源,促進社會數據與政務數據融合;以數據治理為抓手,一定程度上促進優化政府職責、深化供給側改革,提升政府側管理服務水平。
政務服務與管理已經從標準化階段發展到開發治理及服務模式創新性發展的階段,這從客觀上對政府服務與管理的創新能力提出了更高的要求,當前政務服務與管理的創新在很大程度上要借助科技手段在業務數據的開發和利用基礎上進行創新,高質量數據為政府實施有效的創新提供了豐富強大的動力。
建立政府機關各部門數據共享通道,匯聚接入政務數據、社會數據等,借助標準管理、質量管理、元數據管理等信息化工具進行標準化的持續迭代數據治理,形成標準化、高質量、安全可靠的治理數據。通過整合關聯分析所歸集治理的數據,形成統一的數據資源服務體系,為“民生服務”、“城市治理”、“產業經濟”、“生態宜居”等應用場景提供數據能力支撐。
數據治理具體流程如下:
在數據資源管理方統籌受理下,數據使用方提出數據使用規范,數據提供方按需提供,然后由數據治理團隊應用數據中臺或DaaS層能力進行數據對接落地。
通過多方參與完成數據處理規則的制定,對源數據進行數據處理設計,形成長期可執行的數據處理規則。
數據治理團隊依據數據處理規則將前端源數據歸集到貼源層/共享庫,然后進行數據規范化處理,再進行基礎庫、主題庫的建設及運維。
在數據質量管理上,數據需求方從應用需求層面上提出對數據質量的規則要求,數據資源管理方負責統籌制定數據質量內容規范及數據質量管理方案。在提交數據質量整改需求后,由數據提供方進行源數據的修正。
數據治理團隊負責數據運營及運行監控,以業務及數據全景圖的形式展示數據治理全貌。
在以上數據治理完成的基礎上,可以開展大數據應用。數據需求方可以提出跨部門的數據申請,數據資源管理方基于應用場景進行數據開發,并牽頭進行跨部門的數據融合分析應用。
數據治理工作以應用場景為導向,貫穿于數據采集、匯聚、處理、應用全生命周期,通過數據元和業務模型的標準化管理,持續提升和優化數據質量,為數字政府及智慧城市等場景提供支撐。結合數據治理工作的定位及數據治理流程,研究數據治理平臺整體功能架構。數據治理平臺主要融合元數據、數據標準、數據質量、數據血緣、數據運維等管理功能模塊。
元數據作為“數據的數據”,包括技術元數據、業務元數據、管理元數據,可以準確充分地描述數據的各項特征。通過元數據管理,為各業務部門數據資源的發現和獲取提供一種實際而簡便的方法,外網用戶能夠快速了解數據上下游關聯關系及數據資源的內容、格式、質量、處理方法和獲取方法等各細節,精準定位所需數據,減少數據研究的時間成本,元數據的管理主要包括元數據注冊、元數據存儲、元數據維護、元數據發布等功能。
標準規則管理:定義標準規則庫,包括編碼規則、命名規則等,對數據空間、數據結構、數據項等按照標準規范進行合規性檢查,對不符合要求項進行提示和告警。
標準制定管理:可添加數據標準項、標準類型、標準字段、標準描述等,通過標準制定可自動生成標準版本號,并記錄標準制定的人員、時間等。
標準執行管理:包括標準發布、應用、反饋、仲裁的閉環過程,通過權限管理賦予不同環節權限。
標準維護管理:對標準內容進行添加、刪除、修改操作,并對每次操作做記錄,生成不同標準版本號。
標準審計管理:對數據規范進行人工審計,按照制定的數據標準規范進行檢查,以明細表、統計表、趨勢表的形式直觀展示各業務數據的合規性,并且可生成改進舉措要求和通知單。
通過“數據質量定義、過程控制、質量日常監測、問題分析與診斷、問題整改、質量評估”的閉環機制來確保數據滿足提供方、使用方和管理方的需求,通過全方面對數據質量進行診斷和整改,解決數據不一致、數據可用性、數據不及時等數據質量問題,從而持續提升數據的質量。
以政務部門整體元數據為基礎,實現技術元數據到字段級別的全鏈分析、影響分析和血緣分析。通過提供跨信息化系統的元數據血緣分析,實現數據從采集、匯聚、處理、到流通應用等環節的血緣追溯;通過對貼源庫、基礎庫、專題庫等各類數據資源間和數據項間的繼承關系進行闡述和管理,從而反映數據資源在各個環節間的流通與繼承關系。以歷史事實的方式記錄每項數據的來源,處理過程,應用對接情況等,記錄了數據表在治理過程中的全鏈血緣關系,基于這些血緣關系信息,可以進行影響分析,以數據流向為主線的血緣追溯等功能,從而提升報表信息的可信度,為數據的合規性提供驗證手段,幫助業務部門實現信息共享、提升協調工作效率。
通過對數據接入、數據提取、數據清洗、數據關聯、數據比對、數據標識、數據分發、數據入庫等各個環節設置監控點,進行多維度信息的實時采集與監控。根據匯總的實時狀態采集信息,展示數據治理各環節中數據通道、數量流量、數據積壓、數據服務整體情況,并通過配置預警規則與預警方式,實現對于監控過程中出現的異常情況進行預警,從而輔助數據運維運營管理。
在全國各地推動數據共享,推進全國一體化政務大數據體系建設的大背景下,做好數據治理是關鍵。只有認識到數據治理的必要性,把握數據治理流程的關鍵要素,并將數據治理中的機制體制建設、技治、人治有機地結合起來,才能確保數據治理的有效性。從而為實現政務服務、政府治理、決策運行數據“按需共享、智慧賦能、安全應用”打下基礎,更好助力數據高質量共享、發揮數據價值、推進數據要素市場化,更好賦能數字政府及智慧城市建設。