張潔
隨著大數據、人工智能、云計算、物聯網、區塊鏈等新興先進技術的應用,數據的地位、作用和價值日益得到人們的重視。財政部門是大數據生產、應用的重要領域之一,如何開展好財政數據治理工作,成為值得研究的重要問題。
一、背景
數字經濟的快速發展,蓬勃興起的數字化浪潮,使得公眾對公共服務的數量與質量的期待不斷提高,如何適應新形勢進行數字化轉型,從而為廣大人民群眾提供更加高質量、更貼合民眾需求的服務,成為政府部門面臨的新的挑戰。
財政作為國家治理的基礎和重要支柱,是大數據生產、應用的重要領域之一。加快財政大數據發展,充分整合和應用財政數據資源,是推動財政治理現代化的重大舉措。本文重點從拓展數據資源、強化數據治理的角度對財政數據治理工作進行研究。
二、地方財政信息化建設及數據資源情況
(一)地方財政信息化建設情況
地方財政信息化經過多年的建設和發展,信息系統已經基本覆蓋了財政管理的各個方面,對財政管理與改革起到了基礎保障作用。特別是在財政部的大力推動下.2020年以來,核心業務一體化系統在各地方財政分批上線運行,形成了以核心業務一體化系統為核心,配合其他相關業務系統共同支撐的格局.初步實現了財政核心業務數據的集中和統一,為財政數據治理提供了更好的基礎條件。
(二)地方財政數據資源情況
地方財政數據可以分為內部數據和外部數據。內部數據資源主要是財政業務運轉過程中所生產的數據,大致可以分為十大類分別是基礎數據、項目信息、預算信息、收入執行信息、支出執行信息、會計核算信息、政府采購信息、資產管理信息、決算信息、債務信息。外部數據包括其他政府部門的共享數據以及第三方及互聯網數據,其中其他政府部門共享數據主要來源于國務院相關部門的共享數據及各地方政務信息資源共享平臺的共享數據。
(三)地方財政信息化和數據利用存在的問題
整體而言,大多數地方財政信息化建設水平仍存在不足,與財政數字化轉型要求相比還存在不相適應的地方:一是財政數據基礎較為薄弱。整體數據質量不高,非核心一體化系統仍不能互聯互通,要素規則不統一,主數據難以自由流動和有效聚合。二是大數據思維不強,尚未充分認識到數字化技術對提升財政管理效能的重要意義,缺失系統性、規范化的數據治理機制。三是缺少統一的數據標準化管理平臺,相關各類主數據分散在不同的信息系統中自行管理,數據流向不清晰,無法固化數據標準,依托數據的分析研判能力明顯不足。
在分析理清現有地方財政信息化建設及數據資源的基礎上,開展財政數據治理的具體路徑研究,包括數據資源采集匯聚和數據治理管控兩部分。
三、數據資源采集匯聚
(一)構建數據采集管理體系
構建統一的數據采集管理服務,支撐數據管理部門管理和監控數據采集過程,保障數據采集流程的準確和穩定。對于不同類型、不同來源、不同時效要求、不同質量要求的數據采集需求,制定全面的數據采集流程、標準規范和組織管理體系,支撐數據管理部門按照規范的流程和方式快速響應各類數據采集需求,規范數據歸集的行為和成果,保障采集數據的可用和可靠。
(二)建立數據采集匯聚模型
對各數據來源及數據存儲結構進行分析,將異構的分散數據進行同構化匯聚,利用元數據采集手段、統一數據建模管理功能及貼源層數據模型的建模方法體系,構建貼源層數據邏輯存儲模型,建立數據采集匯聚貼源層邏輯數據庫表。
(三)實施數據分類采集
按照數據的不同來源財政大數據分為財政內生數據、財政外部數據和互聯網數據三部分。
財政內生數據的范圍包括各級財政數據及預算單位相關數據,數據主要來源于各業務系統。系統方面,依托核心業務一體化系統建設實施,可實現多級財政核心業務數據的匯集。對于主數據和業務流數據等的實時數據需求,利用PUSH方式的消息機制、數據庫主動監聽等手段實現;增量數據原則上利用ETL方式采集原始數據。
財政外部數據主要包括其他政務部門的數據。政務共享數據原則上統一對接地方政務信息共享交換平臺獲取,支持接口、中間庫、中間文件等方式,對于部分安全或保密性要求高,無法通過政務數據共享交換平臺獲取的,可直接與外部門對接獲取,部分第三方數據可通過購買的方式獲取。
互聯網數據包括來源于互聯網的各種數據,如宏觀經濟、政策法規、輿情、新聞熱點、上市公司披露信息等,采用互聯網數據采集工具進行采集處理。
四、數據治理管控
(一)數據標準管理
以財政部《財政業務基礎數據規范3.O》、《預算管理一體化系統技術標準>為基礎,對未包含在預算管理一體化中的其他業務和數據,結合地方相關技術規范及財政工作實際,制定擴展數據標準,從而形成地方財政數據標準規范。
(二)貼源數據資產化管理
數據資產目錄支持按照部門、時間、系統、業務域、類型等進行分類統計和管理,一張圖式展現財政數據家底。支持非中心化的管理模式,即根據貼源數據的涉密情況、安全要求、網絡情況等,分為本地存儲、直連注冊、前置代理三種模式。
(三)數據質量審計
數據質量審計是提升數據質量的關鍵手段,主要任務包括協助審計業務系統的數據標準符合性、對下級單位上報的數據進行審計、對于外部獲取的數據質量進行審計三個方面。
(四)數據清洗轉換
數據清洗轉換是數據標準化治理的重要過程,對數據進行掃描、去重、清洗、轉換、比對等一系列的加工處理,最終輸出符合地方財政數據標準規范的結構化數據,同時篩選出不符合規范的數據,并形成數據質量報告,通過數據管控流程將不一致的數據發給數據源單位修復,實現數據溯源。
(五)標準數據模型建設
建設數據標準層數據存儲模型,存儲經過清洗轉換和融合治理后的標準化財政數據,標準數據模型以主題域的方式對各類數據進行邏輯分庫存儲,并納入統一的元數據管理體系,實現一數一源、質量可靠、業務貫通。
(六)標準數據資產化管理
信息資產目錄以業務為視角,從數據的所屬業務域、業務過程、用戶視圖的角度進行管理,形成標準化的數據管理架構,各數據資源詳細登記其標簽信息、屬性信息、描述信息、共享開放信息、結構信息、版本信息、血緣關系及關聯關系等,以更加清晰和業務用戶可理解的方式對數據進行管理和呈現。
(七)深度數據治理
按照日常報表統計需求將標準數據分不同維度進行初步加工,按照業務標簽進行匯總,形成指標數據層,為統計分析及自定義查詢提供便利;根據應用分析場景需要開展深層次、個性化數據治理,如實時計算、數據挖掘、分析圖譜等,形成應用數據層,為復雜大數據應用提供支持。
(八)數據權限管理
數據的權限體系通過調研獲取并確定,利用“數據信息”兩級數據資產目錄體系以及用戶自身的數據共享需求進行分權管理。支持細化到數據行的權限管理,按用戶、角色分配數據權限。
五、結語
通過上述對原始數據的標準化加工處理,形成規范統一、口徑清晰的財政數據資產,是財政數據治理的基本路徑,再通過快速便捷的數據服務充分實現數據價值,使數據成為財政治理的新動能。
作者單位:天津市財政信息中心