城市級數據資源倉是數字政府、智慧城市建設的基礎中樞,是加快數據匯聚,推動數據共享,深化數據應用,讓大數據智能化更好為經濟賦能,為生活添彩的重要基礎設施。城市數據資源倉建設應根據城市規模的大小,歸集共享數據量大小、城市數字化程度等因素,因地施策進行建設。區縣數據資源倉不僅要考慮區縣級數據歸集、治理與共享交換,還需要考慮與市級數據資源倉進行有效共享與數據回源。
市級數據資源倉:建設在市域一級,通常由市大數據主管部門牽頭建設。市級數據資源倉是由市、區縣兩級匯聚整合本級所有公共數據形成的數據集合,分為市級公共數據資源倉、市級部門數據資源倉、區縣級數據資源倉,實現全市數據分域管理。市級公共數據資源倉匯聚全市基礎自然人、法人、自然資源和空間地理、電子證照四大基礎庫。市級部門數據資源倉匯聚全市各行政部門,是指國家機關和法律、法規授權的具有管理公共事務職能的組織(以下稱政務部門)為履行法定職責收集、制作的數據歸集而形成的數據資源倉。在市級數據資源倉內的區縣數據資源倉,是匯聚整合了區縣特色專題、主題數據庫數據,且具備共享至市級或其他區縣使用的數據資源倉。
區縣級數據資源倉如圖1所示,通常建設在區縣一級,由區縣大數據主管部門牽頭建設。區縣級數據資源倉是按照需求導向、以用促建原則,匯聚市級、區縣級部門、鎮街以及社會數據,通過編目、歸集、治理、共享等手段,并遵循相應安全管理與標準規范,建設涵蓋公共數據、部門數據、鎮街數據的數據資源體系,實現分域數據管理、全區數據統管、市級數據回流等功能,為全區各類數字化應用提供高質量的數據供給。
城市數據資源倉應包括數據編目、數據歸集、數據治理、數據共享交換四大功能板塊,通過治理形成區縣部門數據資源倉、區縣公共數據資源倉、街鎮數據資源倉,并且依托標準規范體系級安全管理體系運行。
(一)數據編目
數據編目是了解數據現狀的重要工具,成功的數據治理取決于通過掃描和編目各個部門現有的數據資產來發現數據的能力。通過對現有數據進行編目,能夠讓數據提供方對數據有直觀的掌握和了解,有效的數據目錄將可以提供端到端沿襲的業務友好型視圖,因此可以了解關鍵數據的來源。
(二)數據歸集
通過數據共享系統打通市、區兩級之間的數據,實現對市級回流數據、區縣級部門數據、街鎮數據、社會數據統一匯聚歸集管理,形成橫縱向貫通的數據歸集能力。數據歸集是數據治理的前提,將數據統一歸集至前置庫,開展數據治理工作才不會影響原有業務系統的正常工作。在數據歸集階段,通常需要解決數據資源倉至業務應用的網絡不一致等問題,歸集手段可以通過API、數據庫表、文件等形式,也可提供數據填報系統,將無業務系統支撐但關鍵且需要的數據進行填報歸集。
(三)數據治理
數據治理包括數據的清洗融合、數據貫標、數據建模、安全管理等環節,是梳理數據并形成有價值結果的關鍵步驟。通過數據清洗,形成集數據采集匯聚、資源編目管理、數據治理、數據開發、資產管理、數據服務于一體的區縣級數據資源倉全生命周期數據治理能力體系。
數據清洗融合通過提取、清洗、轉換、關聯、融合等數據處理模型,內嵌數據模型、數據源的標準建議,以“快加工”的方式,實現結構化數據的融合處理,為構建政務數據資源提供支撐。數據清洗融合系統可快速構建區縣級政務數據資源庫,使數據融合過程更規范、更高效。
數據貫標是數據質量好壞的評價度量指示器,它從元信息、數據標準、數據質量規則等角度形成數據模型、數據質量要求以及數據改進提升的數據治理核心功能和業務應用,可以自動生成數據質量稽查報告。
數據建模能夠清楚地展示各種業務主題之間的相關性,使不同政府部門的業務人員、應用開發人員和系統管理人員獲得統一完整的視圖,是打通數據模型管理全流程的數據模型設計器,能實現邏輯數據模型和物理數據模型的設計與管理,幫助區縣各部門實現數據模型資產管理與有效應用實踐。
同時,通過對數據的分級分類訪問控制、數據脫敏管理、數據安全審計、數據合規性評估等方式來保障平臺的數據安全,保證敏感數據防護符合管理規定和數據隱私法律等規定,實現“進不來+看不見+拿不走+能追溯”的數據安全監管保護體系。

(四)數據共享交換
數據共享交換是城市數據資源倉建設的。數據共享交換提供交換節點之間的庫表、文件等數據的抽取、轉換、加載、傳輸等數據交換能力,支撐區縣數字政府建設過程涉及的各部門之間的數據交換與共享。同時基于共享交換系統確保橫向各部門政務數據資源的共享交換和縱向市、區縣兩級政務數據資源的雙向流動。數據共享交換包括資源編目維護、編目數據掛接、數據上報與回流、數據更新維護等板塊。
(1)資源編目維護
在整個政務數據整合共享框架體系中,政務數據資源編目是核心基礎,資源編目體系建設與實施的質量,決定了整個整合共享體系的質量與成敗,所以建設并實施一套高質量的、符合實際現狀的目錄體系,尤為重要。為適應最新的國家相關標準和規范要求,資源編目建議按照最新版《政務信息資源目錄編制指南(試行)》規范進行開發設計。總體而言,政務信息資源目錄管理系統的建設,以政務信息資源目錄清洗和目錄管控為核心,支撐政務信息資源整合共享為目標,梳理、維護區縣級數倉下的數據資源共享目錄、開放目錄。
(2)編目數據掛接
編目數據掛接通常需要通過共享門戶系統來實現,該系統主要面向數據提供方和數據需求方,是為實現數據在區縣各部門間便捷共享而建設的系統。其主要用戶為各委辦局業務人員,對于數據的需求主體,用戶無需進入具體的數據中臺產品,無需關注具體的數據加工流程,只需關注要使用什么數據,如何獲取這些資源即可,門戶系統向用戶展示結構清晰的數據目錄,依賴城市數據資源倉便捷獲取各種類型數據(通過庫表、接口、文件等形式);同時,門戶系統可通過態勢分析展示資源發布情況及資源使用情況。利用共享門戶系統,實現可開放的政務數據向各政府部門內部集中、有序開放和規范利用,為政府開展政務數據資源的開發利用提供數據支撐,推動數據資源規范共享的發展以及相關數據分析與研究工作的開展。
(3)數據上報與回流
根據市區兩級數據共享的需要,區縣數據資源倉數據通常要與市級數據資源倉形成接入通道,該通道需要滿足市級數據抽取及市級數據回流至區縣數據資源倉。區縣數據上報至市級,便于市級方便掌握及快速調用分析區縣數據,也可用于其他區縣調用。市級可通過回流通道,將全市基礎數據及公共數據,以及市級統建系統內的區縣數據回流至區縣數據資源倉,便于區縣業務開展。
(4)數據更新維護
區縣數據資源倉根據各部門數據需求的變化和市級需要,在區縣數據資源倉新增、變更、下線數據,保障上報的實時同步,對存在問題的數據進行更新,確保數據的準確性。
(五)共享交換流程
數據的有效流動必須要有配套的相關制度規范建設,用于使整個共享交換流程合規和受控。數據的共享交換流程主要分為兩類場景,其中一類是用到市級回流數據,需要市級部門進行審批;另一類是區縣內部共享,可在區縣內部形成數據共享交換的閉環,數據共享流程圖如圖2所示。
在嚴格遵循屬地市級標準規范體系的基礎上,區縣數據資源倉建設還需要考慮管理類、技術類、安全類三大類標準規范體系。管理類標準規范主要有《區縣數據資源倉操作使用指南》《公共數據歸集操作指南》《公共數據共享交換平臺操作指南》等;技術類標準規范主要有《數據模型設計標準》《公共數據治理工作細則》《數據服務接口接入規范》《數據質量管理規范》等;安全類標準規范主要有《數據資源倉安全體系建設指南》《數據安全管理規范》《用戶賬號管理規范》等。

作者單位:重慶電子信息中小企業公共服務有限公司