張素珍 劉樹軍 許志坤

摘要:各省機構編制大數據中心的建設目前尚處于起步階段,很多省份亟須建設機構編制的大數據中心,本文在國內大數據中心及各省編辦信息化建設情況基礎上設計了省級“1+3”模式的一體化大數據中心體系架構,詳細設計了1個中心即省級數據處理中心,3個平臺即業務系統云平臺、省級數據交換與共享平臺、大數據應用平臺的具體架構,為省編辦大數據中心建設提供借鑒。
關鍵詞:機構編制;一體化;大數據中心
中圖分類號:TP391
文獻標識碼:A
文章編號:1009-3044(2020)03-0018-03
1 項目背景
近年來,隨著經濟的高速增長和互聯網特別是移動互聯網的不斷發展,政府大力倡導并積極推動“互聯網+”的理念和技術與政務服務深度融合。習近平總書記在中共中央政治局就實施網絡強國戰略進行的第三十六次集體學習中指出,要深刻認識互聯網在國家管理和社會治理中的作用,以推行電子政務、建設新型智慧城市等為抓手,以數據集中和共享為途徑,建設全國一體化的國家大數據中心,推進技術融合、業務融合、數據融合,實現跨層級、跨地域、跨系統、跨部門.跨業務的協同管理和服務。就“互聯網+”機構編制的研究和實踐發展來看,目前還處于探索階段,存在資源利用率低、配置不完善,數據互通不暢,平臺兼容效果差等方面的問題,因此亟須基于“一體化”的建設思路,構建一套科學、合理、有效的機構編制省級一體化大數據中心體系架構,以更好地開展機構編制管理和服務工作,同時為省級機構編制的云平臺和大數據中心建設和應用提供參考。
2 一體化大數據中心建設目標
按照“優化、整合、共享、互動”的基本原則,設計一套科學、合理、有效的機構編制省級一體化大數據中心體系架構,從河北省全局角度,對機構編制的各方面、各層級、各要素統籌規劃,體現“一體化”設計理念,功能實現上做到涵蓋全省、通聯全國,嘗試解決信息孤島,促進信息資源融合,實現數據互聯互通,避免資源浪費,提供高效社會服務,為省級機構編制的云平臺和大數據中心建設和應用提供參考。
3 省級一體化大數據中心架構設計
3.1 省級一體化大數據中心體系架構
省級一體化大數據中心體系架構采用“1+3”模式,即1個中心+3個平臺,1個中心指省級數據處理中心,3個平臺分別是業務系統云平臺、省級數據交換與共享平臺、大數據應用平臺。中央編辦云平臺支撐三定方案、權力清單等系統的運行,省內云平臺支撐省內個性化系統(例如編制實名制管理系統、電子編制證系統等)的運行,各系統的數據通過省級交換與共享平臺匯聚到省級數據處理中心,同時省級數據處理中心還將通過省級交換與共享平臺與中央編辦數據中心、其他省數據中心、省級政務中心等進行數據的交換共享,使得省級數據處理中心存放省內編辦相關的全視圖的數據,最終通過大數據應用平臺,為公眾、內部人員、行業人員、領導等提供身份認證、公共信息、資源、數據等各類服務。
具體架構如下圖所示:
3.2 省級數據處理中心
省級數據處理中心是集合省編辦數據信息、各地市編辦數據信息、中央編辦相關數據信息、其他省參考數據信息、省政務相關數據信息的數據中心。省級數據處理中心按照“理論上一致、功能上協調、結構上統一、資源共享、部件標準化”的設計原則,強化頂層設計,做好大數據中心建設前期的統籌規劃,實現政務信息資源的共享、交換和業務協同。
省級數據處理中心邏輯架構分為采集層、存儲層和分析處理層三部分。
(1)采集層
采集層主要是構建起對應的數據采集體系。機構編制數據來源范圍廣,有法律法規、黨中央國務院文件、自身審批管理中產生的,也有通過其他政務部門共享交換來的,甚至有網絡輿情產生的,因此需要有針對性地分類建設數據采集平臺和數據采集工作機制,并采用不同的采集工具。
數據采集完畢后,將數據清洗、整合到基礎信息庫f包含結構化數據庫和NoSQL數據庫),并可利用語義標注、語義集成等方式生產主題數據庫和領域知識庫。
(2)存儲層
數據存儲分為三類:一是來源于各系統的結構化數據,二是為進行數據處理分析提供質量管理保障的標準類數據,三是非結構化數據。首先,數據處理中心以機構編制基礎信息數據庫為基礎,通過將省編辦數據信息、各地市編辦數據信息、中央編辦相關數據信息、其他省參考數據信息、省政務相關數據信息等異構數據進行數據清洗、整合后建成結構化數據庫,存儲相應的全集數據;其次,新建國家數據標準數據庫、編制數據標準數據庫、數據元數據庫,為將來進行各數據系統對接整合提供規范和保障,其中,元數據內容包括如下方面的內容:法律法規、政策文件等依據數據,改革方案、體制調整、三定等改革數據,收文、辦理、發文等業務數據,職責、權力清單、責任清單、行政審批事項、中介服務等職權數據,機構、編制、領導職數、實有人員等機構編制實名制數據,設立、變更、注銷、年度報告等事業單位法人數據,地理空間等城市基礎數據。再次,新建NoSQL數據庫,用于存儲來源于網絡、傳感器、文件等的龐大的非結構數據,并對非結構數據進行處理后形成對應的結構化數據庫。以上三類數據形成了完整的省級大數據中心數據庫,為未來進行完整的大數據分析提供基礎。
(3)分析處理層
分析處理層首先要進行數據的計算處理,對于全量數據的處理計算,可利用MapReduce、Hive等框架實現離線批處理,達到分鐘級響應的效果;對于少量數據少量數據的實時交互查詢或流式處理計算可采用Spark、HBase;而針對全量數據的全文檢索查詢,可采用的框架為Solr、lastic Search、Lucene,可以實現的查詢響應在毫秒級。
分析處理層還將設計算法模型,并采用機器學習的方式進行機構編制管理情況的預測分析,形成各類算法模型庫。
分析處理層以大數據分析工具為手段,基于關聯分析、語義分析、知識挖掘、可視化分析等大數據分析方法,實現機構編制領域的數據挖掘和分析,為業務和決策提供服務和支撐。
3.3 省級數據交換與共享平臺
省級數據交換與共享平臺是將省內各業務系統的數據進行交換共享,并與中央編辦、其他省編辦、省內其他單位、本省各地市編辦等異構數據中心進行數據交換共享的平臺。平臺將促進信息資源整合、管理資源集聚、服務資源鏈接、社會資源拓展,支撐信息資源共享交換,實現共享交換平臺的跨部門、跨地區的全覆蓋,形成業務數據全集。省級數據交換與共享平臺主要分為數據交換層和數據共享層。
(1)數據交換層
數據交換層將中央編辦中屬于本省的三定方案、權利清單等信息以及全國公共信息、本省編辦各業務系統信息、各地市編辦信息、其他省級編辦數據中心公共信息、本省內其他單位公開政務信息進行交換共享,形成跨部門、跨地區、跨行業的融合數據。數據交換層由前置交換子系統、交換橋接子系統、交換傳輸子系統、交換管理子系統構成。
(2)數據共享層
數據處理層主要對國家相關信息標準、機構編制省級中心信息標準、元數據、資源目錄、數據服務及各系統的使用角色和權限進行管理。
國家相關信息標準的管理主要是導入相關的信息化標準進行參照,機構編制省級中心信息標準的管理是在參考國家信息標準的基礎上制定出機構編制省級數據中心信息化建設的標準,為整體信息系統規劃、設計提供依據。
元數據管理根據機構編制省級中心信息標準,定義數據交換與共享平臺的元數據,根據需要有選擇地生成基礎信息數據庫結構。
資源目錄管理指對數據進行分類和編目,形成數據資源的目錄體系和交換體系,對各應用系統提供服務。針對各業務系統的技術和體系結構,配置各業務系統的數據交換映射關系,形成各業務系統的應用,也可以根據需要擴展業務應用、添加共享數據。
數據服務管理主要提供數據查詢瀏覽、為各應用系統提供數據服務接口,是數據共享層提供信息共享的核心功能,可采用SOAP(Simple Object Access Protocol,簡單對象訪問協議)作為封裝格式。
用戶角色和權限是保障數據交換與共享平臺的信息安全重要功能模塊,是保證系統正常運行的服務模塊之一,主要為需要數據服務的各業務系統設置訪問權限。
3.4 業務系統云平臺
業務系統云平臺指設計資源共建共享、統籌管理支持各業務系統的云平臺,廣義上包括中央編辦云平臺和省級云平臺兩部分。中央編辦已經建設了全國性的云平臺,提供了三定方案信息系統、權利清單管理系統、責任清單管理系統、資源共享信息系統,以及和履職監測等五大系統,本文主要研究省級云平臺建設,統籌整合省內信息系統,包括機構編制分析預警系統、機構編制實名制管理系統、電子編制證系統、機構編制統計上報系統、機構數據交換系統、辦公自動化系統、機構編制網上培訓系統、機構編制網站群系統和機構編制移動輔助決策系統以及未來建設的應用系統,實現云平臺基礎設施共建共享,支撐機構編制云服務業務的順利開展。省級業務系統云平臺主要由IaaS服務層、PaaS服務層和SaaS服務層構成。
(1) IaaS服務層
IaaS服務層稱為基礎設施即服務,主要包括虛擬化平臺和云管理平臺兩部分,底層的虛擬化平臺包括計算資源虛擬化、存儲資源虛擬化、容器虛擬化和網絡資源虛擬化等,計算資源采用KVM和Open Stack實現虛擬化,基于分布式存儲構建存儲資源池,容器虛擬化支撐業務應用的快速部署和構建,網絡資源虛擬化利用SDN技術實現。上層的云管理平臺包括多中心管理、系統遷移與托管、容災備份、計算資源管理、存儲資源管理、網絡資源管理、自服務管理和用戶權限管理等,基于策略管理實現資源調度和遷移能力,通過運維平臺的智能調度算法,為平臺提供全面的數據監控服務,采用同城雙中心和異地災備中心的容災模式,解決業務系統和數據中心的容災備份問題,實現信息系統的快速遷移及故障恢復,保障業務的高效穩定開展,云管理平臺是基于底層的虛擬化平臺層實現資源的全周期管理,虛擬化平臺為其提供計算、存儲、網絡、容器等服務。
(2) PaaS服務層
PaaS服務層稱為平臺即服務,采用微服務架構構建PaaS層平臺,各項服務均支持彈性擴展和獨立部署。采用MPP數據倉庫、分布式列組數據庫、分布式文件存儲系統等對數據進行分布式存儲;基于實時分析、消息隊列、批量計算、圖計算和流處理等技術進行數據的分析和計算,通過運維平臺實現資源的統一調度;提供深度學習和機器學習模型,支撐語音識別、圖像識別、人臉識別、視頻目標跟蹤等人工智能應用;提供關系型數據庫遷移上云服務,支撐已有信息系統數據庫向云服務遷移;提供數據同步、數據訪問、數據遷移等服務。
(3) SaaS服務層
SaaS服務層稱為軟件即服務,主要包括的軟件為機構編制分析預警系統、機構編制實名制管理系統等系統,依托IaaS層提供的自動擴容技術和虛擬資源服務,實現業務系統資源的動態擴展,通過在線備份和恢復功能實現應用級的高可用,通過PaaS層的分布式存儲服務實現應用級的云存儲,提供數據到云端的遷移。采用防火墻、監控報警裝置、加密和病毒防護等多種方式和手段,從數據安全、網絡安全和物理安全等方面進行全面安全防范;針對虛擬機安全、虛擬機存儲安全、虛擬機鏡像安全等虛擬化存在的安全威脅進行多層次防護。
3.5 大數據應用平臺
我國各行業大數據中心發展勢頭迅猛,但大部分數據中心的實際應用滯后于物理設施建設,造成了資源浪費,且承載的信息資源碎片化、割據化,對國家及各省的數據服務意義尚未完全發揮。因此,省編辦省級一體化大數據中心從建設之初即應注重數據應用的建設。大數據應用平臺是指對省級數據處理中心的數據進行深入挖掘、分析,設計應用模型,最終面向各類用戶提供多維度、可視化數據服務的平臺。
大數據應用平臺是以數據處理中心為基礎,面向省編辦、地市編辦、企業、其他政務部門和公眾提供數據服務的平臺,通過編制大數據的分析應用,例如對政府職能、權責事項、辦事流程、審批要件等數據等的綜合分析,助力“放管服”改革,挖掘分析職能交叉或缺位、流程不合理等問題,提高政府治理能力和履職能力,為各級編辦領導提供決策支持,為公眾提供透明性信息。
大數據應用平臺主要由統一身份認證平臺、統一信息門戶平臺、應用服務平臺構成。
(1)統一身份認證平臺
統一身份認證平臺主要是構建面向省編制辦、中央編辦、地市編辦的用戶管理、認證和權限管理中心,實現各類用戶的統一集中管理,通過統一身份管理、統一認證管理、統一授權管理和單點登錄等功能確保該平臺用戶信息的準確性和權威性。
(2)統一信息門戶平臺
統一信息門戶平臺將省編辦內分散、異構的應用和信息資源進行聚合,通過統一的訪問入口,實現各應用系統的無縫接入和集成,提供一個支持信息訪問、傳遞、協作的集成化環境,實現個性化業務應用的高效開發、集成、部署與管理。統一信息門戶平臺以各類應用為基礎,通過WEB訪問的方式向用戶展現整合后的各類機構編制應用信息,并根據用戶身份和角色,為用戶量身定做信息訪問的安全通道、進行事務處理的個性化應用界面,為領導決策提供查詢分析、數據挖掘展示。
(3)業務應用平臺
業務應用平臺的數據源是以信息化標準為依據,將分散在各應用系統、采用不同規范編碼的數據通過一系列工具進行處理后儲存到數據處理中心的全集數據。業務應用平臺在數據源的基礎上,打破業務數據邊界、整合業務流程,為現有業務系統和用戶提供全面的數據資源和多樣化綜合性的應用服務。
4 結束語
隨著大數據技術的日漸成熟,利用大數據向用戶提供更為多樣化、個性化、智能化的應用服務將成為未來的發展趨勢,基于大數據的數據中心也將成為支撐機構編制發展的重要支撐平臺,以大數據中心為依托的全面融合的數據資源、多元智能的數據服務、規范精準的數據內容,將會不斷推動機構編制工作邁向新臺階。
參考文獻:
[1]汪疆平.政務大數據平臺的技術架構和示范應用[J].教育信息技術,2017(22):100-103.
[2]賈一葦.全國一體化國家大數據中心體系研究[J].電子政務,2017(6):31-36.
[3]閆冬冬,肖俊,關欣,等.機構編制管理大數據應用及關鍵技術研究[J].電子政務,2018(2):97-105.
[4]周鳴.廣西云計算大數據應用平臺構建研究[J].中國管理信息化,2018,21(14):130-132.
[5]何錫點,馬桂勤,基于云平臺的數據中心改造架構設計及關鍵技術[J].網絡安全技術與應用,2018(12):73-75.
[6]蓋宇飛.新疆維吾爾自治區政務大數據的采集與共享問題研究[D].新疆大學,2019.
[7]程琛.內蒙古機構編制部門電子政務建設研究[D].內蒙古大學,2019.
[8]何錫點,馬桂勤.基于云平臺的數據中心改造架構設計及關鍵技術[J].網絡安全技術與應用,2018(12):73-75.