文/林海
我國十三五規劃指出:要實施國家大數據戰略,把大數據作為基礎性戰略資源,全面實施促進大數據發展行動,加快推動數據資源共享開放和開發應用,助力產業轉型升級和社會治理創新。2015年8月,國務院印發了《促進大數據發展行動綱要》,指出目前我國在大數據發展和應用方面已具備一定基礎,擁有市場優勢和發展潛力,但也存在政府數據開放共享不足、產業基礎薄弱、缺乏頂層設計和統籌規劃、法律法規建設滯后、創新應用領域不廣等問題,亟待解決。
合肥市作為中部快速發展的省會城市,積極響應國家大數據戰略部署:2016年,出臺《合肥市大數據發展行動綱要(2016-2020)》。2017年組建合肥市數據資源局,全面統籌全市信息化、電子政務、智慧城市、大數據、“互聯網+”等工作職能,加快推進政務、民生、產業領域各類數據資源的深度開發利用與開放共享,力爭全面提升合肥市的政府治理和公共服務能力,支撐城市實現新一輪跨越發展。該局成立以后,正式啟動建設市級政務大數據平臺項目建設,以數據集中和共享為途徑,充分應用數據治理的方法和工具,建設市級一體化的大數據中心,推進技術融合、業務融合、數據融合,實現跨層級、跨地域、跨系統、跨部門、跨業務的協同管理和服務。
近年來,合肥市大力推進信息化建設,信息系統建設與應用能力顯著增強。目前市級各委辦局業務系統種類較多,通過各類信息系統的應用推廣,極大提升了政府工作效能。特別是市數據資源局的成立,對各單位電子政務業務系統建設實行統籌管理,極大推進了信息化建設。但由于我市在政務數據資源整合方面長期以來缺乏頂層設計,各單位信息化系統繁多且離散、數據交換與共享標準不一的短板,政務數據無法通過共享交換整合成為數據資源,無法支撐大數據的應用,因此,市數據資源局在成立伊始,便開始積極謀劃和推進市級政府大數據平臺項目的建設工作。
合肥市政務大數據平臺項目主要任務是搭建合肥市數據資源的核心樞紐,有效匯集、按需共享全市各部門數據信息,支撐數字政務和智慧城市建設的各項工作,具體工作任務包括:
建成全市政務信息共享交換系統,該系統具備全市政務數據全量接入能力,保證各單位業務系統均可通過該平臺進行數據匯集、交換,逐步取代各單位間獨自建設的數據交換系統;首批要求實現60家市直單位業務系統政務數據的匯集、共享與交換。

圖1:數據組織模型
制定全市標準政務信息資源目錄,為政務數據共享及治理提供規范依據;制定政務數據的交換、共享開放等相關制度和技術規范體系;研究大數據平臺數據治理的方法和規范,提高數據質量。
(1)建成覆蓋電子政務網及互聯網的統一身份認證體系。建成基于自然人身份認證號以及法人的統一社會信用代碼的為民辦事的線上線下互認的統一身份認證中心;建成基于公務人員的統一的面向電子政務的身份認證中心。
(2)實現“互聯網+政務服務”有關“一網通辦、多點互聯”的政策要求,對覆蓋全市1407項為民辦事項(主要為市級權力清單項)的3個信息化系統(合肥市政務服務中心行政審批平臺、合肥市社會服務管理信息化平臺、合肥市政府權力清單運行平臺)進行統一身份認證改造。
(3)實現一個身份對應一個賬號,一次授權、一次登錄漫游所有業務系統的“一點登錄、多系統漫游”需求,對新建的信息化系統要求全面支持統一身份認證。
(4)統籌全市政務系統CA證書互認體系,解決當前政務信息化系統CA證書各自分發,重復混亂的情況,實現一人一證,全市通行。
(1)搭建全市統一的政務數據開放平臺,管理各類數據資源服務,向社會公眾提供政務數據資源。
(2)搭建一個基于大數據和人工智能核心技術的大數據開發平臺,面向社會公眾提供數據分析工具集,推動我市大數據應用創新生態圈和產業的發展。
(3)構建數個大數據應用示范,惠及政府、行業、社會、百姓。
(1)按照國家信息系統安全等級保護的要求,結合合肥市政務大數據平臺實際業務需求,構建多層次數據保護方式,從業務信息、系統服務、數據保護等方面構建大數據平臺安全保障體系。
(2)構建數據從獲取、傳輸、存儲、處理、應用、銷毀的全生命周期的安全保障,形成對業務系統及數據完整的保護,實現合肥市大數據平臺“可防、可視、可控”的安全目標。
(3)通過對大數據平臺的安全風險分析,結合身份認證、訪問控制、日志分析等措施,建立健全的安全審計制度、安全識別和安全保障體系。
概括來說,合肥市政務大數據平臺項目建設內容要完成大數據平臺基礎架構搭建,內容可概括為“一個政務共享數據中心、二套體系、五個平臺,最終實現合肥市政務數據共享與開放的零距離”,具體包括:
(1)建設市級統一的政務共享數據中心,主要包括:建設匯集各單位業務系統數據的數據原始庫;建設全市統一的經數據加工后可形成多主題的數據成品庫;并構建人口庫、法人庫、電子證照庫等主題應用庫的支撐能力。
(2)建設二套標準規范體系:
一套大數據標準規范體系,主要包括:政務信息資源目錄及公開信息資源目錄,數據共享開放接口技術規范,政務信息資源目錄編制指南,政務信息資源共享管理辦法,政務信息資源審計和安全監督制度等各種制度及規范。
一套安全保障體系,主要包括:網絡安全防護體系,內部安全防護體系,身份認證和訪問控制體系,安全分析審計體系。
(3)建設五個平臺,包括:基于云架構的全市統一非涉密政務信息共享交換平臺,用于實現全市各政府單位數據的匯集、共享與交換工作;用于實現“一數一源”,對海量數據進行轉換、清洗、脫敏數據治理平臺;用于承載全市統一的身份認證中心、政務服務總線等基礎支撐功能的基礎支撐平臺;用于提供據、接口、應用、文檔、分析報告等多種開放服務的政務數據開放平臺,構建數據開放門戶,實現信息資源目錄的開放管理;具有數據開發、數據可視化等功能的基于大數據和人工智能核心技術的大數據開發平臺,提供基于大數據和人工智能算法組件的數據處理工具集。
結合合肥市本地化數據,基于大數據平臺的數據倉庫技術,有效對數據結構進行組織,針對政務大數據的特點,在本項目中提出了4360數據組織模型,該模型的設計既考慮到政務數據的物理含義,使其所反映的物理世界在數據空間中建立起易理解、易關聯的對應關系,又針對大數據處理、人工智能并行計算的特點,使得數據組織方式能夠更有效的清晰數據關系,深度挖掘數據關聯。
如圖1所示,模型將數據劃分為原始數據、規范數據、事實數據、主題數據4個階段。原始數據提取、清洗和轉化為規范數據,并將規范后的數據按照事實邏輯進行組織,最后按照主題將數據提取形成主題庫。主題階段采用4360數據組織模型對數據組織結構進行抽象并按屬性特征將數據分門別類形成個體、團隊、事物、事件4個類別。
4360數據組織模型從多個角度展現城市大數據可以基于現有數據深度挖掘出各類有價值的主題,根據具體主題需要繼續裁剪和細化,為城市大數據方案進行指導,數據組織模型的分類說明如下:
(1)個體360,主要包括自然人身份屬性,以及自然人行為屬性。其中自然人身份屬性包括自然人的基本信息、社會面貌、社會關系、資產、行為習慣、各類偏好、政治傾向等屬性,行為屬性主要包括用戶的消費記錄、貸款記錄、上網記錄、通話記錄、出行記錄等,以及一些其他可以追蹤的行為。
(2)團體360,主要包括具有團隊身份屬性的法人組織、社團、組織等,以及團隊的人群整體行為屬性。身份屬性包括基本信息、關聯組織、注冊資金或注冊資本、企業經營范圍、企業出資人等。行為屬性包括企業生產、投融資、搬遷等。
(3)事物360,以事物為中心的全方位數據和信息。該“事物”具有泛指概念,包括所有非人類屬性的其他物理實體,如車輛、建筑、自然地理(如河流、湖泊、道路)資源等。包括民生或生活參數,所有權權屬變化,功能屬性(如建筑物的使用用途),城市管理相關信息(如建筑物的消防,衛生防疫,交通)等。如圖2所示。
(4)事件360,以事件發展過程為線索的全息信息數據。該“事件”具有泛指的概念,指所有具有時間變化特性,圍繞某一具體目標而發生的變化過程及相關信息的總和,如辦理某一行政事項,發生某一踩踏事件,出現某一刑事案件等。事件360涉及對該事件的前因后果,關聯的人、團體、事物的信息,均可進行關聯,形成全方位信息。如圖3所示。
總體來說,可以將4360數據組織模型看做對數據的矩陣描述,通過矩陣可以找到事實數據的相關維度,也可以看做是數據架構藍圖,確保數據正常在數據倉庫流轉,順利形成各種主題數據,最終發揮數據價值。
截至2018年底,共對接了近70家單位的160余個業務系統,入庫數據達1872類,125億余條,數據總量達 60TB。
截至2018年底,交換平臺建成共9個物理節點,創建邏輯節點135項,創建數據源238項,創建交換任務2587條,其中正在運行1820條,通過交換平臺共抽取數據39.2億條。在全省率先完成市級政務信息資源共享門戶與省級、國家級聯調工作,打通了合肥市與安徽省、國家資源共享的通道。合肥市各單位可通過合肥市政務信息資源共享門戶申請省平臺和國家平臺的資源,實現與省、國家級平臺資源共享與交換。
完成數據質量管理、數據規整管理、數據建模、數據安全管理、資源共享管理等核心功能建設。在數據質量監控方面,設置身份證號規則、姓名規則、統一社會信用代碼規則、日期規則等10大類校驗規則;在數據規整方面,設置大寫轉小寫規則、字符轉日期型規則、身份證號15轉18位等11類規則;在數據脫敏方面,設置替換、重排、截斷、掩碼、偏移等規則。截至2018年底,已通過數據治理平臺已治理58家單位,1703張數據庫表,共計數據量約65億條。
已完成政務數據開放平臺前臺門戶和后臺管理平臺的基礎功能建設。開放平臺門戶基于互聯網環境,按照合肥市門戶網站要求,針對大數據政務開放平臺做出整改,并接入“中國合肥”門戶網站。截至2018年12月,各單位已上報開放目錄588條,其中585條已提供數據。
已建成基于大數據和人工智能核心技術的政務大數據開發平臺。針對不同的業務場景,可以基于平臺提供的開發套件與行業服務商的能力,將多方產品集成形成行業解決方案。用戶可以申請資源目錄共享門戶的資源或者私有數據源,在開發平臺中使用可視化的工具,進行數據分析,生產數據分析結果對外提供服務。
已建成覆蓋全市范圍內所有的政府工作人員、自然人、法人,實現統一的身份認證、用戶與機構管理、權限管理及安全管理。目前統一身份認證已對接十個市級業務系統,包括:合肥市統一政務信息處理平臺、合肥市“互聯網+政務服務”系統、合肥市信用平臺、合肥市城市令管理后臺、政務大數據工單系統、社管智慧社區、社管易企網、社管易社網、社管統計分析系統、社管電子監察系統。截止2018年底,統一身份認證平臺登記人員10622條,登記單位3956個。

圖2:事物360數據組織模型

圖3:事件360數據組織模型
完成大數據用戶權限管理、政務服務總線、統一消息中心、應用審計中心、運行監控中心、電子簽章平臺六大模塊內容建設。其中政務服務總線GSB已為互聯網+提供50多個服務接口;合肥市多個項目與統一消息對接,如合肥市信息平臺、合肥市綜合服務管理平臺(合肥通)、中小學報名系統等;電子簽章平臺已用于合肥市電子證照庫建設,支撐電子證照的簽章。
根據國家“互聯網+政務服務”的政策指導、安徽省電子證照庫建設規范,建立合肥市電子證照管理平臺,并持續征集電子證照目錄、模版和印章以及推動制證數據接入,為電子證照制作做準備,以支撐互聯網+政務服務的工作。截至2018年底,已梳理市、縣級證照132類,其中113類已經開始對外提供數據;省、國家級證照65類,其中13類已經開始對外提供數據。
李克強總理在2016年5月全國推進簡政放權電視電話會議上指出:“目前我國信息數據資源80%以上掌握在各級政府部門手里,但‘深藏閨中’造成了極大浪費”。合肥市政務大數據平臺的建設,以創新、協調、開放、共享為理念,以智慧城市建設為統攬,以推進數據資源的匯聚、開放、共享為主線,充分發揮了政務大數據在公共治理和公共服務領域的巨大支撐作用,為將合肥市建設成為區域性大數據中心城市打下了堅實的基礎。