陳靜
隨著大數據的發展,政府高度重視政務大數據的發展。本文介紹了政務大數據融合分析的背景、重要性、內容及展望,探討如何發揮政務數據的價值,提供數據決策支撐能力,提升政務數據融合分析能力。
近年來,我國信息化建設步入全方位、多層次推進的新階段。跨行業、跨領域融合創新加速,前沿技術更新迭代加快,我國數字經濟增速世界第一,規模躍居全球第二。數字經濟滲透帶動各行業積極發展,數據應用程度不斷深化,政府治理能力和人民群眾獲得感顯著提升。
全面貫徹習近平新時代中國特色社會主義思想和黨的十九大精神,以推進國家治理體系和治理能力現代化為總導向,以建設網絡強國、數字中國、智慧社會為總要求,按照國家深化“互聯網+政務服務”、政務信息系統整合共享等工作部署,建設全省一體化大數據中心和“六大體系”,推進小數據思維束縛向大數據改革創新轉變,推進信息基礎設施分散建設向集約化建設轉變,推進數據多頭管理向集中統一管理轉變,推動數據共享、創新政府決策和公共服務方法路徑,推動數據開放、創新大數據綜合應用模式,推動社會參與、創新構建大數據綜合應用體系,實現技術融合、業務融合、數據融合,實現跨層級、跨地域、跨系統、跨部門、跨業務協同管理和服務,高標準打造我省“數字政府”,全面提升行政效率,全面優化政務服務。
對于政府而言,政務大數據的融合分析應用可以利用大數據技術打通原先孤立的政務信息孤島,從頂層統一規劃,統籌各方資源,建立完整、統一、無縫隙的高效服務應用體系。
第一,政務大數據融合分析應用可以改變原先政務數據被孤立的格局。通過頂層規劃設計,統一數據歸集標準,利用大數據存儲技術,可以打通各部門“數據孤島”,加快數據應用高效協同、數據服務實時獲取。推動數據資源跨層級、跨地域、跨系統、跨部門、跨業務互通共享,呈現數據共享的血緣關系,追溯數據的來源及去向,實現大數據的全聯通,全調用的掌控。
第二,政務大數據融合分析應用可以改變政務數據獨立應用的思路。在大數據時代,數據的收集與建立呈現出與傳統信息數據建立原則不同的更加開放聚合的特點,不同渠道、不同維度的信息可以通過有效的組合形成豐富完整的數據檔案,政務大數據融合分析應用可以通過綜合分析,為政府管理提供基于大數據融合應用平臺的動態決策支持,全面提升城市的智慧化運行管理和決策水平。
第三,政務大數據綜合融合分析應用可以促進政務大數據創新建模分析。充分挖掘政務大數據價值,為政務服務發展、數字政府建設提供基于大數據的實時預測監測、預警、智能分析。
第四,政務大數據融合分析應用可以創新惠民生活服務方式。根據市民生活需求,一方面為市民提供更加便捷的政務服務,另一方面,為市民提供基于大數據的衣食住行生活服務指南,全面提高服務質量與效率。
將多源異構數據源進行有效的融合應用,將不同的數據源的數據進行有效的整合,支持為政務服務領域等其他領域提供動態感知的數據監測能力和圍繞對象進行的全域數據分析服務,通過統一資源發布服務和可視化圖表及報表工具進行數據推送及可視化展示與報表生成服務,實現大數據分析協調工作,專門為政務服務評價、經濟預測、輿情分析、營商環境評估等分析決策專題提供有效的綜合分析服務。
(一)數據匯集
在進行政務大數據融合分析應用場景中,數據是最基礎的保障,需要匯聚多類數據。面向多源異構數據源進行指標與標簽的構建和融合,將不同的數據源的數據進行有效的整合,聚焦政務服務和政務治理,構建預警預測的能力,形成面向政務領域的動態感知能力。
多渠道方式進行數據匯集,包括庫表和文件的共享交換、數據填報、數據接口調用、實時數據采集、網絡搜索、文本挖掘等。在不同業務場景下,應選擇不同的歸集方式,甚至各種組合方式,以高效、安全、可靠地完成數據的歸集。
(二)數據加工
數據匯聚后需要進一步對眾多的繁冗的數據進行加工處理,例如去臟、去重、落標等工作,從中分離、提取有用的信息。數據加工需要配置各類質量規則、腳本以及業務代碼標準庫等內容來規范加工過程。政務數據的處理的一項重點工作,就是必須進行數據脫敏,脫敏數據主要是對各類隱私、敏感數據進行數據脫敏處理,以便數據集成開發、測試、聯調等工作使用,同時也為后續數據應用提供基礎。數據加工后,需要進行質量評估等方式對加工后數據進行驗證,同步做好數據溯源。
(三)數據融合
數據加工后的數據,統一納入元數據管理,建立實體數據元標準。根據不同的元數據類型,元數據差異分析、元數據版本比對、元數據ER圖展現等分析操作,并提供元數據的全文檢索。
通過數據集成,借助任務配置、流程配置、調度設置、流程監控等功能,達到數據融合。通過將可用數據進行重新組合,把不同來源、不同主題、不同數據表的數據整合到一個獨立的數據存儲區,一般不涉及復雜的數據統計或者公式計算。集成各種類型的元數據,能形成數據血緣分析、數據地圖等,可以對整個數據資源的分布和結構進行全面掌控,提供政務數據融合場景應用分析。
通過指標計算,可以進行數據深度融合,將原有數據重構生成一個新的指標類型數據,會涉及到較為復雜的計算,更多的是通過外部腳本或者函數來實現,以及跟其他專業工具,如數據挖掘工具整合實現。
通過數據抽樣分析,在統計分析中,由于受到物理空間、計算內存以及分析效率的限制,往往不能直接適用全樣本數據進行分析,這就必須采用抽樣的方法,利用樣本數據對全樣本數據進行科學的估計與推算。
數據標簽、數據倉庫
(四)分析挖掘
利用分布式存儲和并行計算框架,結合多種離線計算引擎,對各類結構化、半結構化及非結構化的信息資源進行快速的離線計算、并提供基于關聯、聚類、分類、預測等類算法庫以及數據挖掘分析。
針對需要復雜處理的數據,如機器學習,深度學習,需要基于數據挖掘分析系統進行對應處理,將數據價值最大化。以自然語言處理、數據挖掘、機器學習等算法模型為手段,能夠支撐輔助決策分析的數據分析人員及其他使用者對數據進行一系列的操作,最終實現數據分析工作人員在線交互式的大數據協同分析工作。在進行數值分析時,包括線性回歸模型、決策樹模型、系統聚類模型、邏輯回歸模型、神經網絡模型等;文本分析是自然語言處理的一部分,包括文本聚類、關鍵詞分析、文本統計、關聯分析等。
(五)融合分析應用
利用大數據技術能夠有效分析社會公眾的多維度、多層次需求,有效識別和匯總公眾的公共需求偏好,了解政府服務對象的總體特征及偏好需求,精準刻畫用戶畫像,從而有助于政府公共服務的精準決策和施策,增強公共服務的精準性和有效性。
以全省大數據中心為核心,整合數據信息資產,結合國家政策,聚焦當前政務服務和城市建設的難點,提供省級綜合指揮平臺,為各類政務服務綜合應用提供解決方案與產品,建設全省政務大數據綜合應用體系。加強橫向縱向合作,匯集相關數據,推動利用最新大數據技術,創新政府服務思路,推動數字政府發展。
結合政務領域發展現狀,針對政務大數據領域現有問題,利用大數據先進技術,探索出政務大數據的綜合應用方法路徑。通過試點應用,推廣一批典型應用、成熟應用,探索“以用興產、以產促用”良性互促發展模式。推進互聯網、大數據、人工智能和實體經濟深度融合,推動農業、工業、服務業的數字化、網絡化、智能化,做大做強數字經濟。
以數字化為抓手加速推進“放管服”改革,破除體制機制障礙,營造鼓勵創新、彈性包容的制度環境,推動經濟發展質量變革、效率變革、動力變革。積極融入“一帶一路”建設等國家戰略,深化各領域、多形式數字交流合作。完善大數據綜合應用的支持政策,制定政務大數據綜合應用相關標準,促進數據有序流動、共享、保護與應用。
全面貫徹創新、協調、綠色、開放、共享的新發展理念,推動社會力量參與、創新建設運營模式,打破信息孤島、數據壁壘,走向集約化發展道路,推進數據共享開放,開辟政務大數據綜合應用的可持續發展路徑。
第一,加強整體性規劃。按照全省“一盤棋”的思路,高位謀劃全省政務大數據綜合應用整體布局,統籌規劃構建數據共享交換體系,努力運用大數據驅動創新,構建全省政務大數據綜合應用體系。
第二,堅持體系化實施。以數據共享開放為重點,以強化綜合應用服務為核心,按照統一體系架構、統一標準規范,統籌建設、統籌管理,掛圖作戰、序時推進,邊建邊用、逐步完善,真正將全省政務大數據綜合應用做強做實,形成江蘇品牌、江蘇模式。
第三,強化數據驅動。樹立“一切皆數據”理念,著力打破部門、行業信息壁壘,推動數據共享,切實發揮數據對政府治理、經濟轉型、社會服務的支撐和驅動作用。
第四,堅持成效導向。把增進人民福祉、促進人的全面發展作為大數據綜合應用體系建設的出發點和落腳點,切實增強政府治理效能,推動數字政府建設。
第五,落實制度性保障。加強網絡接入、系統上云、數據歸集、應用服務、安全防護等方面制度建設,強化剛性約束、強調評估激勵,狠抓制度執行、促進工作落實,形成一體化發展良好局面。
作者單位:江蘇省大數據管理中心