陳大海 仝姍
隨著商事制度改革及市場監管機構整合,市場監管信息化建設面臨系統和數據分散、數據共享難、業務協同不足的現象,需要借助大數據的技術手段構建統一的市場監管大數據中心,打破“數據壁壘”,實現數據的共享互通,充分挖掘數據的價值,發揮數據資產在市場監管業務中的作用,為實現市場監管業務決策的科學性、精準性提供有效的數據支撐,最終實現智慧監管。
隨著國家商事制度改革以及市場監管機構整合的逐步推進,當前市場監管涵蓋了原工商、質監、食品藥品、知識產權、反壟斷等部門的業務工作。同時為了響應國家“深化簡政放權、創新監管方式、優化政務服務”,創新政務服務模式,“只進一扇門”、“最多跑一次”、“不見面審批”等改革措施,深化“放管服”改革、優化營商環境、便利企業和群眾辦事創業。市場監工作普遍面臨監管事項增多、數據標準不一致、數據共享不暢、業務協同不足等問題,原有各監管部門獨立運行的信息化系統已經不能滿足市場監管新形勢的需求,急需打破部門間信息壁壘,實現數據整合和共享利用,體現數據價值,通過運用大數據等技術對數據進行分析處理,大幅度提高市場監管服務能力。
依托市場監管大數據中心建設,實現市場主體、客體和行為數據的匯聚整合,形成基礎信息庫、核心業務的主題信息庫和專題信息庫,實現數據對內對外的共享服務,實現業務協同、風險預警,逐步實現智慧市場監管。
大數據技術已經在電商、電信、政務服務等行業得到廣泛應用,建設了相應行業的大數據平臺,主要完成結構化和非結構化的多源數據采集、整合、存儲、分析以及可視化等功能。大數據平臺相較于傳統的數據平臺,其最大的優勢是實時流計算引擎、非關系型數據存儲、大數據挖掘分析計算和全文檢索等方面的處理速度和效率大大提升,支持PB級別大規模數據處理能力。
隨著我經濟社會快速發展,市場主體的高速增長,監管形勢嚴峻,尤其與人民群眾戚戚相關的食品和藥品安全、特種設備安全、信用風險、網絡交易監管等,面臨監管流程復雜、監管數據分散、監管人員有限等困難,急需借助大數據等技術手段實現科學決策和精準監管,最終實現智慧市場監管目標。
原市場監管信息化系統相互獨立,部署于不同網絡,建設時期和建設部門不一,造成現有應用系統煙囪林立,相互之間數據和業務協同難,“數據孤島”現象嚴重。由于機構改革,監管責任劇增,現有系統已經無法滿足新形勢下各級部門業務協同需求,迫切需要在統一規劃、統一標準的基礎上,整合數據資源、整合和新建業務系統;借助于大數據技術手段,建設大數據中心,解決數據資源統一歸集,實現數據跨部門、跨區域的共享交換,同時提高數據質量,發揮數據價值,利用大數據分析等技術手段實現監管決策的科學化、精準化。
下面以某省市場監管為例,介紹其大數據中心建設。
截止2019年上半年,全省市場主體總數已經超過9000萬戶,以及深入推進“放管服”、加強事中事后監管的要求,全省市場監管壓力劇增,尤其是基層市場監管人員普遍編碼監管任務重的情況。雖然已經建設了很多信息化系統,如全省市場主體登記注冊系統、“明廚亮灶”工程、食品藥品監管系統、電梯應急救援平臺等,涵蓋了市場準入、監督檢查、行政執法、網絡監管等業務,但是依然面臨數據資源分散、數據共享難、數據利用效率低的問題,急需建設全省一體化平臺,打通全省市場監管機構間數據壁壘,實現全省數據資源共享互通,全面提升市場監管效率。

市場監管大數據中心主要有數據資源庫、數據處理系統組成,其中數據資源庫包括:數據歸集庫(包括業務數據庫、部門數據庫、互聯網數據庫)、數據倉庫(數據融合庫、基礎信息庫、主題信息庫和專題信息庫),數據處理系統有數據歸集管理系統、數據治理系統、數據共享交換系統以及統一數據資源目錄管理系統等組成。如圖1所示。
按照數據處理流程,大數據中心由數據源、數據處理、數據服務三大塊組成。數據源即產生原始數據的源頭系統或數據中心;通過數據歸集過程,按照業務和數據來源的不同,歸集到業務數據庫(內網業務系統數據)、部門數據庫(內網和政務外網部門間共享的數據)和互聯網數據庫(來源于第三方互聯平臺的數據),然后經過數據標準化和數據質量治理過程進入數據融合庫,再根據數據服務和應用的需要整合為基礎信息庫、主題信息庫和專題信息庫;大數據中心數據通過數據共享交換系統對外提供數據服務,對于敏感數據可以通過數據脫敏操作,對于需要實時應用的數據需求通過大數據中心提供接口的形式對外提供服務。
市場監管大數據應用的重難點主要有:多源數據的歸集融合,大數據量存儲,數據共享服務,數據挖掘分析。現有全省業務系統建設分散,網絡不統一,系統架構和開發語言不統一,且當前還不能影響現有系統的業務操作,要求將多種來源的業務系統數據進行歸集,形成全省統一的數據中心,在數據歸集過程中必須充分考慮現有系統架構,采用對系統影響最小的數據歸集方式。歸集到大數據中心的數據包括結構化、半結構化和非結構化數據,需要根據數據格式,對半結構化數據進行結構化轉換,結構化數據要進行統一數據標準等數據治理工作,既要滿足結構化數據存儲使用,又要滿足非結構化數據的存儲使用,必須采用大數據存儲架構。大數據中心數據,對內為市場監管各級業務系統提供數據共享服務,對外為政府部門提供數據共享服務,同時對社會公眾進行數據開放服務。大數據中心建設的最大價值是匯聚了全省市場監管業務數據,進行數據挖掘分析,為市場監管決策提供科學的、有效的數據支撐,為市場主體經營、食品藥品安全、特種設備使用安全等,通過大數據分析進行風險預警,做到風險早發現、問題早處理。
根據市場監管信息化建設的實際情況,市場監管的大數據建設可以分為三個階段,逐步推進。第一階段:實現數據融合,歸集業務系統核心數據資源;第二階段:實現大數據監管,以大數據中心為支撐,運用大數據、云計算等技術手段,實現智慧服務、精準監管、科學決策和大數據展示;第三階段:實現智慧監管,完善數據資源采集渠道,開展視頻、圖像、物聯網等數據的分析應用,利用機器學習、人工智能等新技術,圍繞市場行為,分析市場主體、客體相關性,形成對市場監管業務的合理化建議,輔助決策。
本文以某省市場監管大數據中心建設為例,闡述大數據中心的主要組成部分、數據處理流程,以及大數據中心建設的推進階段建議。總之,大數據是當前信息化技術中比較成熟且應用廣泛的一種技術,大數據中心是解決多源數據資源歸集、整合處理、數據服務的一種有效手段,在當前市場監管信息化建設過程中,可以打破數據壁壘,實現數據互聯互通,可為新建業務系統提供數據支撐,為實現有效監管、精準監管以及智慧監管提供有效支撐。
作者單位:中通服咨詢設計研究院有限公司 智能技術工程院