文/郭承湘 吳帥 陳寧江
各食品監管部門在政務信息化工程的引領下,基于各部門的監管職能,建設了很多業務系統,這些業務系統使食品監管部門大幅度提升了監管效率,同時也積累了大量、類型多樣的食品監管大數據。這些數據只有很少一部分被開發利用,應用方向主要有監管業務執行歷史情況追溯[1-2]、建設決策系統或數據統計分析系統。如何利用大數據技術挖掘食品監管數據,解決食品監管數據的分析問題,開展食品安全監管監測預警工作[3],是食品監管部門面臨的巨大挑戰。
余學軍[4]提出利用大數據技術,實現食品數據的自動處理分析和食品安全信息共享數據庫的智能化處理,形成智慧食品安全管理系統。章德賓等[5]構建基于BP神經網絡的食品安全預警模型,能夠有效識別、記憶、預測食品安全日常監測數據中的危險特征。陳愷[6]利用改進關聯規則-改進摘權AHP-BP神經網絡對食品抽檢數據進行重金屬污染等預測。郭承湘[7]等利用關聯規則算法Apriori挖掘投訴舉報數據監察投訴熱點問題和熱點地區。這些食品監管數據挖掘研究主要針對特定的食品監察專題數據,沒有對多源的食品監管數據進行數據挖掘。食品監管數據包括日常監管、抽檢監測、投訴舉報、執法辦案、輿情監測、食源性疾病監測等專題數據,具有數據的多源性和多維度性。因此,跳出單一思維模式,基于多源食品監管數據,利用多維數據分析挖掘食品監管數據,是本文的研究重點。
本文基于行政審批、日常監管、投訴舉報、食品安全抽檢和稽查辦案等食品監管專題數據,從食品案底企業分析、食品稽查辦案案件趨勢分析、食品安全抽檢專項分析、食品安全日常監管分析等多個方面,探討了多維數據分析在食品監管中的應用價值,構建了多種多維數據分析模型,并構建了原型系統。

表1:“案底企業辦理許可”分析
多維數據分析模型一般是建立在數據倉庫之上的。數據倉庫是用來分析數據并且從現有數據中發現新的價值,主要用于預測未來的情況。數據倉庫必須集中于某一問題領域。加入倉庫中的數據經過了數據凈化、數據準確性檢查的過程,數據倉庫中的數據本身是穩定增長的,具有低復雜性和強讀取性。數據倉庫的數據主要采用多維數據分析模型方式設計數據庫。多維數據模型是為了滿足用戶從多角度多層次進行數據查詢和分析的需要而建立起來的基于事實和維度的數據庫模型。多維數據分析可實現數據展示、查詢和獲取。同時,通過數據倉庫可以根據不同的數據需求建立起各類多維數據模型,并組成數據集市開放給不同的用戶群體使用,也就是根據需求定制的各類數據商品擺放在數據集市中供不同的數據消費者應用[8]。
多維數據分析已經應用在價格監測、城市出行等領域,具有較強的監管應用價值。王世春[9]等構建商品價格多維數據分析模型計算商品生產、批發等環節價格指數,預測現貨價格后期趨勢并進行分析預警。蔡正義[10]建立基于多維數據分析模型的出行非負張量分解模型,對多維出行信息進行模式識別,揭示出行的時空模式,提出考慮居民出行OD的公交服務評價指標和路網在運車輛估計方法。
以行政審批、日常監管、投訴舉報、食品安全抽檢和稽查辦案等食品監管專題數據為研究對象,建立多維分析模型,探討數據分析為部門在食品監管業務開展中的作用,研究的架構圖如圖1所示。

圖1:面向食品監管應用的多維數據分析架構

圖2:“案底企業辦理許可”多維數據分析模型

圖3:“案件趨勢分析”多維數據分析模型
基于地域、案底類型、時間、單位、許可辦理等維度,構建“案底企業辦理許可”多維數據分析模型如圖2所示。
“案底企業辦理許可”多維數據分析模型進行各類案底企業進行行政審批事項辦理的進程分析,監察食品企業的市場準入。
基于案件來源、案件緣由、時間、單位、地域等維度,構建“案件趨勢分析”多維數據分析模型,模型如圖3所示。
“案件趨勢分析”多維數據分析模型計算出未取得許可證從事生產經營案件的高發時段,對行政審批辦事窗口、監管部門工作成員的工作負荷起到一個風險監測、主動預防的作用。
基于檢驗目的、食品類別、檢驗項目、時間、抽檢環節、地域等維度,構建“抽檢專項分析”多維數據分析模型,模型如圖4所示。
“抽檢專項分析”多維數據分析模型既可實現對不合格食品的溯源,也可利用歷史檢查分析預測食品安全。
基于企業類型、檢查類型、檢查模板、時間、單位、地域等維度,構建“日常監管分析”多維數據分析模型,模型如圖5所示。
“日常監管分析”多維數據分析模型分析檢查模板使用頻率,為制定監管計劃提供輔助決策;同時,提供食品日常監管多維報表,為監管部門的精細化監管、主動防控決策、統計決策提供數據支撐。
本文實現了多維數據分析在食品監管中的應用模型的驗證原型。系統使用Mondrian多維數據分析引擎,采用Echarts圖表作為數據展現工具,可視化展示個模型的分析結果,包括案底企業分析、案件趨勢分析、抽檢專項分析、日常監管分析、投訴舉報分析、企業畫像等模塊。系統的主界面如圖6所示。
利用“案底企業辦理許可”多維數據分析模型,對從2016年1月至2018年12月3年的廣西食品藥品行政審批和稽查辦案數據進行分析,如表1所示。
監管部門可快速掌握監察結果:2017年有10家案底企業完成了行政審批事項辦理,如圖7所示;系統應用后,沒有存在吊銷許可證等案底企業辦結行政審批事項。

圖4:“抽檢專項分析”多維數據分析模型

圖5:“日常監管分析”多維數據分析模型

圖6:系統主界面
企業畫像是綜合各多維數據分析模型,利用企業名稱、行業、類型、是否存在案底、是否存在檢查違規、是否存在抽檢不合格以及是否有被投訴歷史情況等條件,對企業精確畫像。同時,描繪企業生命線,展示企業從注冊到當前在食藥監監管過程中的每一次監管情況,如圖8所示。從而實現對企業的全生命周期的監管概覽,監管部門即可制定重點監管單位名錄以及為其”對癥下藥”。
多維數據分析在食品監管中具有多方面的應用價值,可建立多種分析主題,對食品監管數據進行深度挖掘,為食品監管部門提供多維度的監察和預防,提供食品監察決策依據,加快食品大數據分析平臺建設,促進實現智慧食品監管。下一步,我們將進行基于深度學習的食品監管預警研究,實時監測食品安全,讓食品安全紅線主動響起警報,防范于未然,保障人民的食品安全。

圖7:2017年存在案底企業申請許可辦結情況

圖8:企業畫像