張曉瑜 張桂芳 徐進杰 張甜甜

摘 要:本文分析了食品安全風險預警機制中存在的食品安全數據庫分散、結構不一致、評估模式實時性欠缺等關鍵問題。在介紹相關研究的基礎上,提出大數據背景下食品安全風險預警機制的構建思路,通過現有專家評估結果對BP(Back Propagation Network)神經網絡進行訓練和評價等,期望在現有條件下形成具備可操作性、面向大數據的食品安全風險預警機制。
關鍵詞:食品安全;預警機制;大數據;機器學習
Abstract:This paper analyzes the key problems in the early warning mechanism of food safety risks, such as scattered food safety database, inconsistent structure, and lack of real-time evaluation mode and soon. Based on the introduction of relevant research, this paper put forward the construction idea of food safety risk early warning mechanism under the background of big data, trains and evaluates the BP (Back Propagation Network) neural network through the results of existing experts, etc. It expects to be able to form an early warning mechanism of food safety risk for big data that is operational under existing conditions.
Key words:Food safety; Early warning mechanism; Big data; Machine learning
中圖分類號:TS201.6
食品安全風險預警是一種預防性的食品安全保障措施,針對可能出現的食品安全問題做出預先警告,對可能出現的對人體健康產生危害的相關因素進行監測、追蹤、分析,形成有效的監控機制,進而對食品安全問題進行有效控制[1]。建立健全食品安全風險預警機制,及時發布與食品安全相關的預警信息,加強政府對重大食品安全危機事件的預防和應急處置,可大大降低食品安全事故的發生率,有效減少其可能造成的損失。
黨的十九大報告提出,推動互聯網、大數據、人工智能和實體經濟的深度融合。據不完全統計,已有12個省(直轄市)設立了省級的大數據管理機構。《2019中國大數據產業發展白皮書》中提出,政府大數據從數據資產管理走向大監管大服務,從趨勢上看,未來政府的大數據應用將逐步向大監管大服務方向邁進,以實現更精準高效的監管和更便捷深入的服務。隨著5G、人工智能和大數據等信息技術在食品生產、流通與銷售領域的普遍應用,利用新方法、新技術來開展食品安全預警體系建設顯得十分必要。
本文從大數據背景的角度分析當前食品安全監測預警體系存在的問題,提出相應的完善措施,并針對如何建立人工神經網絡食品安全風險預警決策中心進行探討。
1 建立食品安全統一編碼數據庫
1.1 食品安全數據庫存在的問題
近年來,我國食品信息化已形成多個食品分類體系,如全國食品污染物監測網絡的食品分類、中國居民營養與健康狀況調查中的食品分類、農產品分類與代碼、總膳食研究中的食品分類等,各種分類系統相互交叉、編碼不一致造成嚴重的“信息孤島”問題。這種現狀引發的最大的問題是無法對各系統之間的數據進行挖掘、整合、分析和綜合利用。因此,食品安全分類編碼不一致是當前數據融合共享難以實現的重大難題,而打通部門間數據庫的壁壘,保證數據有效匯總,建立一套完善的符合食品及相關因素全覆蓋的編碼系統勢在必行。
1.2 統一食品安全編碼的設計及應用
對食品進行編碼是對食品數據認識和邏輯統一,對食品屬性的統一編碼有利于機器進行數據處理和分析。劉楊等[2]提出基于食品健康鏈的大數據智能編碼系統設計,這套系統依據現有食品信息系統,編寫數據字典,以大數據為導向,對食品數據進行解碼和統一編碼,構建全面可溯源的編碼,以實現整合食品相關數據形成大數據庫的目標。采用的這種面向大數據的編碼方式是數據標準化和數據決策分析的必要步驟。
食品安全數據編碼標準推廣初期,可考慮采用柔性智能編碼對接等技術對我國已建立的多類系統進行對接、匯總形成統一的食品安全編碼數據庫。通過試運行對編碼系統進行多方位驗證,降低試錯成本。
2 建立食品安全風險預警決策中心
2.1 食品安全預警現狀
食品安全風險的評價中指標數量多,各種指標關聯著不同的有害因素,差異性大。目前,現行的評價方式往往只能評價部分指標,導致評價存在一定的主觀性。鑒于食品安全評價體系的復雜性,僅對指標是否合格進行統計分析是不夠的。合格區的數據常因指標合格被忽略,而食品安全預警信息可以從合格的數據中評估出來。目前,現行的食品安全風險評估模式主要采用食品安全委員會進行專家評審的方式,結果準確但評估的數據量和評估速度局限。有部分風險預警系統雖然能夠利用已有規則預測未來應該監督抽檢的重點,但僅對局部數據進行簡單挖掘,難以形成全面的食品安全風險預警機制[3]。
2.2 機器學習技術在食品安全預警中應用情況
隨著人工智能技術的發展,機器學習等技術可從大量數據中自動分析提取規律,并利用這些規律對未知數據進行計算和預測。隨著我國食品安全風險監測數據量的增加,BP(Back Propagation Network)神經網絡、貝葉斯網絡和決策樹等機器學習算法已被用于風險評估領域計算。其中,貝葉斯網絡一般模式為利用先驗信息和總體分布信息加上樣本信息計算出后驗分布信息,計算過程可以加入專家經驗和判斷信息。貝葉斯網絡已被應用于食品供應鏈污染暴露預測,可通過計算概率的方式得到風險值。決策樹分析法是一種以風險分析為依據,用樹狀邏輯方式解決問題的工具。決策樹目前被應用于農產品的安全評估及食品安全情況分析等領域,方法的可行性得到驗證。但由于其簡化分點復雜邏輯的特性,使得其產生錯誤的可能也變大,同時會產生數據噪音。BP神經網絡對生物學中神經元互聯形成的復雜網絡進行模擬,研究者使用BP神經網絡成功進行食品質量預警、食品攝入量預警及食品監督抽檢合格率預測。BP神經網絡有復雜的模式分類能力及多維函數映射能力,具備容錯、自學習和自適應特點[4]。
食品安全風險數據具有高度復雜的特性,貝葉斯網絡由于依賴于概率計算,屬性復雜的組合會使算法復雜度增加,預測難度加大。決策樹分析法建立于深度搜索之上,不能很好的分析缺項數據。BP神經網絡基于感知器的設計,使其對不確定問題具備高度解決能力,隨著數據量的增加和訓練,其預測會越來越精準。BP神經網絡可克服目前其他機器學習技術在食品安全預警應用中存在的不足,適合應用于食品安全風險預警領域。
3 基于BP神經網絡食品安全風險預警機制的建立
大數據新形勢下的食品安全風險預警決策中心應具備對檢測數據進行實時分析和預警的能力。食品安全風險預警機制模型可分為數據級、特征級、決策級,見圖1。數據級現階段可由食品安全主管部門協同相關部門開放食品相關數據庫權限,由柔性智能編碼系統在不改變現有數據庫結構和正常使用的前提下,將數據自動化實時輸出到特征級,特征級按照食品安全智能編碼組成關系型數據庫,并進行數據清洗。決策級建立初期由風險評估專家對數據庫數據進行評估,利用評估結果對BP神經網絡進行訓練,訓練數據達標后,利用BP神經網絡對數據進行決策,組織專家對決策結果再次評估,待評估合格后可上線運行。運行過程中,由專家確認BP神經網絡決策結果,如出現偏差,由糾正后的數據繼續訓練神經網絡,確保決策系統迭代更新,滿足不斷變化發展食品安全新形勢[5]。
4 結語
本文通過分析大數據背景下構建食品安全風險預警機制存在的主要問題,如數據庫不統一、專家分析模式實時性欠缺、處理數據量小等,結合國內外近期關于構建食品安全風險預警機制的相關研究,提出基于智能編碼技術柔性對接技術及BP神經網絡等先進數據處理手段的預警機制。本模型僅需要食品相關部門開放現有數據庫便可自動匯總形成統一數據庫,建立地方大數據庫,且預警系統可操作性強,該機制對接現有專家評估模式的同時,使用專家評估結果對BP神經網絡進行訓練,隨著BP神經網絡的成長,專家評估結果可對BP神經網絡進行不間斷評估、評價和迭代更新。最終該機制將滿足或者超越現有風險預警的期望,對食品安全預警、評估、監管工作起到較大的輔助作用。
參考文獻:
[1]安 瑩.我國地方食品安全預警體系構建要點研究——以蘇北地區為例[J].食品安全導刊,2015(24):19-20.
[2]劉 楊,馬 東,肖革新.基于食品健康鏈的大數據智能編碼系統設計[J].中國衛生信息管理雜志,2018,15(5):575-578.
[3]陳夏威,王博遠,岑應健,等.基于機器學習的食品安全風險預警研究現狀與展望[J].醫學信息學雜志,2019,40(3):56-61.
[4]Wang Y J,Yang B, Luo Y,et al.The application of big data mining in risk warning for food safety[J].Asian Agricultural Research,2015,7(8):83-86.
[5]李宗亮.基于大數據挖掘的食品安全風險預警系統研究[D].長沙:湖南大學,2016.