【摘要】 目的 大數據已成為面對復雜問題時的宏觀設計和處理的重要手段,本研究擬探討在大數據時代背景下食品安全標準制定的新思路。方法 梳理大數據的概念、特點和在人群健康領域的應用,以及現行食品安全標準制定的程序和要求。結果 大數據思維是創新健康管理的重要手段,現行食品安全標準制定主要利用實驗數據和食物消費量數據,對環境因素考慮不足。結論 本文提出了大數據在食品安全標準制定中應用的新思路,在利用自然環境監測和社會環境信息的基礎上,探討構建綜合分析大數據的數學統計模型,拓展數據的使用范圍,從更深層次、更廣領域促進標準制定工作與社會公眾之間的互動,形成政府主導、公眾參與、多元化的標準制定新格局。
doi:10.3969/j.issn.1674-9316.2015.04.036
工作單位:100022國家食品安全風險評估中心; ▲通訊作者:韓宏偉Email:hanhongwei@cfsa.net.cn
Elementary Discussion on the Developing Food Safety Standards in the Age of Big Data
YAN Yan HAN Hongwei China National Center for Food Safety Risk Assessment,Beijing 100022,China
【Abstract】
Objective “Big data” has become an important tool of macro design and handling of the complex problems,this study intends to explore the new ideas for the formulation of food safety standards in the age of big data background. Methods The concept,characteristics and application of the “big data” in the public health,and the formulation of the current food safety standard procedures and requirements. Results“Big data”is an important toolin the management of public health,the formulation of current food safety standards are mainly based on experiment data and the food consumption data,not including environmental factors. Conclusion This paper puts forward the basic train of thought of developing food safety standards in the era of big data,that is,to expand the field of usage of the data,on the basis of natural environment monitoring and social informationselection,to a deeper and wider areas,andpromote the interaction between the government and the public to form the cooperative governance in food standards developing.
【Key words】Big data,Food safety standards,Food safety
隨著信息技術的迅猛發展,大數據的廣泛應用已成為當今世界的重要發展趨勢,而我國也正處在食品安全治理的重要攻堅階段,許多矛盾和問題集中出現,無一不考驗政府機構的監管能力。2014年的全國“兩會”曾提出,用最嚴謹的標準、最嚴格的監管、最嚴厲的處罰、最嚴肅的問責,確保廣大人民群眾“舌尖上的安全”。食品安全標準作為監督執法的重要依據,無疑成為食品安全工作的焦點。如何在大數據時代利用好大數據為食品安全標準的制定服務,為保障人民群眾健康服務,已成為食品安全研究領域的重要課題。
1 什么是大數據
1.1 大數據的定義
“大數據”是指大小超越傳統意義上的尺度,在一定時間內通過一般的軟件工具難以捕捉、存儲和分析的大容量數據集合,需要用先進的方法和技術實現信息的收集、存儲分配、管理和分析。大數據不是對數據規模的定量描述,而是一種在類型繁多、數量龐大的多樣化數據中進行的信息快速信息提取的技術和思維 [1]。
1.2 大數據的特征
大數據有四個顯著特征:大量化、多樣化、快速化、應用價值大。
大量化:即數據巨大,從TB級別躍升到PB級別。隨著各種隨身設備、云計算等技術的發展,人和物的所有軌跡都可以被記錄下來,數據因此被大量生產出來。人人都是數據的制造者。《科學》雜志上曾發表一篇文章,將人類所創造、存儲和傳播的一切信息數量進行追蹤計算,研究范圍涵蓋了書籍、圖畫、信件、電子郵件、照片、音樂、視頻、電話、導航等60多種模擬和數字技術。
多樣化:涵蓋了文本、音頻、圖片、視頻、模擬信號等不同類型。北京市交通智能化分析平臺的數據就是來自路網攝像頭、公交、軌道交通、出租車以及省級客運、旅游、租車等運輸行業,還有問卷調查和地理信息系統數據。多樣化的數據來源證實大數據的威力所在,也間接反映出了大數據的跨界性和關聯性。
快速化:快速化是大數據處理技術和傳統的數據挖掘技術最大的區別。大數據是一種以實時數據處理、實時結果導向為特征的解決方案,數據產生得快,處理得也快。
應用價值大:大數據應用的核心是預測,是為做決策提供科學依據。盡管大數據的價值密度低,存在不確定性,但大數據仍然包含寶貴的信息。
2 如何使用大數據
大數據為我們看待世界提供了一種全新的方法,即決策行為將日益基于數據分析做出,而不是像過去更多憑借經驗和直覺做出。如運用大數據思維探究公共衛生事件的著名案例——谷歌預測流感。研究人員發現,搜索流感相關主題的人數與實際患有流感癥狀的人數之間存在著密切的關系。當然,并非每個搜索“流感”的人都真的患有流感,但當我們將與流感有關的搜索查詢匯總到一起時,便可以找到一種模式。我們將自己統計的查詢數量與傳統流感監測系統的數據進行了對比,結果發現許多搜索查詢在流感季節確實會明顯增多。通過對這些搜索查詢的出現次數進行統計,我們便可以估測出世界上不同國家和地區的流感傳播情況。研究結果已發表在美國《自然》雜志上。通過對“咳嗽”、“發燒”等與流感有關的關鍵詞進行監測,并通過地圖將這些的關鍵詞被檢索的趨勢顯示在其所對應的地區。相應的關鍵詞密度越高、越頻繁,該地區爆發流感的可能性就越大。由于這類關鍵詞與流感之間存在著較強的相關性,因此該服務的可靠性比較高。據悉,通過谷歌的“流感趨勢”來對流感進行預測,其速度甚至要比美國疾病控制和預防中心(Centers for Disease Control and Prevention)還要快7~10天。谷歌預測流感使用了大數據思維中的相關思維、總體數據、預測思想、混雜(趨勢分析和熱點分析),準確預測了流感爆發的地區。
3 大數據思維與食品安全標準的制定
3.1 食品安全標準制定的傳統模式
隨著現代食品工業的發展,食品原料在生產加工過程中,往往會受到各種危害物質的污染,如何避免、減少或控制各種食品危害物質已成為食品安全領域研究的重要課題,如利用高溫殺滅微生物,精煉去除植物毒素,輻照延長保存期限,禁止使用高毒農藥等。這些措施專門研究食品中某種危害物質對健康造成的影響,是一種食品-健康研究模式,在已知某種危害物質存在的條件下,可以采取相應的措施,將食品中的危害物質盡可能地降低到可接受的水平,這個“水平”即食品安全標準。
以污染物標準為例,由于食品在種養殖、生產加工等過程中可能會產生或由環境帶入一些化學性危害物質,如鉛、砷、汞等。雖然這些物質并不是有意加入的,但是當其超過一定的含量時,人體受到健康威脅的風險就會增大。為了保護公眾健康,往往需要對這些污染物的含量加以限制。在制定標準的過程中,首先要了解污染物本身“毒性”的大小,然后結合食品中污染物含量和我國居民食品消費結構的實際情況,計算人群攝入該污染物的總體水平,進而采用國際通用的風險評估原則和方法進行膳食暴露評估,最終得出合適的“限值標準”,即食品中污染物的“含量”及人群對含有該污染物食品“消費量”是制定污染物限量標準的基本數據 [2],這實際上是在數據和標準之間建立了一種直接的因果關系。
3.2 食品安全標準制定的新思路
由于食品工業分工逐漸細化,食品從農田到餐桌要經過種植、養殖、加工、包裝、貯存、運輸、銷售、烹調直至食用等多個環節,城鎮生活垃圾、農藥獸藥濫用和工業三廢排放等污染源會從多個途徑對空氣、水源、土壤等自然環境造成污染,由人為非法添加甚至有預謀的恐怖主義行為均可能在任何一個環節對食品安全造成嚴重威脅,加之人群本身對危害物質的敏感和耐受程度有所差異,最終產生的危害健康的效應也會有所不同,這些因素對傳統的以終產品為監管重點的食品安全管理模式提出了嚴峻挑戰。
在新的食品安全威脅不斷出現的大背景下,作為監督執法重要依據的食品安全標準,應盡可能地從更大范圍內的自然環境和社會環境條件下探究各種污染來源對食品和人群健康的影響,即環境-健康研究模式。這種模式需要更加充分的數據信息支持,除了利用食品中污染物、致病性微生物、食源性疾病等食品安全監測網數據外 [3],還需要綜合分析利用大氣、土壤、水體等自然環境監測數據、食品原料、生產設備、有關化學物質的物流信息、出入境貿易信息等,如海洋洋流變化帶來的水體污染、核泄露導致的農作物變異等,凡有可能對人群的疾病或健康狀態帶來影響的,均應納入考慮范圍之內。將這些數據與過去的基線數據結合考慮,形成長期連續的數據鏈和數據網,找出數據變化和人群疾病或健康狀態變化的相關關系,這將為食品安全標準科學制定提供強有力的數據支持。
此外,如果將這些大數據與網絡、微信、微博等新媒體的深度融合,還可以突破時間和空間的限制,從更深層次、更廣領域促進標準制定過程與社會公眾之間的互動,如對搜索、社交網絡、網絡新聞中標準的關鍵詞分析,掌握全國公眾的滿意程度,全面感知社會的多維度需求,發現需求熱點,預測工作重點,由此形成政府主導、公眾參與、多元化的標準制定新格局。
4 利用數學統計模型分析大數據
當數據的來源大大增加之后,由于原始數據在搜集時的目的不同,數據之間可能存在較大的差異性,難以使用傳統的方法進行統計,應考慮研發能綜合分析大數據的數學統計模型,實現對數據的篩選甄別、統計分析和最終結果的解釋,這需要集中食品科研、數學統計和信息技術等多方面的資源,并在長期的數據積累和試用結果基礎上統籌考慮。
5 困難與展望
雖然大數據思維的認識和理解較為容易,但真正落實到實踐行動上仍需要長時間的摸索。目前仍有許多問題亟待解決。
5.1 跨部門搜集數據難度較大
在我國目前食品安全管理體制中,雖然負有管理職責的部門已經進行了優化和整合,但部門之間的溝通仍存在信息流通不暢的難題,如果還考慮搜集其他部門的相關數據,則將進一步加大工作難度。
5.2 建立合理的大數據數學統計模型存在技術難點
由于數據主要來自于對自然環境的科學監測和社會環境的信息搜集,這些數據并沒有統一的衡量標準,如何將這些客觀可量化的數值和主觀復雜化的信息融合到統一的數學統計模型中進行綜合分析,找出其中的相關關系,這將是利用好這些大數據的關鍵,國內開發統計模型的工作尚處于起步階段,仍有大量問題需要解決 [4]。