張方怡,董慶利,黃宋琳,黃勛娟,王文迪
(上海理工大學醫療器械與食品學院,上海200093)
基于貝葉斯網絡的豬肉合格率的模型構建
張方怡,董慶利*,黃宋琳,黃勛娟,王文迪
(上海理工大學醫療器械與食品學院,上海200093)
我國是豬肉消費大國,其衛生情況對人民關系重大。近年來肉制品的微生物污染現象不容樂觀,所以建立一個行之有效的豬肉追溯系統有利于更好地控制豬肉質量。本文根據現有的豬肉衛生標準,選出豬肉的四種優勢致腐菌:大腸桿菌、單增李斯特菌、沙門氏菌以及金黃色葡萄球菌,以貝葉斯網絡為理論依據,利用Hugin Lite軟件擬合出合格率模型。結果表明,基于貝葉斯網絡可通過改變菌體數據快速求得豬肉的合格率,大大縮減檢驗時間,為豬肉衛生合格率的質檢工作提供理論依據。
貝葉斯網絡,肉,追溯模型
肉是人類可以食用的動物的骨骼肌,它的生物學組成致使其很容易腐敗[1]。冷卻肉同熱鮮肉、冷凍肉相比,具有柔嫩多汁、新鮮味美、營養、安全、衛生等優點。由于其含有豐富的營養成分,且水分活度高,是微生物生長和繁殖的理想培養基,所以很容易受到微生物的侵襲,所以極易發生腐敗變質[2]。一般肉類制品最容易感染沙門氏菌和致病性大腸桿菌。另外,志賀菌、李斯特菌、空腸彎曲菌、變形桿菌、葡萄球菌、肉毒梭菌(一般熟肉制品)等都是引起肉制品污染的致病微生物[3]。隨著經濟的發展和社會的進步,消費者對肉與肉制品的質量和安全都提出了更高的要求,但是目前市場上的肉與肉制品卻在養殖、屠宰、加工和流通等各個環節都存在不安全的因素[4]。近年來,肉類食品中毒、污染而造成重大損失和危害的報道常見于報端。目前對于豬肉制品采取的是輻照技術、定期抽查檢測等。但是這些措施只能在豬被屠宰后或豬肉制成成品后采取控制的措施,無法從根源上解決豬肉的安全問題。如果能夠利用電腦軟件,快速檢測出豬肉中微生物的含量,通過其含量得到貨架期內豬肉的質量的變化,從而達到溯源的效果,可以從源頭上提高豬肉的質量;同時也可以在短時間內快速有效地檢測豬肉的合格率,為各大機構賣場提供豬肉質檢的理論依據。食品工業從生產到消費是一個復雜的過程,食品加工系統具有大量相互作用,包括微生物、物理、化學等組成部分,而這些作用又可以歸結為線性和非線性[5]。其中也包括諸多不確定性因素,例如各種食品微生物在不同加工、儲藏和流通條件的存活情況。貝葉斯網絡模型提供了一種實用的數學形式,依賴于概率的圖形化模型,能夠描述復雜的動力系統,可用來反映食品加工過程中的不確定性。貝葉斯網絡已成功運用于藥品不良反應信號檢測方法研究[6],以及農產食品貿易的質量風險控制[7]的食品工業研究中,但在肉制品微生物安全控制方面的研究較少。運用貝葉斯網絡,可在不進行微生物檢測分析的前提下,建立食品溯源系統,能夠判斷食品內主要腐敗微生物死亡的全過程、殘存和增值的動態變化,從而對食品安全做出快速評估的預測和控制方法,更好的確保食品安全。本文以豬肉為例,利用貝葉斯網絡建立數學模型表示豬肉溯源系統,模擬不同微生物在豬肉中的交互作用。
貝葉斯網絡(Bayesian network)是一種概率網絡,它是基于概率推理的圖形化網絡,其概率網絡的基礎則是貝葉斯公式。其是Pearl于1988年提出的一種不確定知識表達模型。一個貝葉斯網絡是一個有向無環圖(Directed Acyclic Graph,DAG),由代表變量節點及連接這些節點有向邊構成。節點代表隨機變量,節點間的有向邊代表了節點間的互相關系(由父節點指向其后代節點),用條件概率進行表達關系強度,沒有父節點的用先驗概率進行信息表達。適用于表達和分析不確定性和概率性的事件,應用于有條件地依賴多種控制因素的決策,可以從不完全、不精確或不確定的知識或信息中做出推理。圖1給出了一個簡單的6個節點的貝葉斯網絡示例(未包含條件概率分布)。其中V1、V2,…,V6分別表示代表變量的節點,箭頭方向表示節點間的互相關系(由父節點指向其后代節點),用條件概率進行表達關系強度。

圖1 一個簡單的貝葉斯網絡Fig.1 A simple example of Bayesian network
一般來說,一個具有N個節點的貝葉斯網絡可用N=〈〈V,E〉P〉來表示,其中包括兩部分:a.〈V,E〉表示一個具有N個節點的有向無環圖[10]G。節點V ={V1,V2,…,VN}代表變量,節點間的有向邊E代表了變量間的關聯關系。節點變量可以是任何問題的抽象,如部件狀態、觀測值、人員操作等。對于有向邊(Vi,Vj),Vi稱為Vj的父節點,而Vj稱為Vi的子節點;沒有父節點的節點稱為根節點,沒有子節點的節點稱為葉節點。Vi的父節點集合和非后代節點集合分別用pa(Vi)和A(Vi)來表示。有向圖〈V,E〉蘊含了條件獨立性假設,即在給定pa(Vi)下,Vi與A(Vi)條件獨立:P(Vi|pa(Vi),A(Vi))=P(Vi|pa(Vi))。b.P表示一個與每個節點相關的條件概率分布(Conditional Probabilities Distribution,CPD)。由貝葉斯網絡的條件獨立性假設可知,條件概率分布可用P(Vi|pa(Vi))來描述,它表達了節點與其父節點的關聯關系。如果給定根節點先驗概率分布和非根節點條件概率分布,可以得到包含所有節點的聯合概率分布。在圖1中,包含全部節點的聯合概率分布函數為[11]:
P(V1,V2,V3,V4,V5,V6)=P(V6|V5)P(V5|V3,V2)P(V4|V2,V1)P(V3|V1)P(V2|V1)P(V1)
因此,貝葉斯網絡可看作是一個概率專家系統,其概率知識庫由網絡的拓撲結構和每個節點的條件概率組成。
Hugin Lite軟件是一款由丹麥公司研發的,利用貝葉斯網絡技術為決策者提供先進的解決方案的軟件。該軟件可以運用于許多領域,如使用決策分析、決策支持、預測、診斷、健康監測、故障診斷、風險管理和安全評估等方面。該軟件的應用程序有著良好高效的推理機制,主要用來處理基于貝葉斯因果網絡或者影響圖的知識領域。通過對知識領域的因果關系概率描述,在應用程序中建立起該領域的貝葉斯因果網絡或影響圖[12],應用概率關聯來描述領域事件的不確定性。所以,Hugin Lite軟件的推理機制能夠執行既快速又準確的因果推理。
以判斷豬肉肉質品質為例,首先創建節點,在貝葉斯網絡中是用“discrete chance tool”創建五個離散節點,分別是:沙門氏菌、金黃色葡萄球菌、單增李斯特菌、大腸菌群和肉。再以沙門氏菌,金黃色葡萄球菌,單增李斯特菌和大腸菌群作為父節點(根節點);將肉作為子節點,建立因果關系網如圖2所示。同時使用“utility tool”,命名為腐敗情況的功能節點表示肉的品質狀況。在本案例中,腐敗情況亦為葉節點。
進一步對貝葉斯網絡進行學習我們可以發現,將先驗概率與數據相結合,經過貝葉斯網絡學習之后所得到的概率為后驗概率。實際上,貝葉斯網絡學習就是由先驗概率通過求解后得到后驗概率的過程。后驗概率可借助貝葉斯公式來計算,其表達式為:

式中:A為豬肉檢測呈陽性的現象;Fj為四種不同的優勢腐敗菌對其的影響;P(Fj)為先驗概率,代表假設Fj的初始概率;P(A)為豬肉中發生不合格現象的先驗概率;P(Fj|A)為豬肉呈陽性即不合格的情況下,各影響因素出現的概率;P(A|Fj)為豬肉在各因素單獨影響下,發生不合格現象的概率;P(A|F)為豬肉在各因素綜合影響下發生不合格現象的概率。
在貝葉斯網絡中,通常要選擇后驗概率最大的結構,即:

后驗概率的最大結構需要借助似然函數來求取。設X=(x1,x2,…,xn)為對應于各個節點的隨機變量集,因為每個變量只有“1”或“0”2個狀態,所以變量均為二元隨機變量。定義似然函數為:

式中:為各節點條件概率分布的隨機變量。
根據最大似然估計法,選擇合適的參數,使得所定義的似然函數,Ln(θ)取得最大值。則θ*=arg θmax Ln(θ)即極大后驗概率[11]。
這樣,利用聯合概率分布函數、貝葉斯公式和似然函數就可以計算出任意節點的后驗概率。從而能得出各個菌種對豬肉合格率的影響,得出豬肉合格的概率。

表1 合格率的判定關系Table 1 Decision between qualifying criteria
確定了網絡結構,隨之應確定該網絡節點的參數,先確定節點的值域,在此基礎上解決節點的先驗概率問題。本研究中可將節點參數狀態設定為真/假(TRUE/FALSE)兩個狀態,例如表1中沙門氏菌{陽性,陰性};陽性=TRUE=1,陰性=FALSE=0;即為(1,0)。肉{合格,不合格};合格=TRUE=1,不合格=FALSE=0;即為(1,0)。
沙門氏菌、金黃色葡萄球菌、單增李斯特菌和大腸菌群是生豬肉中主要有害菌。基于2006~2008年上海市豬肉及其制品食源性致病菌監測結果[12],沙門氏菌檢出率為3%,金黃色葡萄球菌為6.8%,單增李斯特菌為4.2%,大腸桿菌為0;且規定只有當沙門氏菌、金黃色葡萄球菌、單增李斯特菌及大腸菌群在檢測過程中均為陰性時才能確定該肉質為合格。將上述數值作為貝葉斯模型的先驗概率。
根據國家無公害食品標準[13]進行判定,菌落總數(≤106CFU/g)和大腸菌群(≤104MPN/100g),兩項指標超出檢測標準設定的限值即判為陽性;金黃色葡萄球菌、沙門氏菌和單增李斯特菌不得檢出,若有檢出即判為陽性。菌落總數小于等于106CFU/g時為陰性。
將已知數據輸入Hugin Lite軟件中運行后如圖2所示,可知后驗概率及豬肉的合格率為86.61%。假設抽取100份豬肉樣本,則從“腐敗情況”此欄中得出合格的理論樣本數為86.61份。

圖2 應用Hugin Lite軟件構建豬肉合格率的貝葉斯模型Fig.2 Bayesian model of pork qualifying criteria built by Hugin-Lite
同時也可將已知的豬肉合格率看為先驗概率,通過該貝葉斯網絡模型可得出四種菌群的檢出率即后驗概率。如圖3所示,若將該批豬肉的已知合格率(99.66%)輸入貝葉斯網絡模型中,則可以得到單增李斯特菌、大腸菌群、沙門氏菌和金黃色葡萄球菌的理論檢出值,分別為0.24%、0、0.17%、0。同理,若將豬肉合格率改為100%,可求得四種菌的理論檢出率都為0。

圖3 由豬肉合格率的改變對微生物檢出率的預測Fig.3 Prediction of microbial detection rates by the changable pork qualifying criteria
貝葉斯模型在食品工業的品質控制方面獲得了廣泛應用,如陳華等[14]運用貝葉斯網絡原理判別中國白酒香型的化學模式,鄧淑芬等[15]建立了食品供應鏈的信號博弈模型,分析信號博弈的三種貝葉斯均衡及其條件,得出了信息不對稱情況下安全食品生產商的損失函數。相比于上述模型,本文的系統可用于豬肉檢測部門更快速,簡便地對豬肉的合格率做出判斷,從而控制食品的安全生產問題。
本研究構建的貝葉斯模型還缺少四種菌種的交互作用對豬肉合格率的影響,使得檢測結果可能與實際情況有偏差。今后應該進一步研究貝葉斯網絡中使得各個影響因素對結果的交互作用以及用相關度更大的公式或引入函數來建立貝葉斯網絡模型,以便于更好的模擬出實際的豬肉合格率檢測,用于檢測豬肉以及其他食品的安全狀況。
由于豬肉的變質及腐敗所涉及的菌種種類繁多,本文根據文獻中的數據,構建描述變量間不確定性關系的貝葉斯網絡模型,可以通過四種菌群的變化得到肉質的腐敗情況。亦可通過肉質狀況的改變而對豬肉中菌群的狀況進行反追蹤,調查各菌種所占含量,得到貨架期內豬肉的質量的變化,從而達到溯源的效果。
[1]周建新.植物源天然食品防腐劑的研究現狀存在問題及前景[J].食品科學,2006,27(1):263-268.
[2]王戩,葛長榮.冷卻肉保鮮方法及保鮮劑研究進展[J].食品科學,2011,25(5):54-57.
[3]王金美,石晶,李睿曉.肉與肉制品常見的安全衛生問題及對策[J].肉類研究,2009(1):33-35.
[4]熊立文,李江華,李丹.我國肉與肉制品法規體系和標準體系現狀[J].肉類研究,2011,25(5):46-53.
[5]Smid J H,Verloo D,Barker G C,et al.Strengths and weaknesses of Monte Carlo simulation models and Bayesian belief[J].International Journal of Food Microbiology,2010,139(S1): 57-63.
[6]江靜,侯永芳,劉秀娟,等.藥品不良反應信號檢測方法概述[J].中國藥物警戒,2010,7(2):78-80.
[7]張漢江,葛偉娜,羅端紅.質量貿易條件與農產食品貿易的質量風險控制[J].系統工程,2007,25(9):49-54.
[8]段鵬武.Bayes網絡在數據挖掘中的應用研究[J].軟件導刊,2007(1):12-13.
[9]周忠寶,董豆豆,周經倫.貝葉斯網絡在可靠性分析中的應用[J].系統工程理論與實踐,2006(6):95-100.
[10]楊建勇.現代港口發展的理論與實踐研究[D].上海:上海海事大學,2005.
[11]魏愛國,王冉冉,李亞玲.基于貝葉斯網絡的車輛交通事故預防研究[J].軍事交通學院學報,2011,5(13):24-31.
[12]王穎,彭少杰,田明勝,等.2006~2008年上海市豬肉及其制品食源性致病菌監測結果分析[J].公共衛生與預防醫學,2011,21(1):109-111.
[13]趙敏,李亞東.無公害食品行業標準-豬肉[J].Sichuan Animal Veterinary Sciences,2001,28(11):18.
[14]陳華,郁志勇,朱國斌.中國白酒香型的化學模式識別Ⅲ一一判別分析[J].食品科學,2000,21(9):40-41.
[15]鄧淑芬,吳廣謀,趙林度,等.食品供應鏈安全問題的信號博弈模型[J].物流技術,2005(10):135-137.
Modeling the qualifying criteria of pork based on Bayesian network
ZHANG Fang-yi,DONG Qing-li*,HUANG Song-lin,HUANG Xun-juan,WANG Wen-di
(School of Medical Instrument and Food Engineering,University of Shanghai for Science and Technology,Shanghai 200093,China)
A significant proportion of China’s meat consumption consists of pork.Therefore the issue of pork food safety is a matter of public concern.The establishment of an effective meat traceability system is necessary to monitor food safety.Using the Bayesian network theory to build the model by the Hugin Lite software system,we had identified the qualifying criteria in relate to four specific spoilage organisms(SSOs),including E.Coli,Listeria monocytogenes,Salmonella and Staphylococcus aurous.By using this model,the qualifying criteria could be examined efficiently even when inputting variable bacteria levels.
Bayesian network;pork;traceability model
TS251.1
A
1002-0306(2012)10-0052-04
2011-08-31 *通訊聯系人
張方怡(1990-),女,大學本科,研究方向:食品質量安全快速檢測。
國家自然科學基金(30800864);上海理工大學微創微創勵志創新基金。