曾小青 李靜茹 李 澈
(長沙理工大學 經(jīng)濟與管理學院,長沙 410114)
冷鏈物流業(yè)是推進流通體系建設,銜接鄉(xiāng)村振興,保障食品安全,促進消費升級的基礎性、戰(zhàn)略性產業(yè)[1]。近年來,我國冷鏈物流業(yè)得到了快速發(fā)展,特別是抗疫期間在保障食品供應上發(fā)揮了重要作用,同時也暴露了食品冷鏈受到污染時溯源困難的短板。作好食品冷鏈追溯管理,是監(jiān)測風險、保障食品安全的重要舉措。污染源定位不僅是產地溯源,還是風險溯源,即當出現(xiàn)食品安全問題時,不僅要確定食品的上游提供商,還需快速定位生產、加工或流通中出現(xiàn)污染的環(huán)節(jié)[2]。食品冷鏈的復雜性和全球化使得食源性疾病成為世界各國普遍關注的公共衛(wèi)生問題。當前,我國國家級冷鏈食品追溯系統(tǒng)已初步建成,記載了冷鏈食品的上下游信息。但由于食品冷鏈的鏈條長、節(jié)點多,交叉融合,結構復雜,準確判斷問題食品的污染環(huán)節(jié)和傳播途徑,仍存在理論和現(xiàn)實上的困難[3]。多數(shù)食品安全事件的爆發(fā),起初只是上游小部分污染,但隨后風險通過食品冷鏈急劇擴散,范圍不斷擴大,影響不斷加劇。
由于食品供應網(wǎng)絡的復雜性、動態(tài)性以及數(shù)據(jù)缺乏,食源性疾病的污染源頭識別是一個挑戰(zhàn)性課題。美國CDC(Centers for disease control and prevention,疾病控制和預防中心)數(shù)據(jù)表明,食源性疾病中只有37%可追溯到致病源,而能準確定位到污染位置的不足15%[4]。實際上,大多數(shù)污染源從未被確定[5]。目前主要用調查方法來解決污染源定位問題。監(jiān)測部門根據(jù)食品配送路徑,確定供應網(wǎng)絡中是否存在融合點,例如生產、加工、倉儲或配送的共同日期及地點[6]。由于資源的限制,可作為污染源定位的數(shù)據(jù)較少,并且往往是污染已通過網(wǎng)絡進行了傳播或爆發(fā)后才著手調查,效果大打折扣。隨著世界各國食品安全追溯系統(tǒng)建設的不斷推進,這種狀態(tài)正在改變,更快速、更準確地定位食品冷鏈中的污染源頭已成為可能。
食品冷鏈是連接冷鏈參與者的復雜信息網(wǎng)絡,通過考慮網(wǎng)絡結構及其包含的信息維度,再結合疾病報告,可以更好地識別網(wǎng)絡中的污染源[7]。理論上,食品冷鏈的污染源定位問題屬于網(wǎng)絡中的風險源識別問題,從傳染病到通過互聯(lián)網(wǎng)傳播的計算機病毒,從供水網(wǎng)絡的污染水源到通過社交網(wǎng)絡的輿情傳播,相關文獻比較豐富,但很多基于網(wǎng)絡結構的分析處理框架[8-9]過于簡化,缺乏現(xiàn)實網(wǎng)絡和問題背景的許多特征,很多假設不適用于食品冷鏈的溯源。
當前,污染源定位方法主要分為:1)時間類方法,利用食源性疾病的報告時間及次數(shù)信息;2)非時間類方法,利用已檢測到污染節(jié)點的位置信息。時間類方法包括基于動態(tài)消息傳遞[9]和貝葉斯信念傳播[10]的離散時間傳染病模型,如SIS(Susceptible-Infected-Susceptible,易感-感染-易感)模型、SIR(Susceptible-Infected-Recovered,易感-感染-恢復)模型[11],以及連續(xù)時間高斯傳播方法[12]。雖然連續(xù)時間傳播模型是對現(xiàn)實世界的較好近似,但這種方法是為樹形結構而設計的[13];非時間方法涉及對網(wǎng)絡節(jié)點有效距離的測量。有效距離是從源節(jié)點到檢測出風險的節(jié)點之間,距離最短、概率最高的那條路徑的長度[14-15]。這類方法已應用于EHEC(EnterohemorrhagicE.coli,腸出血性大腸桿菌)的源定位,但其識別結果不穩(wěn)定[15]。此外,由于食品冷鏈的風險傳播并不完全等同于疾病傳播,在食品冷鏈中,不同批次食品在不同環(huán)節(jié)之間隔離性更好,如果借助于食品追溯體系去定位污染源頭,則識別效率和精度均可提高。
鑒此,本研究擬采用一種考慮批次的污染源定位方法,對食品冷鏈中污染源定位與追蹤問題進行研究,并構建食品冷鏈回溯與追蹤系統(tǒng),以期為識別污染源頭,追蹤風險傳播和保障冷鏈食品安全,提供理論及系統(tǒng)構建方法指導。
食品冷鏈中污染傳播與流行病傳播[16-17]、計算機病毒傳播[18-19]、輿情傳播[20]、水污染傳播[21]等網(wǎng)絡傳播行為有較大區(qū)別。食品冷鏈是由食品生產、加工、流通、倉儲和消費多個環(huán)節(jié)的實體組成的復雜動態(tài)網(wǎng)絡。食品在網(wǎng)絡中的流動通常被描述為產品向下游傳遞時,連接起始節(jié)點和銷售終端節(jié)點的全部路徑(有向邊)的集合,食品冷鏈的污染傳播表現(xiàn)出以下特征:
1)污染傳播的可隔離性。食品冷鏈污染傳播與復雜網(wǎng)絡流行病傳播的動力學有一定相似性。許多基于網(wǎng)絡的源識別方法通常是流行病學模型的變體,如廣泛使用的流行病傳播SIS模型和SIR模型。然而,通過食品冷鏈產生的污染傳播并不完全等同于流行病傳播過程。受到污染的食品通過供應網(wǎng)絡傳播時,不一定會擴散到其他食物中,也不會在感染性方面顯著衰減[22-23]。這種不廣泛擴散性是由許多因素造成的,如包裝物品之間不充分接觸,未包裝食品之間缺乏相互作用,以及污染物擴散的生物不敏感性。不顯著衰減是由于食品的保質期不同于病源體衰變期。食品致病源污染過程主要通過受污染的食品擴散而不是通過環(huán)境傳播。此外,可追溯系統(tǒng)記錄了食品冷鏈中大量有用信息,忽略追溯信息而直接應用流行病學的傳播模型將降低食品冷鏈污染溯源的精準性。
2)觀察樣本的稀疏性。雖然食品中的污染會在冷鏈多個節(jié)點之間傳遞,但通常僅在購買受污染食品的最末節(jié)點出現(xiàn)疾病報告時才會被發(fā)現(xiàn)。除非進行進一步調查,否則參與食品生產、加工或儲存的節(jié)點即使更接近污染源,仍不易被觀測到。因此假設食品冷鏈中所有節(jié)點的污染狀態(tài)都已知是不現(xiàn)實的。
3)傳播路徑的多樣性。在食品冷鏈中任何可能的風險來源和觀測之間,存在多條路徑。這是由于食品生產、加工、批發(fā)和零售位置分散,食品將通過多個批發(fā)商或零售商傳遞至消費者手中。某些污染源識別方法假設過于簡化,即污染物只在污染源和觀測節(jié)點之間的單個最高概率路徑上傳播。這些方法對食品冷鏈風險溯源并不適用。
4)傳播時間的不確定性。理論上,可應用結合疾病報告和污染傳播所需時間的模型來檢測污染源。但食品在供應網(wǎng)絡上的傳遞存在時間延誤,污染傳播過程存在明顯的時間不確定性。污染物在食品冷鏈上各個節(jié)點(例如倉庫)以及在消費端的停留時間變化很大。
污染源定位是指識別導致食源性疾病暴發(fā)的食品冷鏈中污染的源頭節(jié)點。食品供應網(wǎng)絡可定義為有向圖G={V,E},其中V是節(jié)點集,表示食品冷鏈參與者。V由2種類型的節(jié)點組成:一組吸收節(jié)點VR和一組瞬態(tài)節(jié)點VQ,使得V={VQ,VR}。吸收節(jié)點代表食品銷售后離開冷鏈網(wǎng)絡的節(jié)點,食品此后不會重新進入冷鏈(例如零售商或餐館)。所有其他節(jié)點都是瞬態(tài)的,表示生產、加工和存儲食品的節(jié)點。E是形如(i,j)∈VQ×VQ∪VQ×VR的邊的集合,表示從節(jié)點i到節(jié)點j的業(yè)務關系。每條邊(i,j)都可賦予權重wij,以體現(xiàn)從節(jié)點i到節(jié)點j在特定時間段內的食品供應量。
將受污染食品在冷鏈網(wǎng)絡上的傳播過程描述為離散馬爾科夫鏈,即網(wǎng)絡上的隨機游走,其中傳輸概率對應于網(wǎng)絡邊的權重。這是加權有向網(wǎng)絡上非傳染性擴散的自然傳播模型,為了估計真實的源位置,采用最大似然ML(Maximum Likelihood)方法,選擇最有可能導致檢測到疾病報告的節(jié)點為污染源。
首先,假設在一個未知的源節(jié)點s*產生一定初始數(shù)量的受污染食品。令s*為具有預定義先驗概率分布P(s*=s)的節(jié)點隨機變量,節(jié)點s∈VQ。當污染食品離開節(jié)點s*時,開始污染擴散過程。
離散時間馬爾科夫過程決定受污染食品的移動,即通過供應網(wǎng)絡的加權隨機游走。在第n步的轉移中獲得的狀態(tài)序列Xn由馬爾科夫轉移概率確定,P(xn+1=j|xn=i)=pij,由pij構成矩陣P,表示在網(wǎng)絡G上發(fā)生污染過程的隨機馬爾科夫轉移矩陣。若節(jié)點i為吸收節(jié)點,有i∈VR,其自轉移概率定義為pii=1。根據(jù)供應網(wǎng)絡結構,可以將P視為一種以吸收節(jié)點為終點的有序組合。連接瞬態(tài)節(jié)點和吸收節(jié)點的轉移矩陣如下所示:
(1)
式中:PQ為|VQ|×|VQ|瞬態(tài)節(jié)點間的轉移子矩陣;PR為|VQ|×|VR|瞬態(tài)節(jié)點與吸收節(jié)點間的轉移子矩陣;IR為|VR|×|VR|吸收節(jié)點的轉移子矩陣。
從s*開始,污染食品通過供應網(wǎng)絡的擴散過程完全由馬爾科夫傳輸矩陣P確定。達到吸收節(jié)點o∈VR時擴散過程結束,生成一個連接源節(jié)點s*和吸收節(jié)點o的有向邊集合的網(wǎng)絡路徑(γs*,O)。在吸收節(jié)點o處污染食品被消費并離開食品供應網(wǎng)絡。假設食用污染食品的人中間有K個疾病報告,將連接到第k個疾病報告的吸收節(jié)點標識為ok,得到與這K個疾病報告相連接的吸收節(jié)點的集合Θ=(o1,o2,…,ok,…,oK),集合Θ中的元素可能相同,因為某個吸收節(jié)點可能會出現(xiàn)多個疾病報告(比如某個零售店導致多名消費者患病),將集合Θ中的元素去重以后得到的集合記為O,有o∈O?VR使得|O|≤K(即O中吸收節(jié)點個數(shù)不多于疾病報告病例數(shù))。傳輸模型的最后一步將隨機過程與網(wǎng)絡模型中定義的傳輸數(shù)量聯(lián)系起來。從節(jié)點i發(fā)送到節(jié)點j的食品數(shù)量占比可以反映污染沿該方向傳遞的條件概率。因此,將轉移概率pij定義為從節(jié)點i傳送到節(jié)點j的食品數(shù)量占由節(jié)點i發(fā)出的全部食品數(shù)量之比例:
(2)
2.2.1模型構建
污染源定位的目標是基于與疾病報告相連接的吸收節(jié)點集合Θ找出最“可能”是污染源的節(jié)點s*∈VQ。給定集合Θ及真實污染源節(jié)點s*的先驗分布,引入貝葉斯公式表示節(jié)點s是真實污染源s*的概率,如下:
(3)
(4)

導致在Θ中吸收節(jié)點位置檢測到疾病報告的污染源位于s的概率,取決于G上通過節(jié)點s到所有出現(xiàn)疾病報告的吸收節(jié)點ok∈Θ的路徑。但是,從s到每個疾病報告節(jié)點ok∈Θ可能的路徑γs,ok有多條,污染源是節(jié)點s的概率等于每條可能路徑排列組合的總概率。引入如下定義計算包括所有路徑組合的污染源可能性:

πs為從某污染源s到全部K個疾病報告的每個節(jié)點ok∈Θ的某一特定排列,是在路徑組{Γs,ok}ok∈Θ上元素的笛卡爾積,即(γs,o1,…,γs,oK)∈Γs,o1×…×Γs,oK。
Πs為從s到每個ok∈Θ路徑的全部排列,即:
Πs=Γs,o1×…×Γs,oK=
{(γs,o1,…,γs,oK)∶γs,ok∈Γs,ok}
(5)
根據(jù)上述定義,污染源可能性為全部排列的總概率:
P(Θ|s*=s)=∑πs∈ΠsP(πs|s)
(6)
要用式(6)求出所有πs∈Πs的總概率,先要計算單個πs的概率P(πs|s)。對于路徑γs,ok∈πs,可以根據(jù)該路徑上每條邊的相鄰節(jié)點對(i,j)∈γs,ok的轉移概率pij,將P(πs|s)展開為:
P(πs|s)=P(γs,o1,…,γs,oK|s)=
∏γs,ok∈πsP(γs,ok|s)=∏γs,ok∈πs∏(i,j)∈γs,okpij
(7)
則似然概率可以寫成:
P(Θ|s*=s)=∑πs∈ΠS∏γs,ok∈πs∏(i,j)∈γs,okpij
(8)
2.2.2模型求解的霍恩矩陣法
求解污染源定位貝葉斯模型的難點是求P(Θ|s*=s)的最大似然概率。污染源位于s的概率取決于通過節(jié)點s到所有出現(xiàn)疾病報告的吸收節(jié)點ok∈Θ的路徑。對于大多數(shù)食品供應網(wǎng)絡而言,即使疾病報告很少,也會出現(xiàn)組合爆炸。對此,阿比蓋.霍恩(Abigail L. Horn)[7]指出源節(jié)點s是真實源s*的概率可表示為:
P(Θ|s*=s)=∏ok∈Θ[(I-PQ)-1PR]s,ok
(9)
并在似然概率的計算中引入近似表達式A,使得:
(10)
式中,n為Ω?VQ中節(jié)點之間的狀態(tài)轉移步數(shù)。表達式A最后消去了n,只需進行簡單矩陣運算,即可從所有可能污染源s∈Ω中定位源節(jié)點s,使得后驗概率最大。
(11)
為說明用上述方法進行污染源定位時似然概率的計算過程,設有如圖1(a)所示的簡單食品冷鏈網(wǎng)絡,該網(wǎng)絡由5個食品冷鏈參與者節(jié)點構成。其中,節(jié)點1和2是食品生產節(jié)點,節(jié)點3是批發(fā)節(jié)點,節(jié)點4和5是零售節(jié)點,食品從節(jié)點4、5銷售以后離開食品冷鏈。因此,節(jié)點4、5是吸收節(jié)點,其他節(jié)點則是瞬態(tài)節(jié)點。
假設零售節(jié)點4、5均有食源性病例報告,則圖1(b)列示了節(jié)點1為污染源時,導致節(jié)點4、5有疾病報告的污染傳播路徑;圖1(c)表示節(jié)點2為污染源時的污染傳播路徑;圖1(d)表示節(jié)點3為污染源時的污染傳播路徑。

節(jié)點內數(shù)字1、2為生產節(jié)點,3為批發(fā)節(jié)點,4和5為零售節(jié)點。1 and 2 are producer nodes, 3 is wholesater node, 4 and 5 are retailer nodes.圖1 食品冷鏈上的污染傳播Fig.1 Contamination diffusion in food cold chain
根據(jù)霍恩方法,有:


盡管霍恩矩陣法簡化了基于貝葉斯推斷的污染源定位模型的求解,但如果僅以食品冷鏈節(jié)點為粒度,數(shù)據(jù)處理量還是過大,污染源定位還是過于復雜。比如某食品批發(fā)市場每天要銷售大量食品,其上游節(jié)點也很多,如果只在某些食品批次中發(fā)現(xiàn)了污染,就對所有的食品類型和上游節(jié)點都進行計算排查,不僅困難,也無必要。
如前所述,可追溯系統(tǒng)記錄了食品冷鏈中大量有用信息,將食品冷鏈上下游節(jié)點、交易數(shù)量以及包括食品類型、處理時間等在內的批次信息考慮進來,不僅可以降低食品冷鏈污染溯源的復雜性,還可提高污染源定位的精準性。
定義關于食品冷鏈網(wǎng)絡有向圖的三元組G={V,B,E},V={v1,v2,…,vi,…}為節(jié)點集合,B={bi1,bi2,…,bil,…|vi∈V}為批次的集合,E={(bik,bjl)|vi,vj∈V}為有向邊的集合,表示對于節(jié)點vj的食品批次bjl,需要用到節(jié)點vi批次bik的食品,正是通過食品批次信息把上下游關聯(lián)在一起,由此形成了一個復雜的食品冷鏈網(wǎng)絡結構。
假設對于冷鏈中某食品節(jié)點Si∈V,有n個食品批次Bjk(k=1,2,…,n)供應到節(jié)點Tj∈V,定義Fk(i,j)→{0,1},若存在從節(jié)點Si到Tj跟批次Bjk相關的路徑P(Si,Tj),則Fk(i,j)取值為1,否則為0。可以通過為污染批次途經(jīng)的各節(jié)點分配權重(優(yōu)先級)來度量風險評分值,用R(Si)表示。定義為:
(12)
式中,wjk為由食品冷鏈對于食品批次Bjk、路徑P(Si,Tj)上第j個節(jié)點的權重。可以給不同的污染程度設置不同的權重。比如,令wjk的取值等于節(jié)點Tj批次Bjk的全部銷售量中,有疾病報告的消費者食品購買數(shù)量占批次Bjk的全部銷售數(shù)量之比。wjk越高,節(jié)點Tj污染越嚴重。出于簡化及謹慎性考慮,可以令有疾病報告的食品批次Bjk對應的節(jié)點Tj的權重wjk為1,無疾病報告的食品節(jié)點權重為0。包含批次信息的食品冷鏈追溯系統(tǒng)一旦構建起來,各節(jié)點的風險值根據(jù)上式可全部計算出來。對于任意節(jié)點Si,有R(Si)∈[0,1]。

(13)

圖2示出包含批次信息的食品冷鏈。生產食品批次6需要用到上游的批次2和批次5,生產食品批次4需要用到上游的批次3。零售節(jié)點4、5均有食源性病例報告,且可對應到具體食品批次。
假如節(jié)點4的批次1以及節(jié)點5的批次6的消費者有疾病報告,批次4的消費者沒有疾病報告。可以看出,對于污染批次1,節(jié)點1、4都可能是染污源;對于污染批次6,則節(jié)點1、2、3、5都可能是污染源。因此,該情形下,每個節(jié)點都可能是污染源。
由于節(jié)點4的批次1及節(jié)點5的批次6有疾病報告,故有w41=1,w56=1,其余wjk=0;對于污染批次1,有F1(1,4)=1,F(xiàn)1(4,4)=1;對于污染批次6,有F2(1,3)=1,F(xiàn)5(2,3)=1,F(xiàn)6(3,5)=1,F(xiàn)6(1,5)=1,F(xiàn)6(2,5)=1,F(xiàn)6(5,5)=1,其余為0。因此,R(S1)=(w41F1(1,4)+w56F6(1,5))/(w41+w56)=(1×1+1×1)/(1+1)=1.00,同理可求得R(S2)=w56F6(2,5)/(w41+w56)=0.50,R(S3)=w56F6(3,5)/(w41+w56)=0.50,R(S4)=w41F1(4,4)/(w41+w56)=0.50,R(S5)=w56F6(5,5)/(w41+w56)=0.50。由于R(S1)=1.00,其余節(jié)點風險評分值均為0.50,因而節(jié)點1為污染源的可能性最大。

其他節(jié)點符號說明與圖1相同。Other nodes symbols and annotations are the same as in Fig.1.圖2 包括批次信息的食品冷鏈Fig.2 A food cold chain of containing batch information
對于食品零售節(jié)點4、5出現(xiàn)疾病報告的其他可能污染批次情況,用同樣方法計算各節(jié)點的風險評分值,由此確定最可能污染源,結果見表1。

表1 食品零售節(jié)點4、5不同污染批次下各節(jié)點風險評分Table 1 The risk score in the case of retailer node 4 and node 5 contain different contamination batches
若零售節(jié)點1出現(xiàn)的疾病報告對應于食品批次1,此時批次1為污染批次,食品節(jié)點風險評分R(S1)=1.00、R(S4)=1.00取最大值,故節(jié)點1、4為最可能污染源;同理,若疾病報告對應污染批次1,4,6,則節(jié)點1的R(S1)最大,故節(jié)點1為最可能污染源,其他情形類似,由此實現(xiàn)了污染源定位。
在3.1節(jié)中,風險值度量方法假設所有批次之間相互隔離良好,即非相關食品不同批次之間不相互污染。這是一個強假設,可以極大簡化計算路徑的工作量,但在某些食品冷鏈管理水平低下、食品安全控制不嚴格的食品生產節(jié)點,如果某批次出現(xiàn)了污染,則該節(jié)點的后續(xù)所有批次食品都可能受到污染,即產品之間可能發(fā)生交叉污染。
交叉污染環(huán)境下風險值度量依然可以使用式(12)進行計算,但wjk和Fk(i,j)的取值會有所變化。圖3 示出一個交叉污染環(huán)境下包括批次信息的食品冷鏈。由于節(jié)點3發(fā)生了交叉污染,所以批次4、批次6都可能受到污染。因此,w41=1,w44=1,w56=1,其余wjk=0,F(xiàn)1(1,4)=1,F(xiàn)1(4,4)=1,F(xiàn)2(1,3),F(xiàn)4(1,4)=1,F(xiàn)4(2,4)=1,F(xiàn)4(3,4)=1,F(xiàn)4(4,4)=1,F(xiàn)5(2,3)=1,F(xiàn)6(3,5)=1,F(xiàn)6(1,5)=1,F(xiàn)6(2,5)=1,F(xiàn)6(5,5)=1,其余為0,代入式(12)可得R(S1)=(w41F1(1,4)+w44F4(1,4)+w56F6(1,5))/(w41+w44+w56)=1。同理可算得R(S2)=0.67,R(S3)=0.67,R(S4)=0.67,R(S5)=0.33。由于R(S1)=1,風險評分值最大,故節(jié)點1仍為最可能污染源,模型的解準確性和穩(wěn)定性較好。

其他節(jié)點符號說明與圖1相同.Other nodes symbols and annotations are the same as in Fig.1圖3 交叉污染環(huán)境下包括批次信息的食品冷鏈Fig.3 A food cold chain of containing batch information under cross contamination environment
基于上述理論模型,為對食品冷鏈的后向回溯和前向追蹤進行直觀交互與結果展現(xiàn),構建考慮批次的可追溯食品冷鏈回溯與追蹤系統(tǒng)。當食品冷鏈中的某些節(jié)點出現(xiàn)疾病報告或疑似污染時,可以根據(jù)污染源定位算法,將污染節(jié)點傳播路徑標識出來。
在設計數(shù)據(jù)關系之前,先界定以下概念:
1)工作站: 代表冷鏈中發(fā)送或接收食品的節(jié)點,例如,生產或銷售食品的公司或食品消費者。
2)路徑: 是一條沿著冷鏈的路徑,污染食品在食品冷鏈上流動,可能包括混合和拆分事件。
3)疾病報告: 是引起暴發(fā)的病原體出現(xiàn)的一個或多個地方。例如某個地區(qū)、一定時間內、若干名出現(xiàn)相同患病癥狀的食品消費者。
食品安全追溯系統(tǒng)包含4類實體的相關信息:企業(yè)成員、產品、配送及批次信息。這4類實體的關系如下圖如所示,這種設計能夠存儲長度不定、任意復雜的冷鏈的信息,此外,食品可以通過不同數(shù)量的中間步驟“生產”,并允許食品鏈中的一批食品由幾個中間成員處理。可追溯食品冷鏈數(shù)據(jù)關系模型和數(shù)據(jù)流分別如圖4、圖5所示。

圖4 可追溯食品冷鏈數(shù)據(jù)關系模型Fig.4 Data relation model of traceable food cold chain

圖5 可追溯食品冷鏈的數(shù)據(jù)流Fig.5 Data flow of traceable food cold chain
結合BfR(德國聯(lián)邦風險評估研究所)提供的來自歐盟RASFF(Rapid Alert System for Food and Feed,食品和飼料快速預警系統(tǒng))的公開數(shù)據(jù)集[24],對食品安全回溯和追蹤分析方法和過程進行說明。示例數(shù)據(jù)集包括了牛肉、雞肉、豬肉、魚、比薩和奶酪6種食品、252個冷鏈成員的548次交易的交易。部分食品工作站信息見表2,食品冷鏈上下游配送信息見表3。

表2 食品工作站基本信息Table 2 Basic information of food stations

表3 每次食品供應上下游基本信息Table 3 Up and down stream basic information of each food supply
食品安全回溯與追蹤系統(tǒng)對收集到的食品冷鏈數(shù)據(jù)進行分析并將其可視化。圖6是RASFF數(shù)據(jù)集的圖形化展示,如果選中了某一可疑節(jié)點,系統(tǒng)將用不同顏色顯示連接到此節(jié)點的所有上游和下游節(jié)點及路徑。圖中食品工作站節(jié)點用圓圈表示,節(jié)點之間通過食品配送建立起來的聯(lián)系用帶箭頭的連線表示,不同顏色的節(jié)點和連線具有特定的含義。其中:紅色節(jié)點表明該節(jié)點的消費者中有病例報告;綠色是當前正在分析的觀測節(jié)點;橙色表示從當前觀測節(jié)點向下游追蹤路徑上的節(jié)點和連線;粉色表示觀測節(jié)點向上游回溯路徑上的節(jié)點和連線;黑色節(jié)點表明在該處存在交叉感染;黃色表示起始節(jié)點;藍色表示終端吸收節(jié)點。若節(jié)點同時屬于上述幾種狀態(tài),則該節(jié)點用不同狀態(tài)顏色的復合色來表示。若選中某觀測節(jié)點,系統(tǒng)會將該節(jié)點的所有上游節(jié)點和路徑用紫色顯示,而所有的下游節(jié)點和路徑則顯示為橙黃色。這樣,就從一個復雜的食品供應網(wǎng)絡中,將與該節(jié)點相關的冷鏈區(qū)別標示出來。

圖6 食品工作站節(jié)點的上、下游的可視化展現(xiàn)Fig.6 Visualization of the up and down stream nodes of a food station in a supply chain
為清晰展示某些節(jié)點發(fā)生食源性疾病時,通過回溯分析定位可能的污染源,并突出顯示污染的傳播路徑,選取食品工作站Station 360和Station 251兩個終端消費節(jié)點出發(fā),對食品安全回溯和污染源定位進行闡述。
由表2和表3可知,Station 360是一家位于德國Bremen市的大型超市,它有2個上游節(jié)點:Station 256和Station 336。其中Station 256是位于瑞士Basel市的一家魚肉供應商,而Station 336則是位于瑞士Winterthur市的一家漁場,根據(jù)表3的數(shù)據(jù)可以看出,Station 336分別于2012-07-23和2013-01-09給Station 256供應了兩次魚(肉),Station 256于2013-08-04向Station 360供應了1次魚肉。將上述數(shù)據(jù)及供應關系通過圖7進行描述,食品工作站Station 360的上游供應鏈Station 336→Station 256→Station 360用紫色表示出來。

圖7 食品工作站Station 360的上游供應鏈Fig.7 The up stream supply chain of food station 360
另一個終端消費節(jié)點Station 251是一家位于德國Heidelberg市的大型超市,它有5個上游節(jié)點:Station 250、Station 380、Station 381和Station 256、Station 336,構成了一條比薩(Pizza)的供應鏈,在Station 250處有個分支,分別是豬肉和魚肉供應的2條子鏈。Station 250是位于德國Erfurt市的一家供應商,而Station 380則是位于匈牙利Szeged市的一家豬肉供商,Station 381則是位于匈牙利Pécs市的一家生豬肉供商,Station 256及其上游在前面已經(jīng)作了描述。根據(jù)表3的數(shù)據(jù)可以看出,Station 381向Station 380供應了1次生豬肉,Station 380于2013-06-09向Station 250供應了1次豬肉,Station 256于2013-05-17向Station 250供應了1次魚肉,Station 250向Station 251供應了1次比薩(Pizza)。食品工作站Station 251的上游供應鏈為Station 336→Station 256→Station 250、Station 381→Station 380→Station 250→Station 251。圖8示出食品工作站Station 251的上游供應鏈。
比較圖7和圖8發(fā)現(xiàn),節(jié)點Station 251和Station 360上游食品冷鏈在Station 336→Station 256這一部分是重合的。如果Station 360檢測到污染,可能是由Station 336→Station 256引起的,跟Station 381→Station 380→Station 250無關。如果Station 251檢測到污染,則Station 336→Station 256、Station 381→Station 380→Station 250均有可能是污染源;相應地,如果Station 360和Station 251同時檢測到污染,Station 336、Station 256是污染源的概率要更大一些。

圖8 食品工作站Station 251的上游供應鏈Fig.8 The up stream supply chain of food station 251
根據(jù)式(12)可以計算出各個食品工作站的風險得分R(Si)。當Station 360和Station 251同時檢測受到污染時,各工作站為污染源的風險得分見表4。

表4 食品工作站定位為污染源的風險得分Table 4 The risk score of food stations of possible contamination sources
Station 256和Station 336的風險得分是1,其他節(jié)點都是0.5,可見Station 256和Station 336最有可能是造成Station 251和Station 360污染的污染源。為了更直觀地展現(xiàn)風險高低,可根據(jù)節(jié)點得分高低來調整節(jié)點大小,亦即在疫情調查中,較大的節(jié)點比較小的節(jié)點更可能跟污染有關。圖9清晰標示了污染源及其傳播路徑。

圖9 根據(jù)風險得分進行污染源定位Fig.9 Contamination sources locating based on risk score
為進一步刻畫跨區(qū)域或跨國之間的食品冷鏈中,污染源的定位和安全風險的傳遞,還可將各食品工作站的地理位置信息(經(jīng)度、緯度)與供應網(wǎng)絡信息結合起來,以地圖方式更直觀地揭示該數(shù)據(jù)集所反映的食品冷鏈在歐盟的分布及風險傳播情況。
食品冷鏈物流是保障食品安全與質量的有效手段,作好食品冷鏈追溯管理,實現(xiàn)源頭可追溯,去向可追蹤,責任可追究,是保障食品安全有效供給的重要舉措。
本研究探討了污染源定位的理論模型,提出了一種計算上更為高效的方法,基于食品供應節(jié)點和配送的批次信息來計算風險值,并推導沿著所有可能路徑的污染源到每個檢測出風險的節(jié)點之間的總概率,進而實現(xiàn)食品冷鏈中的污染源定位。此外,構建了可追溯食品冷鏈回溯與追蹤系統(tǒng),該系統(tǒng)集成了數(shù)據(jù)管理,提供豐富的可視化交互方式,支持食品冷鏈風險的回溯和追蹤。
主要研究結論如下:
1)食品冷鏈的污染傳播具有可隔離性、觀察樣本稀疏性、路徑多樣性和時間不確定性等諸多特征,使其污染源定位方法有別于傳統(tǒng)風險源識別與傳播方法。
2)食品冷鏈的污染源識別與定位是一個挑戰(zhàn)性課題,考慮批次的可追溯食品冷鏈污染源定位模型,不僅降低了食品冷鏈污染溯源的復雜性,而且提高了污染源定位的精準性。
3)可追溯食品冷鏈回溯與追蹤系統(tǒng),可以在食品冷鏈中出現(xiàn)污染時,根據(jù)污染源定位算法,直觀地將污染源節(jié)點標識出來,并顯示污染節(jié)點引發(fā)的風險傳播范圍。
鑒于國內涵蓋生產、加工、配送、銷售多環(huán)節(jié)全鏈條的數(shù)據(jù)獲取較難,同時為增強研究的可比性,本研究采用由德國BfR提供的RASFF食品冷鏈公開數(shù)據(jù),展示了可追溯食品冷鏈鏈中污染源定位、追蹤分析的過程與結果。建議我國應加快推進食品安全追溯系統(tǒng)建設,充分利用冷鏈食品批次信息,提升污染源定位與追蹤能力,以實現(xiàn)從源頭上消除污染,快速阻斷風險傳播,切實保障冷鏈食品安全。