吳敏寧,張永恒,楊 斐
(榆林學院,陜西榆林719000)
肉類食品安全追溯的一個重要特征是其動態行為,由于肉類食品供應鏈內部及與環境之間的相互作用,系統對危害活動擾動的響應隨時間變化而變化[1]。在肉類食品安全追溯分析過程中,只有詳盡了解肉類食品供應鏈的運行過程,才能識別諸多環節中可能存在的不安全因素,從而在供應鏈中消除危險因素或將危險因素控制在可控制的水平范圍內。在供應鏈中,由于內部因素之間的相互作用以及系統與環境和操作人員之間的交互等,可能造成實際危害路徑的變化以及安全結果的差別,因此需詳細了解這些動態特征,分析與求解系統的各項安全模式,評價肉類食品供應鏈安全性水平,從而消除或控制危險因素,有效防止不安全事故的發生,提高食品質量安全[2]。因此,迫切須要設計出可以對肉類食品供應鏈進行質量安全診斷,對危害模式進行快速定位的肉類食品質量安全模型,而這一模型的建立基礎是供應鏈參與的各種證據。在實際分析過程中存在證據沖突和證據缺失的問題,針對肉類食品追溯過程中證據缺失和證據沖突等問題,建立證據融合模型,能夠有效降低在復雜的證據條件下和風險并發條件下計算的復雜度,提高分析識別率。
D-S證據理論是由20世紀60年代哈佛大學數學家Dempster利用上、下限概率解決多值映射問題時提出,并由他的學生Shafer于1976年進一步發展起來的一種不精確推理理論[3],Shafer對證據理論作了進一步發展,引入信任函數概念,形成了一套“證據”和“組合”來處理不確定性推理的數學方法。D-S理論是對貝葉斯推理方法的推廣,主要是利用概率論中貝葉斯條件概率來進行的計算,貝葉斯推理方法須要知道先驗概率[4]。而D-S證據理論不需要知道先驗概率,就能夠很好地表示“不確定”,因此被廣泛用來處理不確定數據。
在D-S證據理論中,由互不相容的基本命題(假定)組成的完備集合被稱為識別框架,表示對某一問題的所有可能答案,但其中只有一個答案是正確的;該框架的子集稱為命題;分配給各命題的信任程度稱為基本概率分配(BPA,m函數),m(A)為基本可信數,反映對A的信度大小。信任函數Bel(A)表示對命題A的信任程度,似然函數Pl(A)表示對命題A非假的信任程度,也即對命題A似乎可能成立的不確定性度量,實際上,[Bel(A),Pl(A)]表示命題 A的不確定區間,[0,Bel(A)]表示命題 A的支持證據區間,[0,Pl(A)]表示命題A的擬信區間,[Pl(A),1]表示命題A的拒絕證據區間。設m1和m2是由2個獨立的證據源導出的基本概率分配函數,則Dempster組合規則可以計算這2個證據共同作用產生的反映融合信息的新基本概率分配函數[5]。其區間劃分如圖1所示。
(1)D-S證據理論無法解決證據沖突嚴重和完全沖突的情況,而肉類食品生產安全風險涉及證據沖突和證據相關的問題,在肉類食品生產安全風險處理中產生的證據很多是相關的,這將使得D-S證據理論在應用于肉類食品追溯系統時遇到難題。(2)難以辨識模糊程度,由于證據理論中的證據模糊主要來自于各子集的模糊度,根據信息論的觀點,子集中元素的個數越多,子集的模糊度越大。(3)基本概率分配函數的微小變化會使組合結果產生急劇變化,反映了證據理論的不穩定性和對基本概率分配函數的敏感性。(4)證據損失問題,在證據融合分析中,證據損失是普遍存在的,如果證據損失比較小,或是證據沖突比較小,則有可能帶來證據融合結果的誤差;但如果證據沖突比較嚴重,則有可能帶來結論的錯誤,所以對于證據損失須要進行合理分析,減少因為證據損失帶來的潛在風險。導致證據損失的主要原因有證據兼容性定義不夠準確和組合損失等[6]。
在同時考慮證據間的相關性、沖突以及證據損失問題的前提下,對D-S合成規則進行改進,以適應肉類食品安全分析過程。證據的相關性包括獨立、完全相關和部分相關等3種。證據的相關性可通過屬于相同信息源的焦點元素來度量,假設獲得的證據為ei,ei包含新焦元A,引入1個熵定義來描述證據信息量的大小[7]。
定義1:證據ei的熵值表示如公式(1)所示 。
式中:|A|為焦元A的勢;m(ei)為ei中包含的焦元個數。
假設存在2個證據e1和e2,其基本概率分布為m1和m2,其焦元分別為A1和A2,如果e1和e2是相關證據,則e1中的部分焦元和e2中的部分焦元必然是由某個證據ek產生的,稱這些焦元為相關焦元,表示為 R1,2,假設 R1,2上的基本概率分布為mr,則ek的熵值為
如果 E(e1,e2)=0,則表示 e1和 e2是相互獨立的;如果E(e1,e2)=1,則表示e1和e2是完全相關的,其他情況表示e1和e2是部分相關的。
定義2:假設存在2個證據e1和e2,且證據e1、e2的熵值表示分別為 E(e1)、E(e2),相關熵值為 E(e1,e2),則定義證據e1和e2的相關度為相關熵值和對應證據熵值的比值,即
證據沖突是由于對證據認識不全面而導致的合成誤差,在D-S合成公式中,沒有考慮因沖突信息缺失而導致的合成信息錯誤。D-S合成公式為
如果假設證據沖突是由2個焦元分別引起的,把沖突系數按照比例ω分給2個沖突的焦元,則獲得的改進合成公
假設肉類食品生產安全中建立的識別框架集合為Θ={H1,H2,…,Hn},每個證據 ei包含的節點集合 Ui={V1,V2,…,Vs},集合 Ui中每個節點 Vi的概率分布為 P(Vi),為使用D-S合成理論,首先須要對Ui的概率進行標準化,獲取對應的信任度。
證據可信情況是相對的,為描述這種情況,在計算過程中用θ來描述證據中的未知情況,如果集合Ui只包括1個節點元素Vi,尋找在Θ中和Vi對應的焦元Hi。
如果集合 Ui包括 n個節點元素 Ω={V1,V2,…,Vn},節點的概率分別為 P(V1),P(V2),…,P(Vn),則對節點概率進行標準化后的公式為
式中:焦元Hi和節點Vi相對應,結果對證據信息進行標準化后,可獲得證據中的分布信息,根據公式(8)進行證據合成得到焦元的信任函數。
通過對肉類食品生產安全進行風險分析獲取證據集合E={e1,e2,…,en},求每個證據 ei包含1組節點集合 H以及H中節點的概率。D-S證據推理首先須要確定識別框架集合,在證據合成過程中,識別框架集合的建立很重要,直接影響運算效率,識別框架集合由所有節點構成,其公式為
根據證據E,通過改進的D-S規則來確定Θ中節點的信任度,通過分析選擇具有最大信任度的節點或節點集合構成危害集,完成肉類食品生產安全風險分析。
根據已改進的證據合成理論對肉類食品安全生產過程中的風險進行分析,形成決策算法。圖2為D-S證據推理融合原理,其中 m1,m2,…,mn為證據的信任度分配,m(A)為通過改進D-S證據合成理論形成的聯合信任度分配,最后通過決策邏輯獲得融合結果。
肉類食品質量可以通過若干質量指標來表示,如細菌含量、是否有異物、抗生素含量、激素含量、是否有寄生蟲、表面變色程度、是否超過保質期等。影響肉類食品質量的不良因素較多,其中主要受操作人員、加工設備、原材料、加工方法、加工環境等因素影響[8-9]。
為驗證證據融合算法,對從某肉類生產公司采集的數據進行分析。已知識別框架U為{加工設備問題a,原材料問題b,加工環境問題c},2個獨立證據源為細菌超標m1、表面變色m2,分析得表1。
表1 證據融合試驗數據
通過應用改進的證據理論進行修改推出a、b、c的信任區間分別為[0.46,0.49]、[0.06,0.10]、[0.53,0.55]。從融合結果可以得出,改進的D-S證據合成方法,在融合過程中,融合規則既考慮到各個證據所包含的有用信息量的不同因素,又考慮組合過程中沖突部分概率的分配值,使得組合后的結論更加合理。
以表1中的試驗數據推出的3個證據為例進行合成。
設 Θ={A,B,C},3個證據為
按照權重系數的確定方法計算權重向量,得到的歸一化處理沖突向量和權重系數如表2所示。
由表2可知,證據2與證據1、證據3嚴重沖突,但證據1和證據3之間的沖突較小,證據2的權重系數較小,證據1和證據3的權重系數相差較小,利用本研究提出的合成方法進行合成,得出的合成結果如表3所示。
從表3可以得出,改進合成方法對沖突較大或完全沖突情況下的證據進行證據合并時得到的結果較符合實際情況。
表2 歸一化沖突向量和權重系數
表3 合成結果
為提高肉類食品安全質量分析的準確度,提出改進的D-S證據理論合成方法,通過對數據的分析推理形成不同的證據,利用證據合成理論對證據進行融合,完成肉類食品安全質量分析處理。通過試驗驗證分析可得出,通過證據合成規則實現肉類食品質量安全風險分析是可行的,通過安全風險分析,可提高對肉類食品追溯系統中危險因素定位的準確度。
參考文獻:
[1]洪小宇,謝 滿,陳楊楊.基于物聯網技術的食品溯源系統分析與設計[J].東莞理工學院學報,2016,23(1):7-9,19.
[2]林宇洪,林敏敏,林承操,等.基于物聯網的肉產品質量安全信息的追溯[J].華北科技學院學報,2015,12(5):98-102.
[3]趙秋月,左萬利,田中生,等.一種基于改進D-S證據理論的信任關系強度評估方法研究[J].計算機學報,2014,37(4):873-883.
[4]李文立,郭凱紅.D-S證據理論合成規則及沖突問題[J].系統工程理論與實踐,2010,30(8):1422-1432.
[5]孫 銳.基于D-S證據理論的信息融合及在可靠性數據處理中的應用研究[D].成都:電子科技大學,2011.
[6]石 波,謝小權.基于D-S證據理論的網絡安全態勢預測方法研究[J].計算機工程與設計,2013,34(3):821-825.
[7]江金娜.基于D-S證據理論的多傳感器決策級圖像融合的算法研究[D].哈爾濱:哈爾濱理工大學,2015.
[8]袁彥彥,王興芬,楊 浩.基于關聯規則技術的肉類食品冷鏈物流質量安全保障因素發現及質量安全預警模型[J].物流技術,2015,34(21):182-185.
[9]李 丹,王守偉,臧明伍,等.我國肉類食品安全風險現狀與對策[J].肉類研究,2015,29(11):34-38.