范志文, 光翠娥*, 干建平
(1. 食品科學與技術國家重點實驗室,江南大學,江蘇 無錫214122;2. 黃岡師范學院 經濟林木種質改良與資源綜合利用湖北省重點實驗室/大別山特色資源開發湖北省協同創新中心,湖北 黃岡438000)
醬牛肉是我國歷史悠久的佳肴, 因色澤鮮嫩、味道鮮美,營養價值高而深受人們喜愛。 醬牛肉的制作大多采用傳統手工制作, 導致醬牛肉在生產、加工、運輸、銷售過程中極易被食源性病原菌污染,從而引發食品安全問題,給消費者的健康帶來不可估量的安全隱患。 金黃色葡萄球菌廣泛存在于自然界中,是造成細菌性食物中毒的主要原因,極易造成食品污染[1]。 曹軍等[2]人對無錫市場的醬鹵肉進行監測,1186 件熟制品中有61 件檢出金黃色葡萄球菌,檢出率高達5.14%;許振偉等[3]人對上海市場所監測的396 份散裝熟食肉制品進行金黃色葡萄球菌及腸毒素分析,樣品中金黃色葡萄球菌陽性數70份檢出率為17.70%;2015年在三門峽市監測的60份網店食品中,30 份自制熟肉中金黃色葡萄球菌3份,檢出率為10.00%[4]。由此可見醬鹵肉制品中金黃色葡萄球菌的污染比較嚴重。
預測微生物學是運用微生物學、數學、統計學及計算機學建立數學模型,用數學語言預測和描述食源性微生物在特定環境條件下的生長和死亡規律的學科[5-6]。由Whiting 等[7]提出的基于變量類型的分類方法將預測微生物數學模型分為一級模型、二級模型和三級模型,其中一級模型描述了微生物數量與時間的函數關系。在眾多初級模型中,Gompertz方程能有效描述微生物生長,在腐敗細菌生長動力學研究中被廣泛使用[8-11]。但由于模型中的參數是憑經驗建立并無實際意義,使得模型在復雜的環境因子中很難確切地進行預測[12-13]。
人工神經網絡是模擬大腦神經網絡的結構和功能,將多個處理單元相互連接,進行自組織、自適應、自學習,從而模擬人類的學習、認知、智能的過程[14]。 誤差反向傳播神經網絡是一種單向傳播的多層前饋網絡,它采用典型的有教師學習方式來進行預測和分類問題的處理。 一個訓練好的反向傳播神經網絡,能夠逼近任何自變量和因變量之間的函數關系[15]。 不需要考慮自變量是否滿足正態性及變量間獨立等條件, 可識別變量間復雜的非線性關系,尤其是用現有統計方法無法達到目的或效果不好時,采用此模型往往收到很好的效果[16-17]。 作者將預測微生物學應用到醬牛肉制品中,利用人工神經網絡建立模型, 揭示金黃色葡萄球菌的生長變化規律, 為醬牛肉中的金黃色葡萄球菌控制提供依據,從而降低食源性疾病發生的可能性。
金黃色葡萄球菌:(CMCC26003): 北納創聯生物技術有限公司產品; 醬牛肉: 市售;Baird-Parker平板、亞碲酸鉀卵黃菌增液:上海谷研實業有限公司產品。
CHP-80 培養箱: 上海市三發科學儀器有限公司產品;DSX-280B 手提式壓力蒸汽滅菌器:上海申安醫療器械廠產品;GZX-9070 MBE 電熱鼓風干燥箱:上海博訊實業有限公司醫療設備廠產品;SF-CJ-1A凈化工作臺:上海三發科學儀器有限公司產品。
1.3.1 菌種的活化和醬牛肉的預處理在無菌條件下將于4 ℃冷藏的凍干菌粉去除標簽,用體積分數75%乙醇擦拭管壁,將0.3 mL 左右無菌水注入凍干管中,吹打,充分溶解成菌懸液。取0.2 mL 菌懸液加入50 mL 的滅菌營養肉湯在36 ℃下培養48 h,然后進行平板劃線分離置于36 ℃培養箱中培養,傳代2次。
醬牛肉的預處理:將醬牛肉除去筋骨,分割成約1 cm3的小塊,置于培養皿中,每份10 g,滅菌,用無菌封口膜密封培養皿貯藏待用。
1.3.2 不同溫度下生長曲線的測定挑取一環金黃色葡萄球菌菌落,浸入裝有10 mL 滅菌生理鹽水試管中振蕩, 制成濃度為107~108CFU/mL 的菌懸液。 用生理鹽水稀釋菌懸液,制成染菌濃度分別為102、103、104CFU/mL 的菌懸液, 取不同接種濃度的菌液1 mL 勻噴灑在處理好的醬牛肉中, 分別置于15、25、36 ℃下培養。 其中36 ℃下2 h 取樣測量一次,25 ℃下3 h 取樣一次,15 ℃下12 h 取樣一次。每次10 g 樣品置于裝有90 mL 無菌生理鹽水的錐形瓶中振蕩,依次進行10 倍稀釋。 選取2個稀釋度適宜的樣品, 每次吸取2個100 μL 樣品加入Baird-Parker 平板中,用涂布棒涂布[18]。 倒置于36 ℃培養箱中培養24~48 h。
1.3.3 反向傳播神經網絡的建立反向傳播神經網絡是一種基于在誤差面上尋找最小誤差原理設計的算法,它通過激活函數產生輸出信號,據定義的損失函數計算真實值和預測值之間的誤差來進行權值的修正[19]。 第一層為輸入層,含有3個神經元,分別代表溫度、接菌量及保存時間;第二層為隱含層, 用于處理輸入信息與輸出結果的非線性關系;第三層為輸出層,含有一個神經節點,代表輸入層設定條件下的細菌量。
1) 訓練集的選取 反向傳播神經網絡在使用前對它進行訓練,根據訓練數據調整神經網絡中的權值矩陣,直到迭代一定的次數后停止學習。對于1個參數,至少要10個以上訓練樣本,訓練集太小,無法被網絡學習[20]。 本實驗3個參數有117個樣本滿足要求。 在輸入前將樣本隨機打亂,并按照8∶8∶1的比例隨機分配到訓練、測試和驗證集中。
2) 數據歸一化 不同評價指標的量綱常處于不同的數量級, 為消除特征數據之間的量綱影響,引入歸一化。 原始數據經歸一化處理后,各指標處于同一數量級,范圍在0~1 內。 計算如公式(1):

式中:t' 為歸一化數值;t 為實際測定值;tmin為實際測定中最小的一組數值;tmax為實際測定中最大的一組數值。
3) 隱藏層個數和神經元節點數的確定 隱藏層結點數取決于輸入、輸出的非線性程度,節點數如過多會導致過擬合現象,降低模型的準確性。 根據樣本容量選擇隱藏層數測試范圍為1~3,其中,隱藏層個數為1 時,第一層神經元個數為10~30,步長為2,共15個網絡模型;隱藏層為2 時,第一層神經元個數為20~40,第二層神經元為10~35,步長為5,共30個網絡模型;隱藏層為3 時,第一層、第二層神經元個數分別為20~35,第三層神經元為10~25,步長為5,共64個網絡模型。 比較驗證集上均方誤差(MSE) 的大小來確定隱藏層個數和神經元節點數,每個網絡結構進行3次平行測試,結果取平均值。
4) 模型參數的確定 利用Python 軟件建立反向傳播神經網絡。 為防止反向更新時梯度消失,采用Relu 為網絡結構隱藏層的激活函數,歸一化的結果在0~1 之間, 輸出層的激活函數采用Sigmoid,Dropout 概率為0.5,學習率為0.001,每一輪迭代次數為1500, 每5個樣本更新一次梯度。 其中公式(2)為Relu 函數,公式(3)為Sigmoid 激活函數:

式中:x 為神經元單元的輸出值。
1.3.4 修正的Gompertz 模型的建立利用Matlab軟件分析不同溫度和初始接菌量下金黃色葡萄球菌在醬牛肉中的生長數據,建立生長模型。 修正的Gompertz 模型被廣泛應用于擬合微生物量與時間之間的關系。 修正的Gompertz 模型[21]如公式(4):

式中:lg(Nt)為t 時刻細菌的對數值;lg(N0)為初始細菌的對數值;lg(Nmax)為穩定期時最大細菌數的對數值;tlog為延滯期;μmax為最大比生長速率。
1.3.5 模型的評估與驗證采用MSE、平方根誤差(RMSE)、偏差因子(Bf)和準確因子(Af)來評價模型的可靠性。 其中:

式中:pre 為用模型擬合出的生長數據,即預測值;obs 為實際實驗中所測的數據值,即實際值;n 為樣本數量。
MSE 評價數據變化程度,值越小,說明模型擬合實驗數據的能力強;RMSE 衡量預測準確度,說明模型預測值的離散程度;Af衡量預測值和實際值之間的接近程度,Af>1, 越接近于1 表示模型越準確;Bf表示預測值和實際值之間的偏差,Bf>1,說明預測值偏高,Bf<1,說明預測值偏低。
人工神經網絡數據分為訓練集、驗證集和測試集,為獲得最優的神經網絡結構,需確定隱含層的層數和神經元節點數。 依次將訓練數據代入隱含層為1~3、節點數為10 到35 的不同的隱藏層網絡中,選擇驗證集上MSE 最小時的節點數作為最優結構。隱 藏 層 數1、2、3 分 別 對 應 的MSE 值 為0.0120、0.0026、0.0029,由此可知當隱藏層數為2 時,MSE值最小, 預測效果優于隱藏層數為1 和3 的模型,故確定該模型的隱藏層數為2。從表1 可看出,當第一層、 第二層神經元節點分別為35、30 時,MSE 值最小,模型預測效果最好。 因此最終的反向傳播網絡模型結構為2-35-30,網絡模型結構見圖1。

表1 不同神經元個數的MSE 值Table1 MSE value of different neurons

圖1 預測醬牛肉中金黃色葡萄球菌生長的人工神經網絡結構圖Fig. 1 Artificial neural network structure for predicting the growth of Staphylococcus aureus in sauce beef
圖2 為不同溫度(15、25、36℃)和初始菌數(102、103、104CFU/mL) 組合條件下金黃色葡萄球菌在醬牛肉中生長的一級模型和人工神經網絡模型擬合曲線。 可以看出,隨著培養時間的延長,金黃色葡萄球菌的濃度也隨之增加,且遵循S 形曲線,培養一定時間后金黃色葡萄球菌的生長都趨于穩定。 以修正的Gompertz 模型為基礎,得到組合條件下醬牛肉中金黃色葡萄球菌的生長動力學參數最大比生長速率μmax和延滯期tlag,如表2 所示。而神經網絡沒有確定的函數表達式,無法得到μmax和tlag的值,只能從圖中直觀表現出細菌的生長狀態。 從表2 可以看出,同一初始接菌量條件下,隨著溫度升高,μmax逐漸增大,15 ℃(0.0524、0.0231、0.0137 h-1)<25 ℃(0.3591、0.2449、0.1488 h-1)<36 ℃(0.4895、0.4459、0.2958 h-1),而延滯期tlag的大小隨著溫度上升呈現下降趨勢,15 ℃(49.67、47.74、46.62 h)>25 ℃(8.5894、7.5110、7.2930 h)>36 ℃(6.4820、6.2551、5.2020 h)這說明溫度越高金黃色葡萄球菌的生長速度越快,延滯期越短;同一溫度條件下,最大生長速率和延滯期均隨著初始接菌量濃度的增加而降低,但變動的幅度小于不同溫度組合條件下的最大生長速率和延滯期的數值,這說明不同溫度和初始接菌量濃度均影響了醬牛肉中的金黃色葡萄球菌的生長,但溫度的影響更大。



圖2 不同溫度和初始接菌量條件下金黃色葡萄球的生長Fig. 2 Growth of Staphylococcus aureus under different temperatures and initial inoculation conditions
2.3.1 模型評估在利用訓練數據建模的過程中,傳統模型和人工神經網絡模型都獲得較好的擬合度,RMSE、Af及Bf均在理想范圍。 與人工神經網絡模型相比,傳統模型偏差較大,由表3 可以看出,反向傳播神經網絡模型的RMSE 值均比傳統模型的RMSE 值小,這些在Af及Bf上也表現出來,反向傳播神經網絡模型與修正的Gompertz 模型的Af均大于1 且反向傳播神經網絡模型的Af相比更接近1,說明前者預測的更接近實際值; 從得到的Bf值看出,反向傳播神經網絡模型與修正的Gompertz 模型的預測值均在真實值附近上下波動, 由修正的Gompertz 模型得到的預測值比實際值偏小,由反向傳播神經網絡模型得到的預測值偏差更小,說明該模型的預測效果較修正的Gmopertz 模型更好。
2.3.2 模型驗證結合在22、29 ℃條件下獲得的實驗數據,對建立的反向傳播神經網絡模型進一步驗證其準確性,結果如表4 所示。 從表中可以看出,驗證值與預測值的誤差均在可接受范圍,說明建立的反向傳播神經網絡模型可預測金黃色葡萄球菌在醬牛肉中的生長。

表2 修正的Gompertz 模型擬合得到的金黃色葡萄球菌生長參數Table 2 Growth parameters of Staphylococcus aureus obtained by modified Gompertz model
作者建立的預測模型適合預測多種環境條件下金黃色葡萄球菌在醬牛肉中的生長情況。 在預測準確性方面, 反向傳播神經網絡優于修正的Gompertz 模型。這是因為修正的Gompertz 模型是經驗模型, 通常需要進行校準避免誤差的不確定性,當影響金黃色葡萄球菌的生長因素增多時,傳統模型會變得復雜,準確率也會降低,因此很難準確地反映環境因素對生長預測的影響。 雖然反向傳播神經網絡模型無法給出最大比生長速率和延滯期,但該模型在存在不確定數據和測量誤差的情況下,會比經驗模型產生更準確地預測。 在通用性方面,修正的Gompertz 模型局限性很大,多個影響因素需要多次建模,而反向傳播神經網絡只需要在模型的輸入值中添加所研究的影響因素即可實現預測,大大提高了模型的適用性。 由于醬牛肉的生產、運輸、銷售過程中溫度并非一成不變,在以后的研究中可以考慮在波動溫度條件下運用人工神經網絡模型來實現更加精確的預測。

表3 修正的Gompertz 模型與反向傳播神經網絡比較與評價Table 3 Comparisonand assessment of modified Gompertz model with back propagation neural network

表4 反向傳播神經網絡模型驗證的擬合度指標Table 4 Goodness of fit of verified back propagation neural network models