付碩 劉淑梅 張金龍 張曉瑞 韓方凱



摘 要:構建精確度高、速度快的預測模型對推動電子鼻技術走向實際應用具有重要的意義。研究以牛肉為對象,采集不同微生物污染程度牛肉樣本的電子鼻傳感器信息作為模型的輸入,以樣本微生物污染量化指標細菌總數(Total Viable Counts,TVC)為輸出變量,構建定量預測模型。在模型構建時,對比采用線性的偏最小二乘法(Partial Least Squares Regression,PLS)和快速人工神經網絡極限學習機(Extreme Learning Machine,ELM)算法。結果顯示,ELM模型預測性能優(yōu)于PLS模型,其訓練集和測試集預測誤差分別為
0.040 lgCFU·g-1和0.047 lgCFU·g-1,相關系數分別為0.976和0.972。所構建ELM模型能滿足實際需求,可在牛肉品質檢測與控制方面發(fā)揮積極作用。
關鍵詞:牛肉;電子鼻;模式識別模型;快速檢測
Construction of Quantitative Prediction Model of Beef Microbial Contamination Based on Electronic Nose
FU Shuo1, LIU Shumei1, ZHANG Jinlong1, ZHANG Xiaorui2, HAN Fangkai3
(1.Anhui Canca Security Environment Technology Co., Ltd., Suzhou 234000, China;
2.Jiangsu University, Zhenjiang 212013, China; 3.School of Suzhou, Suzhou 234000, China)
Abstract: The construction of a high precision, high speed prediction model for promoting the electronic nose technology to the practical application has important significance. Research is an object with beef, collect different degree of microbial contamination of beef samples of electronic nose sensor information as input of the model, to sample microbial contamination to quantify the total bacterial count of the quantitative indicators as the output variable, build the quantitative prediction model. In the model building, compared with the linear partial least squares and artificial neural network fast extreme learning machine algorithm. The results show that the predictive performance of ELM model is better than that of PLS model. The predictive errors of the training set and test set are 0.040 lgCFU·g-1 and 0.047 lgCFU·g-1, and the correlation coefficients are 0.976 and 0.972, respectively.The ELM model can meet the actual demand and play an active role in beef quality detection and control.
Keywords: beef; electronic nose; pattern recognition model; rapid detection
致腐菌導致食品腐敗變質,易產生有害物質,如小分子含氮化合物組胺等,直接威脅食品安全。因此,對食品中微生物污染狀況的監(jiān)測,對保障膳食安全極為重要。活菌總數(Total Viable Counts,TVC)是定量描述食品微生物污染狀況的指標。然而TVC的常規(guī)檢測方法,即平板計數法通常需要經過48 h的搖床培養(yǎng),待平板上微生物生長、繁殖成可觀察的菌落后,再對菌落進行計數,經過換算,得到最終結果。平板計數法耗時、費力[1],無法快速反映食品微生物污染狀況,以及時調整食品保藏、銷售、加工等策略。
常見的食品快速檢測方法,如電子舌[2]、電子鼻[3]等智能仿生檢測方法以及近紅外[4]、高光譜[5]等光譜學檢測方法等,均已應用于不同種類食品保藏期間TVC的定量預測。然而,這些方法得到的電化學傳感器或光譜學信號,受食品基質干擾嚴重[6],因此建立快速檢測方法所得到的傳感器信號與TVC之間精確度較高的定量預測模型,成為食品快速檢測方法應用于生產實際的限制性因素之一。基于此,本研究以最常見的金屬氧化物半導體型電子鼻傳感器數據為輸入,對比采用偏最小二乘法(Partial Least Squares Regression,PLS)和快速人工神經網絡極限學習機(Extreme Learning Machine,ELM)算法構建牛肉貯藏期間TVC快速定量預測模型的精確度,以期推進食品快速檢測技術在食品生產實際中的應用。
1 材料與方法
1.1 電子鼻數據
本研究數據來源于DEDY等[7]于2018年發(fā)表在《Data in Brief》的數據論文。所用的電子鼻系統(tǒng)是基于金屬氧化物半導體型氣敏傳感器陣列,該系統(tǒng)包含9根MOS傳感器。電子鼻試驗在密閉樣品室下持續(xù)36 h,每分鐘采集1次傳感器信號,共計得到
2 160組電子鼻傳感器陣列數據。樣品共5組,最終得到5×2 160行9列的數據矩陣用于本研究的模型構建。電子鼻試驗期間,牛肉樣品的TVC從3 lgCFU·g-1以下(微生物污染程度輕微)增殖到近5 lgCFU·g-1(微生物污染程度嚴重)。圖1展示出所有樣品在電子鼻測試期間傳感器數據及TVC數值,包含原始數據及歸一化至[0,1]后的數據。
1.2 模型構建方法及性能評價指標
研究以電子鼻傳感器所有數據為輸入,以對應樣本TVC實測值為輸出,對比采用線性的PLS和非線性的ELM構建基于電子鼻技術的牛肉貯藏期間TVC定量預測模型。選擇ELM的主要原因是其計算速度顯著快于常見的BP-人工神經網絡算法[8]。
在模型的構建過程中,隨機選取1/3的樣本作為測試集,其余樣本作為訓練集,且在PLS和ELM模型構建過程中保持一致。評估所采用的定量預測模型,本文依賴以下指標。①相關系數(r)。該系數衡量電子鼻預測的牛肉TVC值與實際值之間的相關性,r值越接近1,證明預測的相關性越高,具體計算方法見式(1)。②預測均方根誤差(Root Mean Square Error,RMSE)也作為關鍵指標,它用于測量電子鼻預測的牛肉TVC值與實際值的誤差程度,RMSE越低,代表預測精度越高,反之則預測精度較差。
式中:yi和yi分別為樣本集(訓練集和預測集)中第i個牛肉樣本TVC的實測值和預測值,lgCFU·g-1;y為樣本集中所有牛肉樣本TVC實測值的平均值,lgCFU·g-1[9];n為樣本數。
式中:yi和yi分別為預測集中第i個牛肉樣本TVC的實測集和預測值,lgCFU·g-1;n為預測集樣本數[9]。
2 結果與分析
2.1 PLS模型結果
PLS用于處理多個自變量和一個或多個因變量之間的關系,在解決多重共線性和高維數據問題時優(yōu)勢明顯。PLS通過找到自變量和因變量之間的最大協(xié)方差來構建線性回歸模型,用于預測未知樣本的因變量值。
基于PLS的基礎理念,模型預測能力受到PLS主成分數量的顯著影響。因此,在構建PLS模型過程中,對輸入的PLS主成分數進行優(yōu)化是必要的。這一優(yōu)化過程采用了“留一法”交叉驗證。這種驗證方法的核心思想是將每個樣本視為驗證集,用剩下的(N-1)個樣本來創(chuàng)建PLS模型,然后運用驗證集來檢測新構建的PLS模型,以預測值和實測值誤差的均值作為優(yōu)化PLS主成分數的指標。如果對應的RMSE值最小,則認為當前條件下的PLS模型是最優(yōu)的。PLS主成分篩選結果如圖2所示。
從圖2可以看出,當主成分因子數為8時,PLS模型的RMSE最低,為0.319 7 lg CFU·g-1。此條件下,PLS模型訓練集和測試集對魚細菌總數的預測值和實測值之間的相關關系如圖3所示,其測試集相關系數為0.937,預測RMSE為0.324 lgCFU·g-1。
2.2 ELM模型結果
ELM是一種新型的單隱藏層前饋神經網絡算法,具有出色的泛化性能和極快的學習速度。根據ELM理論,對于一個特定的模式識別問題,隱含層的神經元個數和傳遞函數可供篩選和優(yōu)化,以獲得預測性能較優(yōu)的預測模型。鑒于人工神經網絡隱含層神經元個數優(yōu)化范圍尚無統(tǒng)一范式可供遵循,本研究采用典型的試湊法,設定范圍為[1,50],優(yōu)化ELM隱含層神經元個數。在ELM隱含層傳遞函數的篩選上,對比采用3種典型的函數[8],公式為
圖4顯示了在隱含層神經元個數[1,50]范圍內,3種傳遞函數條件下,ELM模型訓練集和測試集的相關系數。從圖4中可以看出,當選擇Sin函數作為傳遞函數,且隱含層神經元個數為45的時候,ELM預測性能最佳,其訓練集相關系數為0.976,測試集相關系數為0.972。
最優(yōu)ELM模型的基本結構為9-45-1,包含9個電子鼻傳感器輸入變量,45個單隱含層神經元,1個樣品TVC預測輸出變量。模型訓練集和測試集對牛肉樣本TVC的預測值及實測值依樣本序號排列結果如圖5所示,此時訓練集和測試集的RMSE分別為0.040 lgCFU·g-1和0.047 lgCFU·g-1,優(yōu)于PLS模型。
3 討論
牛肉富含水分、蛋白質、脂肪等營養(yǎng)成分,極易變質腐敗。微生物的生長繁殖是引發(fā)牛肉變質的主要原因。微生物生長繁殖過程中,釋放出大量的蛋白酶、脂肪氧化酶、過氧化物酶,使牛肉中的蛋白質和脂肪等營養(yǎng)元素分解為低分子化合物。蛋白質會被水解成肽,進而分解成氨基酸。氨基酸經過脫羧化、脫氨化、脫硫化等作用會生成相應的氨、小分子胺、有機酸等。脂質會在水解作用下生成游離脂肪酸、甘油、甘油酯和甘油二酯等。脂肪酸還可以進一步分解成酮酸或酮等[10]。這些產物中的烴類、酮類、醇類、醛類、酸類、酯類、含硫及雜環(huán)化合物等是牛肉保藏期間產生揮發(fā)性有機化合物的主要成分[11]。電子鼻傳感器可以識別食品揮發(fā)性成分,進而實現(xiàn)微生物污染狀況的間接預測。
從構建的PLS模型及ELM模型的預測性能來看,ELM模型的訓練集和測試集相關系數分別為0.976和0.972,高于PLS模型的0.938和0.937,ELM模型的訓練集和測試集的預測誤差分別為0.040 lgCFU·g-1和0.047 lgCFU·g-1,均明顯低于PLS模型的0.319 7 lgCFU·g-1和0.324 lgCFU·g-1。主要是因為電子鼻傳感器信號與預測目標TVC值之間是非常復雜的非線性關系,這是由電子鼻傳感器特性所決定的,即傳感器非特異性,且相互之間交互敏感,對食品揮發(fā)性物質的敏感性存在一定程度的交叉。ELM具有出色的自學習和自適應能力,獲得的結果優(yōu)于線性的PLS算法[12]。
4 結論
本文研究構建了基于MOS型電子鼻信號處理的牛肉貯藏期間TVC定量預測模型。結果表明,非線性的ELM算法獲得的結果較線性的PLS算法好,其訓練集或測試集對樣本TVC的預測值與實測值之間的相關系數均高于0.97,預測誤差均低于或等于0.04 lgCFU·g-1。ELM模型預測精度高,運算速度快,能夠滿足實際需求,可為牛肉質量安全控制提供借鑒。
參考文獻
[1]孫穎穎,董鵬程,朱立賢,等.食源性致病菌快速檢測研究進展[J].食品發(fā)酵工業(yè),2020,46(17):264-270.
[2]HAN F K,HUANG X Y,TEYE E,et al.Quantitative analysis of fish microbiological quality using electronic tongue coupled with nonlinear pattern recognitionalgorithms[J].Journal of Food Safety,2015,25(3):336-344.
[3]DEDY R W,RIYANARTO S,ENNY Z.DWTLSTM for electronic nose signal processing in beef quality monitoring[J].Sensors and Actuators B: Chemical,2021,326:128931.
[4]LIN M S,MOJGAN M,MURAD A,et al.Rapid near infrared spectroscopic method for the detection of spoilage in rainbow trout (oncorhynchus mykiss) fillet[J].Journal of Food Science,2006,71(1):18-23.
[5]HUANG L,ZHAO J W,CHEN Q S,et al.Rapid detection of total viable count (TVC) in pork meat by hyperspectral imaging [J].Food Research International,2013,54(1):821-828.
[6]SANCHEZ P D C,AROGANCIA H B T,BOYLES K M,et al.Emerging nondestructive techniques for the quality and safety evaluation of pork and beef: recent advances, challenges, and future perspectives [J].Applied Food Research,2022,2(2):100147.
[7]DEDY R W,RIYANARTO S,ENNY Z.Electronic nose dataset for beef quality monitoring in uncontrolled ambient conditions [J].Data in Brief,2018(21):2414-2420.
[8]HAN F K,JOSHUA H A,MARWAN M A R,et al.Machine-learning assisted modelling of multiple elements for authenticating edible animal blood food[J].Food Chemistry,2022(14):100280.
[9]HAN F K,HUANG X Y,JOSHUA H A,et al.Fusion of a low-cost electronic nose and Fourier transform near-infrared spectroscopy for qualitative and quantitative detection of beef adulterated with duck[J].Analytical Methods,2022,14(4):417-426.
[10]HAN F K,HUANG X Y,TEYE E,et al.Nondestructive detection of fish freshness during its preservation by combining electronic nose and electronic tongue techniques in conjunction with chemometric analysis[J].Analytical Methods,2014,6(2):529-536.
[11]孟一,張玉華,姜沛宏,等.牛肉貯藏過程中的揮發(fā)性成分分析[J].食品工業(yè)科技,2016,37(16):61-65.
[12]HAN F K,HUANG X Y,TEYE E.Novel prediction of heavy metal residues in fish using a low-cost optical electronic tongue system based on colorimetric sensors array[J].Journal of Food Process Engineering,2019,42(2):e12983.