摘要:三文魚是一種營養(yǎng)豐富且深受消費者歡迎的食物,目前,國內(nèi)市場商品化品種主要有大西洋鮭和虹鱒。在商業(yè)利益驅(qū)使下,鮭魚之間的摻假替代事件時有發(fā)生,這些欺詐行為不僅損害消費者的經(jīng)濟利益,甚者還危害健康。因此,在日益復(fù)雜和全球化的食品供應(yīng)鏈中開發(fā)一種快速、環(huán)保且可現(xiàn)場檢測的方法尤為重要。針對收集的6個國家190份鮭魚樣品(其中大西洋鮭81份;虹鱒魚109份),按"2∶1"的比例分配到訓(xùn)練集和測試集。以11種光譜數(shù)據(jù)預(yù)處理,結(jié)合偏最小二乘判別分析(Partial"Least"Squares"Discriminant"Analysis,PLS-DA)、反向傳播人工神經(jīng)網(wǎng)絡(luò)(Back"Propagation"Artificial"Neural"Network,BP-ANN)和極限學(xué)習(xí)機(Extreme"Learning"Machine,ELM)3種有監(jiān)督模式識別方法進行判別模型構(gòu)建。確定最佳建模方法為PLS-DA,在最佳潛在變量為23時,模型的預(yù)測集正確率為100%。這表明近紅外光譜與PLS-DA相結(jié)合是一種潛在的三文魚物種現(xiàn)場無損快速鑒別的工具。
關(guān)鍵字:近紅外光譜"大西洋鮭"虹鱒"真?zhèn)闻袆e
Nondestructive"Authenticity"Identification"Analysis"of"\"Salmon\""Based"on"Near-Infrared"Spectroscopy
BA"Haoran""WU"Zhiqiang""DAI"Jinran""JI"Chao""ZHAO"Liangjuan""""""""ZHENG"Wenjie*
Tianjin"Key"Laboratory"of"Animal"and"Plant"Resistance,"College"of"Life"Sciences,"Tianjin"Normal"University,"Tianjin,"300387"China
Abstract:"Salmon"is"a"nutritionally"rich"and"popular"food"among"consumers,"with"the"main"commercially"available"varieties"in"the"domestic"market"being"Atlantic"salmon"and"rainbow"trout."Driven"by"commercial"interests,"salmon"adulteration"and"substitution"incidents"have"been"frequent."These"fraudulent"practices"not"only"damage"consumers'"economic"interests"but"may"also"pose"health"risks."Therefore,"developing"a"fast,"environmentally"friendly,"and"on-site"detection"method"is"particularly"important"in"the"increasingly"complex"and"globalized"food"supply"chain."In"this"study,"190"salmon"samples"were"collected"from"six"countries"(81"Atlantic"salmon"and"109"rainbow"trout),"which"were"split"into"training"and"testing"sets"at"a"2:1"ratio."Eleven"spectral"data"preprocessing"methods"combined"with"three"supervised"pattern"recognition"techniques:"Partial"Least"Squares"Discriminant"Analysis"(PLS-DA),"Backpropagation"Artificial"Neural"Network"(BP-ANN),"and"Extreme"Learning"Machine"(ELM),"were"used"to"construct"discriminant"models."The"best"modeling"method"was"identified"as"PLS-DA,"with"the"optimal"number"of"latent"variables"(Lvs)"being"23,"achieving"a"prediction"accuracy"of"100%"for"the"test"set."This"indicates"that"the"combination"of"near-infrared"spectroscopy"and"PLS-DA"is"a"potential"tool"for"on-site,"nondestructive,"and"rapid"identification"of"salmon"species.
Key"Words:"Near-infrared"spectroscopy;"Salmo"salar;"Oncorhynchus"mykiss;"Authenticity"identification
隨著食品質(zhì)量安全問題的日益突出,物種替代現(xiàn)象已經(jīng)成為全球性的公共健康問題,嚴(yán)重影響了消費者的健康與市場的公正性[1]。特別是在海鮮行業(yè),物種替代行為層出不窮,魚類物種的替代已成為常見問題。例如:一些鮭魚在市場上經(jīng)常被較為便宜的虹鱒魚、大馬哈魚等替代,由于外形相似且物種關(guān)系緊密,傳統(tǒng)的形態(tài)學(xué)鑒別方法已無法有效區(qū)分它們[2]。因此,迫切需要開發(fā)高效、準(zhǔn)確的檢測技術(shù)來打擊魚類市場中的欺詐行為。
目前,傳統(tǒng)的物種鑒別方法主要依賴形態(tài)學(xué)特征,但對于切割或加工后的魚肉,傳統(tǒng)方法的效果大打折扣[3]。分子檢測技術(shù)(如實時熒光PCR和DNA條形碼)雖然可以提供物種識別的可靠性,但這些方法操作煩瑣、成本高、耗時長,且需要專業(yè)的設(shè)備和人員,限制了其在實際應(yīng)用中的普及。近紅外光譜技術(shù)作為一種非破壞性、快速、低成本且高效的分析工具,近年來展現(xiàn)出了巨大的應(yīng)用潛力,其已被廣泛應(yīng)用于咖啡、人參[4]和三七等植物的檢測。此外,其還在動物性食品的真實性鑒別中取得了顯著進展,如魚類物種鑒別、品質(zhì)控制和安全檢測。
盡管近紅外光譜技術(shù)已在魚類種類鑒別中有所應(yīng)用,但在針對大西洋鮭和虹鱒的物種鑒定研究中,相關(guān)文獻尚不多見。因此,本研究旨在利用近紅外光譜技術(shù)開發(fā)一種能夠快速、準(zhǔn)確區(qū)分大西洋鮭和虹鱒的檢測方法。該方法不僅能為魚類物種鑒別提供新的技術(shù)途徑,也能為鮭科魚類的市場監(jiān)管和食品安全提供有力的技術(shù)支持。
1"材料和方法
1.1"樣品收集與處理
虹鱒樣品共109個,來自中國青海、山東、吉林和甘肅4個省,由當(dāng)?shù)氐酿B(yǎng)殖場公司提供。大西洋鮭樣品共81個,來自加拿大、丹麥、英國、智利和挪威,由當(dāng)?shù)氐酿B(yǎng)殖場公司提供。具體樣品地理來源信息見表1,樣品總數(shù)共190個。
魚樣品均為新鮮整魚,用干冰儲藏運輸至實驗室,每條魚掏空內(nèi)臟,清洗魚表面,剔除魚骨,選取魚樣品身體背鰭附近部位,切成厚約5"cm"×4"cm×1"cm的魚塊,用于光譜測定,如圖1所示。
1.2"近紅外光譜測量
使用傅里葉變換近紅外光譜儀的積分球,通過直徑5"cm的樣品杯采集光譜。首先,進行參數(shù)的設(shè)置:掃描范圍為4"000~1"0000"cm-1;分辨率為8"cm-1;掃描信號次數(shù)為32次。設(shè)置參數(shù)后,預(yù)熱30"min,使光源能量穩(wěn)定。在采集樣品光譜前,進行自動優(yōu)化增益,每個樣品掃描3次并取平均光譜,以減少誤差。
1.3"化學(xué)計量學(xué)分析
運用Matlab軟件進行光譜數(shù)據(jù)的處理和建模,Kennard-Stone算法[5]按2:1的比例將所有190份鮭科魚樣品的近紅外光譜分為包含127份樣品的預(yù)測集和包含63份樣品的預(yù)測集。訓(xùn)練集樣本光譜數(shù)據(jù)用于建立模型,預(yù)測集樣本光譜數(shù)據(jù)用于檢測模型的穩(wěn)定性和可靠性。本項實驗采用多種化學(xué)計量學(xué)方法進行建模,即運用線性的偏最小二乘判別分析(Partial"Least"Squares"Discriminant"Analysis,PLS-DA)、非線性的反向傳播人工神經(jīng)網(wǎng)絡(luò)(Back"Propagation"Artificial"Neural"Network,BP-ANN)、極限學(xué)習(xí)機(Extreme"Learning"Machine,ELM)這三種化學(xué)模式識別方法進行實驗數(shù)據(jù)的計算,并對每個模型進行優(yōu)化和對比,得到最優(yōu)的溯源模型。為提高模型的鑒別能力,采用了SG平滑、一階導(dǎo)數(shù)(First"Derivative,"FD)、二階導(dǎo)數(shù)(Second"Derivative,"SD)、多元散射校正(Multiplicative"Scatter"Correction,"MSC)、標(biāo)準(zhǔn)正態(tài)變換(Standard"Normal"Variate,"SNV)等光譜預(yù)處理方法,對原始光譜數(shù)據(jù)進行了優(yōu)化。
2"結(jié)果與討論
2.1"近紅外光譜分析
收集的近紅外光譜如圖2所示,目視粗略比較大西洋鮭和虹鱒光譜,以檢測物種特異性樣品組之間的差異。兩組樣品的平均光譜如圖3所示,以可視化特定于物種的差異[6]。
虹鱒魚光譜約在5"022"cm-1、5"869"cm-1、6"829"cm-1和8"233"cm-1處有差異性波峰。其中,5"869"cm-1和8"533cm-1"處的波峰差異性較大,有明顯的吸收峰。波峰差異性說明虹鱒和大西洋鮭樣品中有機物的官能團有差異,其中:5"560"cm-1和8"300"cm-1"附近是C-H脂肪族基團第一和第二伸縮泛音的吸收帶主導(dǎo),它們可以指示脂肪等的含量信息。在8"533"cm-1和"6"829"cm-1"范圍內(nèi)的吸收峰是O-H鍵的一級倍頻和合頻,在4"900~5"170"cm-1內(nèi)是N-H鍵(一級胺和三級胺)伸縮振動產(chǎn)生的合頻峰,可以反應(yīng)鮭科魚類與蛋白質(zhì)或氨基酸相關(guān)組分的含量信[7-8]。綜上所述,吸收峰的差異最有可能是由于虹鱒魚和大西洋鮭魚肉中脂肪含量和水分含量的差異造成的。
由于視覺觀察到的差異很小,因此進行了額外的多變量數(shù)據(jù)探索。
2.2"光譜預(yù)處理
由于測量模式、樣品狀態(tài)及其他外部物理、化學(xué)和環(huán)境因素,近紅外光譜儀生成的數(shù)據(jù)可能包含基線漂移、峰移等問題。因此,在構(gòu)建模型前,需使用一些光譜預(yù)處理消除或減少光譜中的物理現(xiàn)象,以提高信噪比,增強模型性能[9-10]。本研究采用SG、SNV、MSC、FD、SD、MSC+FD、SNV+FD、MSC+SD、SNV+SD、MSC+SG、SNV+SG共11"種方法進行光譜預(yù)處理(如圖4所示),基于不同模型的建模結(jié)果,選擇了最適的數(shù)據(jù)預(yù)處理方法。
2.3"PLS-DA
相比較主成分分析(Principal"Component"Analysis,PCA)的無監(jiān)督數(shù)據(jù)建模方式[11],PLS-DA是一種有監(jiān)督的統(tǒng)計方法。其通過投影,分別將預(yù)測變量和觀測變量投影到一個新空間,來尋找一個線性回歸模型。本質(zhì)上,其是基于偏最小二乘法(Partial"Least"Square,PLS)的部分最小二乘判別分析,用于區(qū)分兩類和更多類別的樣本,同時具備線性判別分析的分類能力又兼具PLS降維和降噪的優(yōu)勢[12]。在交叉驗證過程中,當(dāng)分類中的交叉驗證均方根誤差(Root"Mean"Square"Error"of"Cross-Validation,RMSECV)最小化時,選擇潛在變量的最佳數(shù)量。
作為PLS-DA模型的關(guān)鍵參數(shù),潛在變量在2~25范圍內(nèi)進行優(yōu)化。RMSECV隨潛在變量改變的變化趨勢如圖5(A)所示。從圖5(A)可以看出,潛在變量為23時,RMSECV達(dá)到最低值。圖5(B)給出了PLS-DA模型相應(yīng)潛在變量的預(yù)測集準(zhǔn)確率,當(dāng)潛在變量為23時,模型預(yù)測集的準(zhǔn)確率為100%,基于此建立PLS-DA"判別分析方法。
2.4"BP-ANN
BP-ANN作為最常見的神經(jīng)網(wǎng)絡(luò)拓?fù)渲唬蒀urry"Rumelhart在20世紀(jì)末提出,是基于誤差反向傳播算法的人工神經(jīng)網(wǎng)絡(luò)中的監(jiān)督學(xué)習(xí)算法。它是將反向傳播網(wǎng)絡(luò)應(yīng)用于人工神經(jīng)網(wǎng)絡(luò),具有多層感知器結(jié)構(gòu),由輸入層、一個或多個隱藏層和輸出層組成,每一層由一個或多個稱為神經(jīng)元或節(jié)點的基本元素組成[13]。
影響B(tài)P-ANN模型的主要參數(shù)是節(jié)點數(shù),設(shè)置節(jié)點數(shù)范圍為100~2"000,間隔為100,并計算模型的RMSECV和預(yù)測正確率。如圖"6(A)所示,當(dāng)節(jié)點數(shù)為1"400時,RMSECV值最小且預(yù)測正確率穩(wěn)定;之后,隨著節(jié)點數(shù)的增加,模型會處于過擬合的狀態(tài)。因此,綜合考慮節(jié)點數(shù)為1"400時建立BP-ANN模型,如圖6(B)所示,預(yù)測的識別率為96.875%。
2.5"ELM
ELM是一種用于單隱藏層前饋神經(jīng)網(wǎng)絡(luò)的新型學(xué)習(xí)算法,目標(biāo)是解決回歸、二分類與多分類問題。ELM"建模中有兩個重要參數(shù),即隱含層節(jié)點和激勵函數(shù)。這兩個參數(shù)與模型的穩(wěn)定性和預(yù)測精度有關(guān)。設(shè)置隱含層節(jié)點數(shù)范圍為1~100,間隔為1;激勵函數(shù)選取"sin"函數(shù)、sig"函數(shù)、hardlim"函數(shù)、tribas"函數(shù)和radbas"函數(shù),ELM"程序運行"50"次,得到"50"個預(yù)測正確率,預(yù)測的正確率越大,所對應(yīng)的函數(shù)就是激勵函數(shù)。
如圖7所示。按照相關(guān)系數(shù)的穩(wěn)定性尋找最大值,最佳激勵函數(shù)為"sin,平均預(yù)測正確率在隱含層節(jié)點數(shù)為96后遍趨于穩(wěn)定狀態(tài),因此,最佳隱含層節(jié)點數(shù)為96,對應(yīng)的預(yù)測集正確率為92.19%。
2.6光譜預(yù)處理方法集成建模方法的優(yōu)化
結(jié)合11種預(yù)處理方法和3種有監(jiān)督模式分析方法集成建模,并比較其最優(yōu)條件及其預(yù)測集正確率,得到最佳鮭科魚傅里葉變換近紅外光譜物種判別模型結(jié)果。
如圖8所示,光譜預(yù)處理后,大部分建模方法的鑒別正確率都得到了較大的提高,這表明光譜預(yù)處理可以改善模型的判別效果;但是,BP-ANN"模型的正確率低于原始光譜,這可能是因為建模方法的差異和"BP-ANN"自帶光譜數(shù)據(jù)中心化的原因。通過比較不同的預(yù)處理和建模方法可知,多個模型區(qū)分率均達(dá)到"100%,其中,PLS-DA"無須預(yù)處理也能達(dá)到100%正確率,因此,選擇PLS-DA建立模型。
3結(jié)論
本研究探索利用傅里葉變換近紅外光譜技術(shù),結(jié)合化學(xué)計量學(xué)方法,鑒別虹鱒和大西洋鮭的可能性。采集109份虹鱒和81份大西洋鮭近紅外光譜,使用11種光譜預(yù)處理方法進行原始光譜分析并預(yù)估一些特征峰;采用有監(jiān)督學(xué)習(xí)線性方法PLS-DA、非線性BP-ANN和ELM進行建模,并優(yōu)化模型參數(shù);最后,再結(jié)合11種預(yù)處理方法集成建模,通過比較建模后的指標(biāo),選擇最佳光譜預(yù)處理方法和建模方法。結(jié)果表明,傅里葉變換近紅外光譜技術(shù)結(jié)合化學(xué)計量學(xué)方法可以實現(xiàn)虹鱒和大西洋鮭的鑒別,采用PLS-DA建模方法最佳,此條件下,最佳因子為23,模型的預(yù)測集準(zhǔn)確率為100%。綜上所述,本研究為市場上虹鱒和大西洋鮭的鑒別與市場監(jiān)管提供了理論支撐和技術(shù)指導(dǎo)。
參考文獻
[1]"徐仲杰.食品安全檢測用穩(wěn)定同位素內(nèi)標(biāo)試劑的研制及應(yīng)用[D].上海:東華大學(xué),"2023.
[2]"ZHANG"L"W,LI"Y,GU"Y"Y,et"al.Atlantic"salmon"adulteration"authentication"by"machine"learning"using"bioimpedance"non-destructive"flexible"sensing[J].Microchemical"Journal,2024,196(8):109638.
[3]"GU"S"Q,DENG"X"J,SHI"Y"Y,et"al.Identification"of"peptide"biomarkers"for"authentication"of"Atlantic"salmon"and"rainbow"trout"with"untargeted"and"targeted"proteomics"approaches"and"quantitative"detection"of"adulteration[J].Journal"of"Chromatography"B,2020,1155(2):122194.
[4]"CHEN"H,TAN"C,LIN"Z.Geographical"origin"identification"of"ginseng"using"near-infrared"spectroscopy"coupled"with"subspace-based"ensemble"classifiers[J].Spectrochimica"Acta"Part"A:"Molecular"and"Biomolecular"Spectroscopy,2023,304(10):123315.
[5]"武晴瀅,祝震予,吳劍鳴,等.泛Kennard-Stone算法的數(shù)據(jù)集代表性度量與分塊采樣策略[J].高等學(xué)校化學(xué)學(xué)報,2022,43(10):150-157.
[6]"SCHüTZ"D,RIEDL"J,ACHTEN"E,et"al.Fourier-transform"near-infrared"spectroscopy"as"a"fast"screening"tool"for"thenbsp;verification"of"the"geographical"origin"of"grain"maize"(Zea"mays"L.)[J].Food"Control,"2022,136(10):108892.
[7]"MOSER"B,JANDRIC"Z,TROYER"C,et"al.Evaluation"of"spectral"handheld"devices"for"freshness"assessment"of"carp"and"trout"fillets"in"relation"to"standard"methods"including"non-targeted"metabolomics[J].Food"Control,2023,152(10):109835.
[8]"梁靜,郝生燕,趙祥民,等.基于近紅外光譜技術(shù)構(gòu)建牛羊肉摻假鑒別模型[J].甘肅農(nóng)業(yè)大學(xué)學(xué)報,2023,58(1):19-29,37.
[9]"付博,楊永鋒,劉向真,等.數(shù)據(jù)集劃分及預(yù)處理方法對煙葉化學(xué)成分近紅外定量模型的影響[J/OL].河南農(nóng)業(yè)大學(xué)學(xué)報,1-17[2024-12-30].https://doi.org/10.16445/j.cnki.1000-2340.20241009.001.
[10]"LI"L,ZHANG"H"H,WU"L,et"al.An"early"asymptomatic"diagnosis"method"for"cork"spot"disorder"in"‘Akizuki’"pear"(Pyrus"pyrifolia"Nakai)"using"micro"near"infrared"spectroscopy[J].Food"Chemistry:"X,2023,19(3):100851.
[11] 周勤,王遠(yuǎn)軍.基于PCA的無監(jiān)督群組配準(zhǔn)算法研究[J].生物醫(yī)學(xué)工程學(xué)進展,2022,43(3)":130-133,165.
[12] CRUZ-TIRADO"J"P,LIMA"BRASIL"Y,F(xiàn)REITAS"LIMA"A,et"al.Rapid"and"non-destructive"cinnamon"authentication"by"NIR-hyperspectral"imaging"and"classification"chemometrics"tools[J]."Spectrochimica"Acta"Part"A:Molecular"and"Biomolecular"Spectroscopy,2022,289:122226.
[13]"李兆雨.基于BP神經(jīng)網(wǎng)絡(luò)的甘蔗清糖漿多指標(biāo)定量分析研究[D].東莞:東莞理工學(xué)院,"2023.