查靖,葛玲,姚穎,李婷婷,龍白雪,劉鑫漢,2,王武,2*,馬飛,2*
(1.合肥工業大學 食品與生物工程學院,安徽 合肥 230009;2.皖南特色農產品加工技術研究與應用中心,安徽 宣城 242000;3.宣城市宣州區農業農村局,安徽 宣城 242000)
揮發性鹽基氮(total volatile basic nitrogen,TVBN)成分有氨、二甲胺、三甲胺等,是衡量魚肉新鮮度的重要指標之一[1]。研究發現,TVB-N 與氨基酸破壞程度顯著正相關,特別是蛋氨酸和酪氨酸的降解,會在很大程度上改變魚肉顏色和風味,造成嚴重的品質劣化[2]。目前,我國對TVB-N 值有明確規定,預制動物性水產品不得超過30 mg/100 g[3]。雖然臭鱖魚作為鹽漬預制性水產品不在此標準約束之列,但考慮到TVB-N 對臭鱖魚新鮮度的影響,開展TVB-N 檢測十分必要。
目前,傳統的TVB-N 檢測以凱氏定氮法和微量擴散法為主,這類方法效率低且對樣品具有破壞性[4]。隨著科技發展,比色傳感、高光譜成像和電子鼻等新技術也被用于肉和肉制品的TVB-N 無損檢測中[5-7]。然而,這些方法均存在較多局限性,主要表現為比色傳感存在環境污染和交叉敏感,高光譜成像存在間接性和數據分析復雜,電子鼻存在設備昂貴且使用壽命短等問題,難以滿足工業場景應用[8-9]。
傅里葉變換紅外光譜(Fourier transform infrared spectroscopy,FT-IR)是根據分子內部原子間的相對振動和分子轉動等信息來確定物質分子結構[10]。由于FT-IR 靈敏度高,被廣泛應用于食品新鮮度識別[11]、摻假造假識別[12]、農藥殘留檢測[13]、疾病的快速診斷[14]、環境氣體監測[15]等領域。這些研究表明基于氣相FT-IR技術在食品分析領域具有較大應用潛力。然而,基于FT-IR 技術無損檢測肉及肉制品中TVB-N 未見文獻報道。因此,本文以臭鱖魚為研究對象,探究FT-IR 分析技術對臭鱖魚中TVB-N 檢測的可行性。
機器學習是當前工業現代化背景下的研究熱點,被廣泛用于處理大量數據和建立與優化各種模型。在光譜預處理上,Savitzky-Golay 平滑(Savitzky-golay smooth,S-GS)在濾除噪聲的同時可以確保信號的形狀,小波閾值去噪(wavelet threshold denoising,WTD)能在平滑的同時較好地保留反映原始信號特征的尖峰點,穩健局部加權回歸(robust locally weighted regression,RLWR)在處理離群值時更為穩健,模擬退火-偏最小二乘(simulated annealing-partial least squares,SAPLS)特征選擇具有跳出局部最小值而搜索全局最小值的特點[16-18]。在回歸分析方面,偏最小二乘回歸(partial least squares regression,PLSR)和支持向量機(support vector machines,SVM)是兩種經典的線性和非線性回歸建模方法。PLSR 通過將預測和觀測變量投影到新的變量空間,將復雜光譜變量轉化為少數的潛變量(latent variables,LVs),廣泛應用于變量多且高度共線時構建預測模型[19];SVM 應用了一個非線性神經元的隱藏層、一個輸出線性神經元和一個專門的學習過程,實現了全局最優值求解和對未知樣本良好的泛化能力,被廣泛用于回歸和分類等多種機器學習[20]。機器學習的應用對于工業現代化具有重要現實意義。
本文使用氣相FT-IR 獲取臭鱖魚揮發物的紅外光譜,利用移動平均(moving average,MA)、S-GS、高斯濾波(gaussian filtering,GF)、RLWR 和WTD 對光譜進行預處理,采用區間偏最小二乘(interval partial least squares,iPLS)和SA-PLS 進行特征波段選擇,構建PLSR 和SVM 檢測模型,以相對預測誤差(ratio of prediction deviation,RPD)確定較優的預測模型,以期為研發臭鱖魚TVB-N 無損檢測技術提供參考。
臭鱖魚:市售,均為同一批發酵而成產品,質量為(400±30)g,冰藏運輸至合肥工業大學食品與生物工程學院實驗室;甲基紅、溴甲酚綠、硼酸、鹽酸、氧化鎂、無水碳酸鈉(均為分析純):國藥集團化學試劑有限公司;E-switch 鋁箔氣體采樣袋:上海申源科學儀器有限公司。
IS50 傅里葉變換紅外光譜儀:美國賽默飛世爾科技公司;LHP-100 恒溫恒濕培養箱:上海三發科學儀器有限公司;K9860 全自動凱氏定氮儀:濟南海能儀器股份有限公司;16 m 長光程氣室:美國PIKE 技術公司。
將臭鱖魚分別裝入貯藏袋(材質:PA/PE 復合性材料),置于恒溫恒培養濕箱(20 ℃、75%濕度)中進行貯藏試驗。分別在0、24、48 h 和72 h 取出12 條臭鱖魚樣本,使用氣體采樣袋收集揮發性氣體。
采用置換法減少氣體池內氣體的影響,使用真空泵將氣體池內氣體抽出,充入氮氣,重復3 次,在每個樣本采集前重復此操作。紅外光譜的譜儀參數設置:掃描范圍為4 000~400 cm-1,分辨率0.5 cm-1,掃描頻率為64 次。使用真空泵將氣體池內氣體抽出,直至壓力表顯示為-75 kPa,掃描獲取背景光譜。連接氣體采樣袋與氣體池,打開進氣口閥門和氣體采樣袋閥門,泵入揮發性氣體,至壓力表顯示為0,在相同條件下獲取樣本揮發物的紅外光譜,每個氣體樣本重復采集3 次,取平均值。共獲取48 個樣本的光譜,以36 個樣品作為校正集,用于建立預測模型,以12 個樣品作為測試集,用于對建立的數學模型進行驗證。
參考GB 5009.228—2016《食品安全國家標準食品中揮發性鹽基氮的測定》[21]方法檢測魚肉中的揮發性鹽基氮。在獲得臭鱖魚揮發物紅外光譜后,將臭鱖魚各部位肉絞碎,取絞碎魚肉10 g(精確至0.001 g),加入100 mL 超純水,超聲輔助提取15 min,過濾,采用全自動凱氏定氮儀測定。
1.6.1 平滑
基于窗口的平滑方法主要包括MA、S-GS、GF 和RLWR。MA 是對光譜的每個窗口進行移動平均,這種方法有利于減少數據的周期性趨勢;S-GS 是對光譜的每個窗口擬合的二次多項式進行平滑處理,當數據快速變化時,這種方法比其他方法更有效;GF 對每個窗口進行移動加權平均;RLWR 是對每個窗口進行穩健線性回歸,它在處理離群值時更為穩健。通過改變平滑窗口長度,分別對平滑后光譜建立預測模型,以預測結果的預測均方誤差(root mean square error of prediction,RMSEP)選擇最優窗口長度。
在WTD 中,小波基函數、閾值類型和小波分解級別等參數的選擇均會對最終的信號去噪效果產生很大影響[22]。本文選擇多貝西小波,閾值類型包括硬閾值和軟閾值。通過改變消失矩、閾值類型和小波分解的級別,分別對平滑后光譜建立預測模型,以預測結果的RMSEP 選擇合適參數對光譜進行平滑處理。
1.6.2 特征選擇
SA-PLS 的使用參考文獻[23]的方法,基于初始波段組合,構建PLS 模型,以預測集R2p及RMSEP 作為SA 的適應度函數,通過Metropolis 準則以一定概率接受新的解集的思想,在全光譜內搜索隨機變量,以促進從局部最小值到全局最小值的移動。其參數設置分別為子區間的長度41 cm-1和數量5,初始波段組合861~820、921~880、1 162~1 121、2 844~2 803、3 085~3 044 cm-1,初始溫度700,外循環最大迭代次數600,鏈長500,退溫速率0.95。
iPLS 被廣泛用于特征光譜區間的優化選擇[24]。它是將整個光譜范圍劃分為n 個等長的子區間,通過建立每個子區間的獨立PLSR 模型,以每個子模型的交叉驗證的均方根誤差作為模型的判斷標準選取最優的子區間組合,本文選擇5 個長度為41 cm-1子區間作為新的光譜變量。
1.6.3 回歸模型
PLSR 是基于多元線性回歸改進而來[25],將復雜光譜變量轉化為少數的LVs,以LVs 解釋的百分比方差和RMSEP 選擇合適的LVs 數量,建立TVB-N 預測模型。
SVM 是機器學習中伴隨人工神經網絡而出現的熱點,涉及到分類和回歸等許多實際問題,參考文獻[26]的方法,采用MATLAB 2020a 中fitrsvm 函數建模,并使用自動超參數優化,找到使五折交叉驗證損失最小的超參數,建立TVB-N 預測模型。
光譜處理及預測模型構建通過MATLAB 2020a 完成。顯著性分析通過SPSS Statistics 24 完成。圖形繪制采用Origin 2019b。
TVB-N 隨貯藏時間的變化見圖1。

圖1 TVB-N 隨貯藏時間的變化Fig.1 Changes in TVB-N over storage time
由圖1 可知,新鮮臭鱖魚中TVB-N 為39.90 mg/100 g,在內源酶和微生物的作用下,魚肉中蛋白質被分解為堿性含氮物質[27],使得貯藏過程中TVB-N 顯著增加(P<0.05),在24、48 h 和72 h 后分別達到了56.12、68.31 mg/100 g和86.38 mg/100 g,接近限量標準的3 倍,高含量TVB-N不僅會降低臭鱖魚的營養價值,食用也會對人體健康產生嚴重危害[28]。因此,實現臭鱖魚發酵貯藏過程TVBN 的在線無損檢測對于消費者健康至關重要。
臭鱖魚在貯藏過程中釋放的揮發物產生了大量的特征紅外吸收峰,為去除水汽和二氧化碳吸收的影響,取1 300~780 cm-1和3 300~2 500 cm-1范圍的紅外光譜進行分析。臭鱖魚揮發物紅外光譜見圖2。

圖2 臭鱖魚揮發物的紅外光譜Fig.2 Infrared spectra of volatiles from stinky mandarin fish
由圖2a 為1 300~780 cm-1范圍的紅外光譜,其中1 200~800 cm-1包含許多窄的吸收峰,這與魚肉釋放的氨有關,特別是在1 078、1 069 cm-1和966 cm-1,是氨的特征吸收峰[29]。圖2b 為3 300~2 500 cm-1范圍的紅外光譜,在3 150~2 750 cm-1產生的特征吸收主要與貯藏過程產生的胺類物質有關[30],尤其是三甲胺,它是TVB-N 的主要成分,也是被用來評估魚變質程度的特征化合物,主要由魚肉中氧化三甲胺經微生物作用而產生[28,31];在2 650~2 550 cm-1范圍產生的特征吸收主要與甲硫醇相關,由含硫氨基酸在微生物作用下降解產生[32]。這些特征吸收峰與臭鱖魚變質密切相關,且吸收峰強度與TVB-N 含量變化呈正相關。因此,結合紅外光譜和計量學分析對TVB-N 預測具有理論支撐。
采用MA、S-GS、GF 和RLWR 平滑方法,依次改變窗口長度獲取對應平滑處理后的光譜,并分別建立預測模型,其RMSEP 變化如圖3 所示。

圖3 4 種平滑方法在不同窗口長度下建立的預測模型RMSEP 變化Fig.3 Changes in RMSEP of prediction models established by four smoothing methods with different window lengths
由圖3 可知,隨著窗口長度的變化,MA、S-GS 和GF 對模型性能的影響均先提高后降低,分別在窗口長度為17、31 和26 時模型最佳,RMSEP 分別為7.156 6、7.179 8 和7.150 4;RLWR 對RMSEP 的影響呈振蕩形式,在窗口長度為22 時模型最佳,RMSEP 為5.7689。結果表明光譜平滑對于優化模型至關重要。
采用小波閾值去噪對光譜進行平滑處理,平滑光譜建立模型的RMSEP 變化見圖4。

圖4 小波閾值去噪在不同參數下建立的預測模型RMSEP 變化Fig.4 Change in RMSEP of prediction models established by wavelet threshold denoising with different parameters
由圖4 可知,圖4a 和圖4b 分別為硬閾值和軟閾值在不同消失矩和小波分解等級下,平滑后光譜所建立預測模型的RMSEP 變化。當閾值類型為軟閾值,小波函數為db2,平滑等級為6 時,RMSEP 為6.991 9,優于硬閾值(RMSEP=7.107 7)。原因在于軟閾值法將絕對值大于閾值的小波系數不完全保留,進行收縮處理,使得小波系數整體連續性較好,避免附加振蕩信號產生[33]。
平滑后光譜結果見圖5。

圖5 原始光譜及平滑后光譜Fig.5 Original spectra and smoothed spectra
由圖5 可知,對比于原始光譜,5 種平滑方法均有效減少了光譜中雜峰。雖然WTD 在平滑過程中有效保留光譜中的尖峰,如1 244 cm-1,但其平滑效果并不明顯,而MA、GF、S-GS 和RLWR 有效平滑了在990~930 cm-1和1 090~1 025 cm-1出現的大量雜峰,這也是氨及胺類物質的特征吸收波段。結果表明,光譜平滑處理有效提高了光譜信噪比。
基于原始光譜的PLSR 和SVM 模型對TVB-N 預測結果見表1。

表1 基于原始光譜的PLSR 和SVM 模型對TVB-N 檢測Table 1 Detection of TVB-N by PLSR and SVM models based on raw spectra
表1 總結了PLSR 和SVM 回歸模型的校正集的R2c、測試集的RMSEP 和R2p,并以RPD 值評估模型的魯棒性。當RPD 小于1.4 時,認為所建模型不可靠;介于1.4~2.0,認為所建模型較可靠;RPD 大于2.0,則認為所建模型具備較高可靠性,能夠用于模型分析[34]。由表1 可知,構建的SVM 預測模型R2p為0.870 9,RPD值為2.812 8,PLSR 預測模型R2p為0.853 2,RPD 值為2.542 3,模型均具備較高可靠性。良好的預測結果證明了通過揮發物的紅外光譜預測TVB-N 具有可行性。
平滑后光譜建立預測模型結果如表2 所示。

表2 基于5 種平滑處理方法的PLSR 和SVM 模型對TVB-N 檢測Table 2 Detection of TVB-N by PLSR and SVM models based on five smoothing methods
由表2 可知,5 種平滑方法對于TVB-N 檢測精度均具有積極影響。其中,RLWR 平滑處理結果最佳,可能由于該方法在平滑過程中將異常值賦予較小的權重。PLSR 預測模型R2p和RPD 分別為0.901 0 和3.247 0。因此,平滑對于提高FT-IR 工業在線檢測精度十分重要。
盡管通過平滑處理減少了無用光譜信息,但模型的穩健性仍具有提升空間。在RLWR 平滑光譜的基礎上,采用iPLS 和SA-PLS 對光譜進行特征波段選擇,減少無關光譜變量,提高模型性能和運行效率。對兩種方法各選擇了5 個長度為41 cm-1的子區間,SAPLS 特征選擇結果(850~809、993~952、1 145~1 104、2 804~2 763、3 123~3 082 cm-1)和iPLS 特征選擇結果(821~780、944~903、985~944、1 067~1 026、1 108~1 067 cm-1)見圖6。

圖6 特征波段選擇結果Fig.6 Selection of characteristic wavebands
由圖6 可知,在SA-PLS 選取的5 個波段中,2 804~2 763、3 123~3 082 與胺的吸收相關,850~809、993~952、1 145~1 104 cm-1與氨吸收相關,而iPLS 只選擇了1 300~780 cm-1范圍內的光譜特征,忽略胺類物質在3 150~2 750 cm-1特征吸收。從選擇結果可知,SA-PLS優于iPLS,這來源于SA 具有能跳出局部最小值搜索全局最小值的優勢[35]。
特征波段選擇后光譜的建模結果見表3。

表3 基于SA-PLS 和iPLS 特征選擇的PLSR 和SVM 模型對TVB-N 檢測Table 3 Detection of TVB-N by PLSR and SVM models based on SA-PLS and iPLS for feature selection
由表3 可知,SA-PLS 顯著優于iPLS,雖然特征波段選擇減少了重要光譜信息,使得SVM 模型性能降低(R2p=0.886 4,RPD=2.892 2),但變量數量減少了84.46%,運行效率得到顯著提升。RLWR-SA-PLS 模型預測結果R2p和RPD 分別為0.942 8 和4.005 0,模型具有可靠性,且優于非線性模型SVM。因此,結合光譜信息與RLWR-SA-PLS 模型可以高精度檢測臭鱖魚TVB-N。
TVB-N 是衡量臭鱖魚新鮮度的一項重要指標,本文利用氣相FT-IR 結合化學計量學開展臭鱖魚TVBN 含量的無損檢測技術研究?;趽]發物的紅外光譜建立PLSR 和SVM 兩種TVB-N 預測模型,模型可靠性較高(SVM,R2p=0.870 9,RPD=2.812 8),證明方案具有可行性;5 種光譜平滑處理結果表明,RLWR 不僅能有效平滑光譜雜峰,同時還可以提升模型性能(PLSR,R2p=0.901 0,RPD=3.247 0);在此基礎上,由SAPLS 優選的5 個特征波段(850~809、993~952、1 145~1 104、2 804~2 763、3 123~3 082 cm-1)可實現TVB-N的高精度預測(PLSR,R2p=0.942 8,RPD=4.005 0),RLWR-SA-PLS 實現了數據維度的明顯降低和識別效率的明顯提升。因此,基于氣相FT-IR 可以實現臭鱖魚中TVB-N 的無損檢測,具備工業在線應用可行性。