劉飛 鄒昊 田寒友 湯介蘭 劉文營 李家鵬 喬曉玲



摘 要:以市售新鮮冷藏(4 ℃)豬肉為研究對象,采用蒙特卡洛-無信息變量消除算法和連續投影算法對原始近紅外光譜的800 個波長變量進行提取,共篩選出與揮發性鹽基氮含量直接和間接相關的有效波長變量36 個,并采用偏最小二乘法構建預測模型,驗證集的相關系數和標準偏差分別為0.876 4和1.205 7 mg/100 g。
關鍵詞:豬肉;蒙特卡洛-無信息變量消除算法;連續投影算法;揮發性鹽基氮
Abstract: Total volatile basic nitrogen (TVB-N) content is an important reference index for evaluating pork freshness. This study attempted to measure the TVB-N content in pork meat using near infrared spectroscopy with Monte Calo uniformative variable elimination (MCUVE) and successive projections algorithm (SPA). The results showed that 36 effective wavelength variables directly and indirectly related to the TVB-N content were selected with MCUVE and SPA from the 800 wavelength variables in the original NIR spectra of fresh chilled pork (at 4 ℃), and the proposed partial least squares (PLS) model had good performance with correlation coefficient of prediction (Rp) of 0.876 4, and standard error of prediction (sEP) of
1.2057 mg/100 g, respectively.
Key words: pork; Monte Calo uniformative variable elimination; successive projections algorithm; total volatile basic nitrogen (TVB-N)
中圖分類號:O657.33 文獻標志碼:A 文章編號:1001-8123(2015)09-0025-05
豬肉食品是我國接受度最好,商業化最成熟的肉類食品,豬肉的品質對肉類食品工業的健康發展具有重要意義。豬肉的新鮮度是評價豬肉品質的一項重要指標,GB5009.44—2003《肉與肉制品衛生標準的分析方法》也規定,揮發性鹽基氮(total volatile basic nitrogen,TVB-N)含量是劃分豬肉新鮮度等級的標準。一般來講,TVB-N的測定方法采用半微量定氮法或微量擴散法,這種方法前處理繁瑣、檢測周期長、效率低、不能滿足當今肉檢過程的快速、無損、自動化的需求。
近紅外光譜(near infrared spectroscopy,NIR)可記錄樣品中含氫基團(O-H、C-H、N-H、S-H等)分子中單個化學鍵的基頻振動的倍頻和合頻信息[1],反應樣品中對應化學成分的含量及變化,因此具有分析速度快、操作簡便、非破壞性等優勢,同時無需對樣品進行預處理、可實現在線檢測等特點,在農業、食品、醫藥等領域得到廣泛應用[2-6]。近年,采用近紅外光譜檢測技術快速無損檢測肉制品揮發性鹽基氮的研究較多,侯瑞峰等[7]用近紅外漫反射光譜開展了豬肉新鮮度檢測的研究,報道了該方法用于檢測豬肉新鮮度的可行性;Cai等[8]采用偏最小二乘法(partial least squares,PLS)對全光譜信息變量建模,預測豬肉TVB-N值,預測效果良好,驗證集相關系數為0.808 4;蔡健榮等[9]采用間隔偏最小二乘法(siPLS)對豬肉的TVB-N化學值建立預測模型,縮減了光譜的部分冗余信息,獲得4 個有效波長變量范圍,驗證集相關系數為0.823 8;馬世榜等[10]采用無信息變量消除(uninformative variable elimination,UVE)結合連續投影算法(successive projections algorithm,SPA)提取了牛肉近紅外光譜中的8 個有效波長的信息變量,并采用最小二乘支持向量機(least squares support vector machines,LS-SVM)構建了TVB-N的預測模型,驗證集的相關系數為0.925,極大限度地減少了無用信息的干擾。目前,近紅外光譜預測生鮮肉TVB-N的建模方法和變量選擇,逐漸從全光譜信息變量轉變成有效波段變量或有效波長變量,以提高模型的準確性和建模的效率,但采用變量選擇方法提取與市售豬肉TVB-N相關的特征波長建立快速預測模型,并探討提取的特征波長變量與預測模型的數量關系以及特征波長變量的物理意義的報道相對較少。本研究擬采用蒙特卡洛-無信息變量消除算法(Monte Calo uniformative variable elimination,MCUVE)和SPA相結合,提取豬肉TVB-N的特征波長變量并探討其物理意義,進而提高市售豬肉TVB-N的PLS的光譜預測模型的精度和效率,為進一步開發快速使用的檢測設備提供參考。
1 材料與方法
1.1 材料與試劑
豬肉樣品均為宰后排酸12 h的豬通脊肉,采購于北京大型商超。
擴散皿(6031-02A型) 日本柴田科學;無水碳酸鉀、硼酸、甲基紅、次甲基藍、阿拉伯膠、甘油(均為分析純) 國藥集團化學試劑有限公司;0.010 mol/L鹽酸標準滴定液 北京試劑國家化學試劑質檢中心。
1.2 儀器與設備
SupNIR-1520型便攜式近紅外儀(光譜波數范圍1 000~1 799 nm,分辨率5 nm,平面漫反射探頭、鎢燈光源、光譜采集窗口(直徑32 mm))、RIMP Client近紅外光譜分析軟件 聚光科技(杭州)股份有限公司;BSA822-CW型電子天平(精確度0.01 g) 德國賽多利斯科學儀器。
1.3 方法
1.3.1 樣品制備
取不同養殖企業和不同品種的市售新鮮豬通脊肉樣品(2.0±0.2) kg,分別用塑料袋包裹以減少樣品間干擾和水分揮發對樣品光譜信息的影響。將所有樣品放置于0~4 ℃冷庫保藏15 d,使其自然緩慢腐敗,每天隨機選取10 個樣品進行其光譜信息的采集和揮發性鹽基氮含量的測定。
1.3.2 樣品近紅外光譜信息的采集
每次實驗前先將便攜式近紅外儀預熱30 min,預熱后用參比標準白板進行校準(樣品間不再進行校準)。在采集樣品光譜信息前,用定性濾紙吸干樣品橫截面上的水分。采集過程中,將樣品的橫截面緊貼于便攜式近紅外儀的平面漫反射探頭上,避免因漏光導致采集的樣品光譜信息不準確。因光譜信息的采集對溫度敏感,所有樣品在采集過程中始終保持在0~4 ℃。每個樣品選取6 個不同區域進行光譜信息采集,取其平均值作為該樣品的最終光譜吸收強度值。
1.3.3 樣品揮發性鹽基氮含量的測定
對樣品進行光譜信息采集后,根據GB/T 5009.44—2003中的微量擴散法,立刻測定選取的10 個樣品的TVB-N含量。每個樣品做3 個平行,取平均值作為該樣品的TVB-N值。樣品絞碎時去除脂肪、筋腱等組織。
1.3.4 樣本選擇及樣本集劃分
利用主成分分析(principal component analysis,PCA)和統計分析[11],剔除異常樣本和異常理化值樣本后剩余有效樣本258 個,其原始近紅外吸收光譜如圖1所示,按3∶1的原則用SPXY(sample set partitioning based on joint x-y distances Algorithm)算法[12]把258 個樣本劃分為校正集和驗證集,207 個樣本作為校正集并建立預測模型,51 個樣本作為驗證集并驗證預測模型的精度和穩定性。校正集和驗證集樣品的統計分布情況如圖2所示。
1.3.5 數據處理及建模
將樣品的光譜信息對應其揮發性鹽基氮化學測量值導入Matalab 2012分析軟件中,用無信息變量消除算法和連續投影算法對全波段變量(1 000~1 799 nm)進行提取,并用PLS算法建模。
1.3.5.1 蒙特卡洛-無信息變量消除算法和連續投影算法
MCUVE[13-14]是一種新型的無信息變量消除算法,它在UVE的基礎上增加了蒙特卡洛采樣原理。可消除不提供信息的變量,減少建模變量數,提高建模速度,降低模型的復雜性。SPA是一種利用向量的投影分析,從光譜信息中尋找含有最低度冗余信息、共線性最小的變量組,大大減少建模所用的變量個數,從而達到改善多變量線性模型預測效果的目的[15]。MCUVE算法和SPA算法相結合,能夠進一步減少建模變量個數,提高建模效率和建模精度。
1.3.5.2 建模及評價
PLS是光譜數據建模分析中應用最為廣泛的化學計量學方法[16-17]。模型的性能用校正集標準偏差(sEC)、校正集相關系數(Rc)、驗證集標準偏差(sEP)、驗證集相關系數(Rp)評判。sEC、sEP越小,Rc、Rp越接近于1,模型越好。
2 結果與分析
2.1 樣品揮發性鹽基氮含量的測定結果
實驗共測定了258 個豬肉樣品的揮發性鹽基氮,為避免所用樣品的待測量范圍過小,代表性差,導致不能獲得準確的預測模型,由表1可知,本實驗建模所用樣品的TVB-N含量為7.15~22.44 mg/100 g,平均值11.75 mg/100 g,標準偏差3.93 mg/100 g,涵蓋了國標對鮮(凍)畜肉的揮發性鹽基氮含量所允許的最大值。
2.2 全波段光譜預處理分析及建模
將原始近紅外吸收光譜1 000~1 799 nm范圍的全波段數據共800 個變量導入Matlab,用PLS方法構建豬肉TVB-N的預測模型,結果如表2所示。采用全波長構建的預測模型具有較好的預測效果,校正集和驗證集的標準偏差分別為1.158 3 mg/100 g和1.427 6 mg/100 g,校正集和驗證集的預測相關系數分別為0.943 7和0.826 7,與Cai等[8]構建的豬肉揮發性鹽基氮的siPLS傅里葉近紅外光譜模型的結果相近,校正集和驗證集的相關系數分別為0.839和0.808。
2.3 用MCUVE提取有效波長
對近紅外吸收光譜1 000~1 799 nm范圍全波段原始數據構建TVB-N的PLS預測模型,雖然可以得到不錯的預測效果,但全波段中包含大量對建模無用的冗余信息。全部作為建模的輸入變量,不但影響建模的速度和精度,還對后期開發高精度便攜設備帶來一定程度的阻礙。用MCUVE算法進行變量選擇,可剔除全波段中的無用信息,提取有效波長信息。
用PLS結合留一法交互驗證[18]確定最佳主成分為10。對校正集全光譜矩陣進行隨機采樣,每次隨機挑選光譜變量總數的2/3建立PLS模型,共采樣100 次,計算確定每一個波長變量的穩定值(所有樣品在同一波長下的平均值與標準差的商)。將波長變量穩定值的絕對值從大到小排列,每次從數列中增選50 個波長變量建立PLS模型,直到選擇所有的波長變量建模。以PLS模型的預測標準偏差)挑選波長變量,選擇預測標準偏差最小值時的波長變量數,剩余的其他變量則界定為無信息變量。圖3為不同波長變量數對應的校正集和驗證集的預測相關系數和標準偏差的關系圖。當波長變量為300時,驗證集標準偏差值最小,為1.3309 mg/100 g,此時的校正集標準偏差和驗證集相關系數都處于拐點,校正集相關系數隨變量數變化不大。圖4為全波段光譜800 個變量穩定值的分布,2 條水平虛線為前300 個波長變量的最小穩定值,兩線范圍之外的變量為有用信息,基本上覆蓋了全波長范圍的所有區段,代表性較好。采用MCUVE算法進行變量選擇后,變量數從800 個減少到300 個,變量個數減少了62%。將篩選出的變量作為輸入變量建立PLS模型,預測結果如表2所示,校正集和驗證集的預測相關系數分別為0.951 5和0.849 3,校正集和驗證集的標準偏差分別為1.077 1 mg/100 g和1.330 9 mg/100 g。與全光譜變量建立的模型相比,輸入變量數大幅減少,預測精度有一定程度的提高。Du等[19]采用MCUVE變量選擇法,刪除掉55%的無效波長變量后,其模型預測效果變化不大。由此可見,MCUVE處理后的前300 個波長變量攜帶的信息具有較好的代表性,可作為預測模型的有效波長變量。
2.4 用MCUVE-SPA提取有效波長
為進一步提取有效變量,獲得TVB-N的近紅外特征光譜值,采用SPA算法對MCUVE提取后的光譜變量進行處理,消除變量之間的共線性,提取共線性最小的有效波長變量。波長變量選擇數設定為1~50,由校正集內部交叉驗證均方根誤差(cross-validation root mean square error,RMSECV)值確定最佳有效光譜變量個數[20]。如圖5所示,MCUVE處理后300 個光譜變量中,經SPA算法提取出36 個有效變量。變量個數在MCUVE提取的基礎上減少了88%,與原始全光譜變量個數相比,減少了95%。將提取出的36 個有效變量作為輸入變量建立PLS模型預測驗證集數據,預測模型的擬合公式如下:
TVB-N值=463.58λ1 032-1 190.09λ1 039-1 370.99λ1 041+
1 861.79λ1 050+1 677.02λ1 082-3 174.33λ1 107-789.68λ1 119+
2 605.24λ1 130+1 085.61λ1 140-1 708.60λ1 159-
2 134.00λ1 258-782.68λ1 265-2 125λ1 295+1 120.54λ1 331+
2 737.22λ1 345-2 489.41λ1 358-976.59λ1 377+763.90λ1 387+1 463.37λ1 434-3 09.61λ1 499+1 617.50λ1 531+2 168.91λ1 537-1 681.92λ1 546-
941.84λ1 582-3 528.82λ1 605+1 550.54λ1 611+970.88λ1 630+
1 596.21λ1 657-674.429λ1 692-1 412.46λ1 712+2 477.72λ1 736+
2 193.13λ1 755-2 597.69λ1 761+1 459.51λ1 764+599.01λ1 773-
2 002.07λ1 785+6.38
將上述近紅外光譜對應的特征波長值代入公式,即可預測生鮮豬肉的TVB-N化學預測值。該模型的驗證集相關系數和標準偏差(表2)分別為0.876 4、1.205 7 mg/100 g,模型預測精度高于原始光譜和MCUVE處理后的光譜數據構建的預測模型,圖6為驗證集預測結果的散布圖,驗證集樣本的預測值分布在回歸直線兩側,預測效果較好,說明提取的有效波長變量攜帶的信息具有較好的代表性。馬世榜等[10]采用VUE和SPA結合LS-SVM的方法構建的牛肉揮發性鹽基氮的預測模型,提取的有效波長變量個數為8 個,預測相關系數和標準偏差分別為0.925、4.615 mg/100 g。
由圖7可知,圖中實線為某份豬肉樣品的近紅外光譜導數的曲線,空心方框為經MCUVE和SPA結合算法提取的36個特征波長所在位置。其中1 150 nm附近的波長變量與胺和N-H鍵產生的吸收峰有關[21],而TVB-N測定值反應的是豬肉樣品中的蛋白質分解產生的氨及胺類等堿性含氮物質,故選擇該波長區域的變量作為TVB-N的特征波長;一些波長變量與水分子在近紅外區產生的吸收峰(1 400 nm附近)有關,也被選擇作為TVB-N的特征波長變量,由此可知,通過MCUVE-SPA算法提取的波長變量對TVB-N的預測結果有顯著影響。由此可推知,TVB-N的特征波長變量主要分為兩類,一類是含氮基團的特征信息,一類是與氮基團相關,間接影響TVB-N測量結果的物質(水分等)。因此采用MCUVE-SPA算法可以較好的在大量無用信息中提取與豬肉中揮發性鹽基氮直接和間接相關的最優波長變量,結合PLS構建預測模型,可以較好的預測豬肉揮發性鹽基氮的化學值。
3 結 論
通過MCUVE-SPA算法提取豬肉近紅外光譜的最優波長變量,并建立了PLS的預測模型,實現了豬肉4 ℃條件下TVB-N的無損快速檢測。經過提取的最優波長變量為與TVB-N直接和間接相關的近紅外波長變量,相比較全波長變量構建的模型相比,變量個數減少了95%,精度得到有效提高,建立的PLS預測模型的驗證集相關系數和標準偏差分別為0.876 4、1.205 7 mg/100 g,具有較好的預測精度。由此可見,采用MCUVE-SPA算法和PLS建模方法,能提取最優波長變量,提高建模速度和預測精度,為開發便攜、快速的無損檢測豬肉TVB-N設備,實現無損快速分級和評價豬肉新鮮度提供參考。
參考文獻:
[1] GIL-SANCHERZ L, SOTO J, MARTINEZ-MANEZ R, et al. A novel humid electronic nose combined with an electronic tongue for assessing deterioration of wine[J]. Sensors and Actuators A: Physical, 2011, 171(2): 152-158.
[2] 劉燕德, 陳興苗, 歐陽愛國. 可見/近紅外光譜法無損檢測贛南臍橙可溶性固形物[J]. 光學學報, 2008, 28(3): 478-481.
[3] 趙杰文, 郭志明, 陳全勝, 等. 近紅外光譜法快速檢測綠茶中兒茶素的含量[J]. 光學學報, 2008, 28(12): 2302-2306.
[4] 丁海泉, 盧啟鵬, 樸仁官, 等. 土壤有機質近紅外光譜分析組合波長的優選[J]. 光學精密工程, 2007, 15(12): 1946-1951.
[5] 劉飛, 何勇, 王莉. 黃酒糖度預測的可見-近紅外光譜方法研究[J]. 光學學報, 2008, 27(11): 2054-2058.
[6] 韓東海, 王加華. 水果內部品質近紅外光譜無損檢測研究進展[J]. 中國激光, 2008, 35(8): 1123-1131.
[7] 侯瑞鋒, 黃嵐, 王忠義, 等. 用近紅外漫反射光譜檢測肉品新鮮度的初步研究[J]. 光譜學與光譜分析, 2007, 26(12): 2193-2196.
[8] CAI J, CHEN Q, WAN X, et al. Determination of total volatile basic nitrogen (TVB-N) content and Warner-Bratzler shear force (WBSF) in pork using fourier transform near infrared (FT-NIR) spectroscopy[J]. Food Chemistry, 2011, 126(3): 1354-1360.
[9] 蔡健榮, 萬新民, 陳全勝. 近紅外光譜法快速檢測豬肉中揮發性鹽基氮的含量[J]. 光學學報, 2009, 29(10): 2808-2812.
[10] 馬世榜, 彭彥昆, 徐楊, 等. 可見/近紅外光譜結合變量選擇方法檢測牛肉揮發性鹽基氮[J]. 江蘇大學學報(自然科學版), 2013, 34(1): 44-48.
[11] JOLLIFFE I T. Discarding variables in a principal component analysis. I: artificial data[J]. Applied Statistics, 1972, 21(2): 160-173.
[12] ZHANG Z Y. Determination of hesperidin in Tangerine leaf by near-infrared spectroscopy with SPXY algorithm for sample subset partitioning and Monte Carlo cross validation[J]. Spectroscopy and Spectral Analysis, 2009, 29(4): 964-968.
[13] YANG H, KUANG B, MOUAZEN A. Quantitative analysis of soil nitrogen and carbon at a farm scale using visible and near infrared spectroscopy coupled with wavelength reduction[J]. European Journal of Soil Science, 2012, 63(3): 410-420.
[14] CAI W, LI Y, ShAO X. A variable selection method based on uninformative variable elimination for multivariate calibration of near-infrared spectra[J]. Chemometrics and Intelligent Laboratory Systems, 2008, 90(2): 188-194.
[15] PONTES M J C, GALVA R K H, ARAUJO M C U, et al. The successive projections algorithm for spectral variable selection in classification problems[J]. Chemometrics and Intelligent Laboratory Systems, 2005, 78(1): 11-18.
[16] GELADI P, KOWALSKI B R. Partial least-squares regression: a tutorial[J]. Analytica Chimica Acta, 1986, 185: 1-17.
[17] 葉鶯, 陳崇幗, 林熙. 偏最小二乘回歸的原理及應用[J]. 海峽預防醫學雜志, 2005, 11(3): 3-6.
[18] LEARDI R. Application of a genetic algorithm to feature selection under full validation conditions and to outlier detection[J]. Journal of Chemometrics, 1994, 8(1): 65-79.
[19] DU G, CAI W, SHAO X. A variable differential consensus method for improving the quantitative near-infrared spectroscopic analysis[J]. Science China Chemistry, 2012, 55(9): 1946-1952.
[20] HAO Y, SUN X, ZHANG H, et al. Application of effective wavelength selection methods to determine total acidity of navel orange[J]. Sensor Letters, 2011, 9(3): 1229-1234.
[21] ROSESEL R V, BEHRENS T. Using data mining to model and interpret soil diffuse reflectance spectra[J]. Geoderma, 2010, 158(1): 46-54.