陳杰 張曉 姚娜 王亞明
(塔里木大學信息工程學院,新疆 阿拉爾 843300)
與豬肉、牛肉相比,羊肉肉質較細膩,蛋白質和維生素的含量都很高,并且它的脂肪和膽固醇等物質含量較低。常吃羊肉對增強人體免疫能力和能提高整體的身體素質都有很好的幫助。在新疆南部地區,由于維吾爾族同胞比例相對較大,對羊肉的需求量更是大于其他地區。南疆塔里木河流域出產的羊肉品質最優,它不僅肉質細膩,而且膻味和腥味較小,受到各族人們的喜愛[1]。隨著民眾生活消費水準的提升,人們對肉的品質要求越來越高。在羊肉的品質特性中,嫩度是評判羊肉質量的重要指標之一,也是消費者最重視的感官指標,其高低直接影響著肉的食用價值和經濟價值。肉的嫩度是指肉在食用時對肌纖維碎裂的抵抗力,反映了肉的質地,是肌肉中各種蛋白質結構特性的總體概括。嫩度的客觀評價是對定型肉塊進行剪切力測定,剪切力值越低肉嫩度越好[2]。
近幾年,近紅外光譜技術的發展較快,它具有快速高效檢測的優點,已經在肉制品品質檢測中廣泛的應用[3-4],這種無損快速檢測技術也較多的用于肉品的嫩度檢測研究[5]。關于肉類嫩度研究大多是針對牛肉和豬肉嫩度檢測和嫩度分級[6],羊肉的嫩度研究較少。Park等[7]使用波長為1 100~2 498 nm內獲得的近紅外光譜,來分析測定牛肉背長肌的嫩度,得到的嫩度值相關系數為0.692,并且建立了預測牛肉嫩度的模型;趙杰文等[8]采用多元線性回歸方法對新鮮牛肉所吸收的近紅外光譜曲線和剪切力的值建立了牛肉嫩度預測模型;張德權等[9]曾使用偏最小二乘法分析研究了羊肉的近紅外光譜和嫩度的關系,所建立的模型相關性達到0.862,但是,文中僅使用相關性對建立的模型進行了研究,沒有涉及到交叉驗證均方差、預測均方差、預測精度。本文使用連續投影算法結合最小二乘法建立羊肉嫩度和近紅外光譜的模型,評價指標使用交叉驗證均方差、預測均方差、預測精度和相關系數來衡量。連續投影算法(SPA)[10-11]的優點是可以提取全波段的幾個特征波長,這種算法能夠消除原始光譜數據中冗余的信息,預測速度相對較快[12],近年來,國內外學者在利用光譜分析技術檢測作物和食品中某些重要成分的含量時利用了連續投影算法做有效波長的選取[13-14]。
常見的數據建模方法有多元線性回歸法、主成分分析法、主成分回歸法、偏最小二乘法、人工神經網絡方法和支持向量機等方法[15]。最小二乘法集成了典型相關分析、主成分分析以及線性回歸分析的優點,它能解決的最典型的問題就是自變量之間的多重相關性。很多時候,樣例很少,甚至比變量的維度還少,變量之間又存在多重相關性的問題,這時最小二乘法就開始發揮它的作用[16]。
一個建模算法預測評價指標的衡量參數有:交叉驗證均方差、預測均方差、預測精度和相關系數。交叉驗證均方差、預測均方差可以用來定量分析模型的性能以及評價指標,而最小二乘法就是為了尋求一條直線來擬合所有的點,使得這條直線到所有的點之間的均方根誤差最小;相關系數的絕對值是在區間[0,1]分布的數值,越接近1,說明數據相關性越強,預測精度就越高。
本研究在前人對鮮肉研究的基礎上以南疆小尾寒羊后腿肉的嫩度為研究對象,使用近紅外光譜儀進行采集光譜數據,使用C-LM4型數顯式肌肉嫩度儀進行肌肉嫩度測量,根據光譜數據和肌肉嫩度數據,采用連續投影法選取特征波長分布對原始光譜數據和經過多元散射校正預處理后的光譜數據進行提取特征波長,根據提取出來的特征波長采用偏最小二乘法針對訓練集建立嫩度和近紅外光譜的嫩度模型,并對預測集進行嫩度預測,采用評價指標的衡量參數來檢驗模型是否合格。
近紅外光譜儀(JDSU-MicroNIR 1700),北京凱元盛世,掃描波長900~1 800 nm;剪切儀(C-LM4),沃-布;手術刀;無菌刀;保鮮袋;電熱恒溫水浴鍋(HH-M4,四孔),上海赫田;冰箱(BCD-329),海爾;溫度計和干燥切板。
試驗樣品使用宰后24 h排酸后的小尾寒羊的新鮮羊后腿肉,切成6 cm×6 cm×4 cm的塊狀,共180塊肉樣,保存在4℃的冰箱中,逐一取出,擦干表面水分進行采集光譜數據和嫩度數據。
(1)近紅外光譜儀打開預熱30 min后將白板放在光譜儀器下2 mm處進行校光;
(2)取下白板,放鮮羊肉樣品,肉表面要平整,與鏡頭仍保持2 mm的距離;測量在900~1 700 nm之間的光譜數據;(測量三次,測量間隔是5 s,取平均值)
(3)采集完光譜信息的羊肉裝入保鮮袋包好,肉樣中心插入溫度計,放進恒溫水浴鍋中加熱(水浴鍋溫度設定為80℃恒溫狀態);
(4)當溫度計讀數達到70℃(此溫度和恒溫鍋的溫度根據NY/T 1180—2006農業行業標準選取)時,取出肉樣放到冰箱冷卻到4℃,放置時間為24 h。取出后順著肌肉纖維取樣,樣本大小3 cm×3 cm×4 cm,樣本數為3;
(5)使用剪切儀垂直肌肉纖維方向剪切肉條,記錄數據,數據單位為kgf,剪切三次取平均值。
近紅外光譜主要是由于分子振動的非諧振性使得分子從基態向高能級躍遷產生的,主要是對含氫基團振動的倍頻和合頻的吸收,由于不同基團產生的光譜在吸收強度上是不同的,因此隨著樣品組成的變化及其光譜特性也發生變化,從而為近紅外光譜分析樣品的物理性質提供了基礎[17]。近紅外光譜分析不同于化學分析方法,它是一種間接分析技術,需要用統計方法在樣品的嫩度屬性與近紅外光譜數據建立一個訓練模型,這就需要采集一些樣本的光譜和嫩度數據建立訓練集,一般采集的近紅外光譜會包含一些與待測樣本性質無關的因素帶來的干擾,導致基線漂移、高頻隨機噪聲和光散射[18],此外在采集的過程中沒有經過化學處理,所以直接采集的近紅外光譜數據可能會出現背景復雜化的情況,因此對原始近紅外光譜數據進行預處理是非常有必要的。采用上述實驗方法獲得180組羊肉的近紅外光譜數據,得到有效數據174組,采用matlab2016軟件進行分析處理,原始光譜曲線如圖1所示。原始嫩度數據的直方圖如圖2所示,它顯示了整體嫩度數據的分布情況,可以看出數據的產生過程比較穩定。數據預處理方法有很多種,如一階導數法、二階導數法、S-G平滑法、小波變換法、多元散射校正等,本文在對比了多種預處理方法之后決定使用多元散射校正法進行數據預處理,這種方法能有效地去除外在因素對光譜造成的影響,可以從圖3看出這種預處理方法消除了很多冗余信息,對整個數據的影響較大。

圖2 羊肉嫩度直方圖圖

圖3 多元散射校正預處理之后的光譜
根據交叉驗證法中的留一法的算法[19],即把整個數據分成N組,每組選一個數據作為測試集,最終通過比較,174組數據中分成7組,選24個樣本作為測試集時最合適的。
文中采用SPA算法對原始數據和多元散射校正預處理后的數據分別進行數據處理。對原始數據的處理中,在RMSE=0.573 26的情況下選取了五個特征波長,如圖4和圖5所示,波長分別是907 nm、967 nm、1 264 nm、939 nm和1 511 nm。對從原始數據獲取的特征波長使用最小二乘法進行建模,從174組實驗樣品數據中選取150組進行建模,其他24組樣品用來驗證模型。圖8為使用特征波長對原始數據的最小二乘法建模預測效果圖,交叉驗證均方差為0.121 62,預測均方差為0.573 26,預測精度為0.958 47,相關系數的數值是0.859 41,滿足了建模和預測的基本需求。

圖4 SPA對原始數據選取的特征變量數目

圖5 SPA對原始數據選取的特征變量
結合最小二乘法使用特征波長對多元散射校正(MSC)預處理后的數據進行處理,在RMSE=0.508 73的情況下選取了五個特征波長,如圖6和圖7所示,波長分別是 907 nm、989 nm、1 117 nm、939 nm和1 735 nm。對上述特征波長使用最小二乘法進行建模,從174組實驗樣品數據中選取150組進行建模,其他24組樣品用來驗證模型。圖9為使用特征波長對多元散射校正預處理后的數據的最小二乘法建模預測效果圖,交叉驗證均方差為0.181 25,預測均方差為0.508 73,預測精度為0.963 29,預測精度明顯提高,相關系數的數值提升到0.877 5,可見,多元散射校正在去噪聲、去散射等方面有很好的作用。表1給出了兩種數據進行建模的預測情況,可以更直觀的看出對多元散射校正預處理后建立的模型的預測效果明顯好于對原始信號進行建模。

圖6 SPA對MSC預處理后的數據特征變量選取的數目

圖7 SPA對MSC預處理后的數據選取的特征變量情況

圖8 特征波長對原始數據建立模型圖

圖9 特征波長對MSC預處理過的數據建立模型

表1 羊肉訓練集和預測集嫩度信息表
文中使用SPA對原始數據和經過多元散射校正預處理之后的數據進行篩選特征波長,選中的特征波長個數均為5,篩選出的特征波長有兩對是相同的,可見多元散射校正預處理方法在去掉冗余信息的同時能保存數據的原始狀態。針對篩選的特征波長使用最小二乘法進行建模,174組數據隨機選出150組用作訓練集,24組用作測試集。從建模后的嫩度預測的參數可以看出使用多元散射校正預處理數據建立的模型預測能力明顯優于原始數據。這一結論對相關方面的研究有很好的指導作用。