◎ 蔡佳玲,王 旭,蔡 強,李武超,諸 寅
(1.浙江清華長三角研究院,浙江 嘉興 314006;2.浙江工業大學,浙江 杭州 310014;3.嘉興職業技術學院,浙江 嘉興 314036)
隨著經濟的發展,人民生活水平提高,奶粉品質成為老百姓關注的焦點。奶粉中營養物質含量是評價乳制品品質的重要指標。奶粉營養物質含量的檢測方法有很多,以蛋白質為例,主要方法有凱氏定氮法、分光光度法、燃燒法、高效液相色譜法、質譜法、熒光法和紅外光譜法等。目前,常用的檢測方法是凱氏定氮法(國家標準),但是存在測量方法復雜、檢測速度慢、檢測結果誤差較大的缺點[1]。
傅里葉變換紅外光譜法(FTIR)具有宏觀整體鑒定復雜體系的優點以及無損快速的特點,目前多用于藥用動、植物等領域的真偽優劣鑒別[2-3]。運用紅外光譜法結合支持向量機回歸和偏最小二乘法建模對奶粉進行質量檢測,無需分離提取,步驟簡單、快速,結果直觀準確。與傳統檢測方法相比具有簡單、快速,人員培訓成本低,可實現遠程分析、在線分析等優點。單楊等人對獲得的奶粉近紅外光譜圖,以小波變換-徑向基神經網絡模型建模,對蛋白質和脂肪進行定量分析,蛋白質的預測集相關系數(Rp)和均方根誤差分別為0.994、0.004,脂肪的預測集相關系數(Rp)和均方根誤差分別為0.990、0.007[4]。張華秀利用近紅外光譜分析技術結合Boosting-PLS對建模牛奶中蛋白質、脂肪的含量進行快速定量分析,其中蛋白質含量定量分析模型的相關系數為0.996,預測誤差均方根0.315 9[5]。近年來,關于營養物質的檢測開始細化。穆同娜、莊勝利等采用近紅外光譜法結合偏最小二乘法(PLS)建模定量分析嬰幼兒配方奶粉中的總脂肪酸、飽和脂肪酸和不飽和脂肪酸含量,其校正模型相關系數(R2)分別為0.933 7、0.937 4、0.902 0,RPD分別為3.63、3.65、2.90[6]。
奶粉:共303種,包含超市和網上的愛他美、蒙牛、合生元、美素佳兒、伊利、惠氏、諾優能、雅培、貝因美等國內外76種品牌,包括嬰幼兒奶粉、青少年奶粉、學生奶粉、女士奶粉、中老年奶粉、孕婦奶粉、羊奶粉等。
溴化鉀:德國Merck公司。
Nicolet iS5傅立葉變換紅外光譜儀,美國ThermoFisher公司;FD240電熱鼓風干燥箱,德國Binder公司。
樣品經低溫烘干、研磨后與KBr混合,研勻壓片,用Nicolet iS5傅立葉變換紅外光譜儀采集中紅外光譜圖,掃描范圍7 800~350 cm-1,峰-峰噪音小于1×10-5,光譜分辨率優于0.8 cm-1。
交叉驗證是將原始數據進行分組,一部分作為校正集,另一部分為驗證集:用校正集對模型進行訓練,再利用驗證集測試模型效果,以相關系數、誤差均方根作為模型的性能指標[7]。選用Hold-Out方法評價模型,將原始數據分成校正集和驗證集:采用Kennard-Stone算法進行區分,進行交叉驗證,記錄相關系數和均方根誤差評價建模效果[7]。
以130個樣本為校正集,65個樣本為驗證集,第一、第二主成分譜圖計算數據的得分如圖1所示,結果表明校正集和驗證集的分布比較一致。

圖1 校正集與驗證集主成分得分分布圖
樣品的中紅外光譜圖除了包含樣品自身信息,還攜帶了很多無關信息。選擇合適的預處理方法光譜預處理能夠減弱無關信息,降低噪聲,提高建模效果。常用預處理方法有平滑、傅里葉變換、微分、小波變換、標準正態變量變換歸一化與標準化、多元散射校正等。分別用上述處理方法單獨或疊加對樣品紅外光譜圖進行預處理,并用偏最小二乘法建模,對比不同方法的預處理效果,具體流程如圖2所示。

圖2 預處理方法選擇流程圖
結果表明,蛋白質定量分析用標準正態變量變換(SNV)結合提取前14個主成分預處理效果最好,相關系數R達到0.961 2,預測均方根誤差為0.883 8;脂肪含量定量分析以標準正態變量變換結合提取前20個主成分預處理效果最好,相關系數R達到0.960 1,預測均方根誤差為1.101 4;碳水化合物含量定量分析以小波變換預處理效果最好,相關系數R為0.903 9,預測均方根誤差為2.059。
2.3.1 偏最小二乘法
偏最小二乘法(Partial least squares regression,PLS)是最常用的定量分析方法之一。PLS在近紅外光譜乳制品分析中得到廣泛應用,趙明富、施玉佳、羅彬彬等人對牛奶的透射光譜用偏最小二乘法建模定量分析其蛋白質和脂肪的含量[8]。呂麗娜等對牛奶用近紅外光譜以偏最小二乘法建模定量分析牛奶中蛋白質和脂肪含量,其中蛋白質定量分析模型相關系數R為0.921,均方根誤差RMSE為1.02[9]。
偏最小二乘法(PLS)同時提取自變量、因變量主成分,并考慮了兩者的相關程度,提取相關程度最大的主成分。這樣提取了最大變異信息,增加結果對原數據的解釋能力。
2.3.2 支持向量機回歸
支持向量機回歸(Support vector machine regression,SVM)是一種在高維建立分類超平面作為決策曲面,使得正例、反例之間隔離邊緣最大化的非線性回歸方法[10]。
支持向量機建模效果與參數選擇有關,研究表明支持向量機類型選擇、核函數的選擇對建模效果影響不大,影響建模效果的關鍵是核函數參數的選擇[11]。
本研究采用epsilon-SVR和徑向基核函數,并以遺傳算法進行SVM參數尋優。需篩選的參數有epsilon-SVR的損失函數值p、徑向基核函數γ、epsilon-SVR設置參數c。
用支持向量機方法建模,用遺傳算法篩選支持向量機參數得到模型,用模型預測驗證集得到結果進行評價。多次測試得出最佳結果,見表1。

表1 3種物質遺傳算法結合支持向量機回歸建模效果表
結果顯示,蛋白質、脂肪、碳水化合物對蛋白質含量定性分析,SVM預測效果好于PLS,而對脂肪、碳水化合物含量定量分析效果差于PLS。
奶粉的營養成分種類很多,但蛋白質、脂肪及碳水化合物占奶粉營養成分總量的85%~95%,對這3類營養物質含量及組分的分析可基本確定奶粉的質量[12]。通過比對實驗確認蛋白質定量分析模型用標準正態變量變換結合提取前14個主成分進行預處理,用遺傳算法篩選模型參數,用支持向量機回歸建模效果最好,相關系數為0.971 1,預測均方根誤差為0.857 1;脂肪定量分析模型用標準正態變量變換結合提取前20個主成分預處理,用偏最小二乘法建模效果最佳,預測集相關系數0.960 1,預測均方根誤差1.101 4;碳水化合物定量分析模型用小波變換預處理,偏最小二乘法建模效果最佳,相關系數0.903 9,預測均方根誤差2.028 4。