曾路路 涂 斌 尹 成 鄭 曉 宋志強 何東平 亓培實
激光近紅外結合SVM的花生油摻偽定性定量分析
曾路路1涂 斌1尹 成1鄭 曉1宋志強1何東平2亓培實3
(武漢輕工大學機械工程學院1,武漢 430023)
(武漢輕工大學食品科學與工程學院2,武漢 430023)
(武漢百信環保能源科技有限公司3,武漢 430023)
利用激光近紅外技術結合支持向量機(support vector machines,SVM)對花生油摻偽進行定性和定量分析。使用激光近紅外光譜儀采集188個摻入餐飲廢棄油、大豆油、玉米油以及菜籽油的花生油樣品光譜圖。結果表明,建立的SVC分類模型均能實現100%的預測準確率,但經提取波長后的模型的變量變少,由全波段的451個波長數減少為136個。建立的SVR回歸模型也能準確預測花生油中摻偽油的含量,其中非全波段模型參與建模變量變少,由451個降低到66個,預測精度也更高,校正集和測試集相關系數分別達到99.88%、99.90%,均方根誤差都低于6.99E-4。由此可知,特征波長提取方法不僅可以減少建模變量,提高建模效率,也能夠提高模型的預測能力。結果表明,運用激光近紅外結合SVM可以實現花生油摻偽油脂的定性和定量分析。
激光近紅外 花生油 支持向量機 定性和定量 后向偏最小二乘法
花生油是我國主要的食用油之一,營養價值高。目前有不少不法商販為了牟取暴利對食用植物油進行摻假[1]。如在花生油中加入大豆油、菜籽油等價值稍低的食用油,有的甚至在花生油中摻入蓖麻油、餐飲廢棄油等對人體有危害的非食用油[2-3]。為了杜絕不法摻假行為,目前的常規檢測方法有感官檢測、理化檢測等。但常規檢測方法很難檢測混合油的摻入成分及摻偽量,因此越來越多的學者開始重視儀器分析法[4]。目前利用近紅外光譜(Near Infrared,NIR)來檢測橄欖油的摻偽,其準確率可達到98%[5]。而激光近紅外技術因其以新型的超輻射發光二極管(super luminescent Light Emitting Diode,SLED)作為光源,有著低噪聲、寬光譜以及高能量等特點,并且線性度、單色性較鹵鎢燈更好,比近紅外技術更有優勢[6]。近紅外光譜技術是利用近紅外譜區內包含的物質信息,實現對有機物定性和定量分析[7]。目前,近紅外光譜技術已在石油化工、農業、食品、高分子、醫學制藥等許多領域中發揮著積極作用[8]。近紅外分析技術在油脂檢測方面的應用主要體現在油脂種類分類檢測、油脂品質分析以及油脂摻偽鑒別[9-11]。
本試驗采用激光近紅外技術對花生油摻偽進行摻偽種類的定性分析和摻偽量的定量分析。采用支持向量機分類(Support Vector Machine Classifier,SVC)和支持向量機回歸(Support Vector Machine Regression,SVR)建立食用植物油定性和定量判別模型。對激光近紅外圖譜進行3種不同的預處理,采用后向偏最小二乘法(Backward interval Partial Least Squares,BiPLS)提取特征波長。旨在提出一種有效的定性、定量判別模型,實現對花生油摻偽種類和濃度快速、準確的鑒別。
樣品主要是從一些地區分批次收集的餐飲廢棄油脂和從超市購買的不同品牌、不同品種的合格食用植物油(13種大豆油、12種菜籽油、4種玉米油、7種花生油)。隨機抽取收集到的植物油品牌(大豆油:錦麟、福臨門;玉米油:長壽花金胚玉米油、福臨門;菜籽油:金龍魚外婆鄉小榨、魯花)和餐飲廢棄油按一定比例摻入純花生油。以2%的等差梯度,配制摻偽油脂質量分數為3%~95%的二元體系花生油摻偽樣品。每份為10 g,置于離心管中混合均勻。共獲得188份摻偽食用植物油樣品。
試驗采用光譜-理化值共生距離算法(sample set partitioning based on joint X-Y distances algorithm,SPXY)[12]以3∶1 的比例將樣品劃分成校正集和測試集,其中校正集樣品用于建立模型,測試集樣品用于檢測模型預測性能的優劣。樣品實際種類、編號和校正集及預測集樣品數量如表1所示。

表1 樣本種類、編號以及數量
試驗儀器為實驗室研發的激光近紅外植物油品質快速檢測儀采集光譜,其中XL410型激光近紅外光譜儀:光譜測定范圍為1 350~1 800 nm,掃描次數32次,分辨率為3.5 cm-1美國AXSUN公司;試驗采用激光近紅外光譜儀自帶的軟件對樣品進行圖譜采集,用CAMO公司Unscramble 10.2化學計量學軟件和美國Math Works公司的MATLAB_R2012a對所采集的數據進行預處理和建模。
圖譜采集:將裝有樣品的試劑瓶放入水浴鍋中加熱至40℃,恒溫靜置10 min,取光程為5 mm的比色皿,用移液管將樣品注入比色皿至3/4處,將裝有樣品的比色皿放入樣品池,采集圖譜。每個樣品采集3次,取平均值作為最終的圖譜數據。每測量一次,將比色皿用有機溶劑洗滌并干燥后再進行下一次測量。試驗期間盡量保證室溫(25℃)、光線、濕度基本一致。所采集的近紅外光譜原始數據圖如圖1所示。

圖1 188份原始圖譜
2.1.1 圖譜預處理
近紅外光譜儀在對樣品進行采集時,除了可以得到分析樣品所必需的信息外,還會有其他無關信息。為了得到試驗所需信息,必須對所采集的光譜數據進行預處理[13]。對校正集和測試集樣本采用:標準正態變量變換(standard normal variate,SNV)來消除光譜的基線漂移;背景趨勢去除技術(De-trending,DT)消除光程的影響;多元散射校正(multiplicative scatter correction,MSC)消除散射的影響。圖2為DT預處理后的光譜圖。

圖2 DT預處理光譜圖
2.1.2 特征波長的提取
建立模型時,波段的選擇對模型的測試精度有著一定的影響。波段選取過寬,會導致信息冗余,對建模造成干擾;波段選取過窄,可能會丟失分析時所必需的信息[14]。為了得到精度較高的測試結果,需要選取適當的波長范圍。間隔偏最小二乘法(iPLS)是一種有效的特征波長提取方法,其原理是將整個光譜圖分成若干個子區間,在每個子區間上進行偏最小二乘法回歸,建立局部模型。以交互驗證均方差(RMSECV)為標準,分別比較全譜模型和局部模型的RMSECV值,取RMSECV值最小的模型所在區間為最佳區間[15]。后向偏最小二乘法(BiPLS)是iPLS的改進和延伸[16]。預處理后的數據經過BiPLS選擇后的特征波長數量及對應的位置見圖3。

圖3 DT-BiPLS特征波長
2.1.3 全波段和BiPLS特征波長建模
由近紅外光譜掃描所得光譜圖可以看出,所有的原始圖譜相差不大,需要通過建立花生油摻偽品種的判別模型才能區分它們之間的差異[17]。支持向量機(support vector machines,SVM)是Vapnik 等[18]根據統計學理論提出的一類新型機器學習方法,用于模式識別分類,函數逼近和非線性回歸等實際問題,可細分為支持向量機分類(SVC)和支持向量機回歸(SVR)2種方法。SVM用于模式識別時,需要對核函數及其參數進行選擇,本試驗采用具有較寬收斂域的RBF 核函數[19]。
分別將3種不同預處理的全波段變量和經Bi-PLS提取的特征波長變量作為SVM的輸入量,選用RBF核函數,采用網格搜索算法對組合參數(C,g)進行尋優,分別在全波段和特征波長變量建立SVC鑒別模型,根據樣品預測集的準確率來評價模型的好壞[20]。表2為3種預處理的定性模型評價指標。

表2 全波段與BiPLS特征波長SVC模型的測試結果
原始數據在全波段和特征波長建模的測試準確率低于預處理后的準確率,說明預處理對模型的結果有很大影響。3種預處理在全波段建模和特征波長建模的測試準確率均高達91.49%以上,均能很好地實現對花生油摻偽種類地判別。采用MSC預處理方法在全波段與特征波長建模的測試集和校正集準確率均為100%,且在全波段建模的參數小,效果最好。而采用SNV預處理方法在特征波長建模的測試準確率高于全波段建模的準確率,波長數也由原來的451減少到了136,大大縮短了建模時間,說明特征波長提取對模型的結果也是有一定影響的。圖4為MSC-SVC結果圖。綜上所述,原始數據與采用3種預處理方法在全波段與特征波長建模都可以實現對花生油摻偽種類的判別,且采用預處理方法可以提高模型的準確率。在考慮建模時間的影響時,運用特征波長建模方法可減少建模時間。

圖4 MSC-SVC模型預測結果
2.2.1 特征波長提取
對光譜圖進行SNV、MSC、DT預處理后,采用Bi-PLS將其劃分成20個子區間,不同預處理后的數據經過BiPLS選擇后的特征波長數量圖及對應的位置圖如圖5所示,原始數據和經3種不同預處理方法預處理后的數據,經過BiPLS提取后的波長數目以及對應的測試均方根誤差(RMSE)如表3所示。

圖5 SNV-BiPLS特征波長

表3 不同預處理光譜經BiPLS提取的特征波長
2.2.2 全波段和特征波長建模
采用SVR方法,將3種不同預處理數據的全波段變量和經BiPLS提取的特征變量作為輸入量,采用網格搜索算法對組合參數(C,g)進行參數尋優,建立摻偽油脂定量預測模型[21],結果如表4所示。3種不同預處理方法建立的SVR模型測試相關系數均在99.04%以上,均方根誤差低于6.99E-4,均能很好地判斷花生油的摻偽量。預處理方法能夠提升模型的測試效果,對建模結果有一定的影響。全波段和特征波長建模的測試結果相差不大,但經特征波長提取的模型可以剔除許多無關信息,建模變量可以由原來的451個降低到66個,縮短了建模時間。試驗表明,MCS-BiPLS-SVR模型的波長數少,參數小,穩定性好。圖6為MSC-BiPLS-SVR模型預測結果。綜上所述,原始數據與采用3種預處理方法后在全波段與特征波長建模均能實現對花生油的定量分析,預處理方法可提高模型的測試能力,運用特征波長建模可縮短建模所需時間。

圖6 MSC-BiPLS-SVR模型預測結果

表4 全波段和BiPLS優選波長SVR模型評價指標
運用激光近紅外技術結合支持向量機算法可以實現花生油摻偽的定性定量分析。結果表明,對于定性分析,建立的SVC和BiPLS-SVC模型均能實現摻偽油種類鑒別;對于定量分析,建立的SVR和BiPLS-SVR模型都可以實現摻偽油含量預測;預處理方法能夠提高模型的預測能力,減小參數組合(C,g)值;特征波長提取方法在保證模型預測效果的前提下,減少了建模變量,縮短了建模時間。本研究為其他食用植物油摻偽檢測提供方法。試驗的不足之處在于摻偽樣本數量有限,且摻偽種類少,在以后的研究中要加大食用植物油摻偽樣本的搜集和配置。
[1]李娜.食用油安全問題淺析[J].中國糧食經濟,2008(3):17-18
Li Na.Oil security analysis[J].China Grain Economy,2008(3):17 -18
[2]潘紅紅,梁潤,萬渝平.問題食用油儀器分析方法研究進展[J].農業工程,2013,3(5):76 -80
Pan Honghong,Liang Run,Wan Yuping.Research advance in instrument method for edible oil[J].Agricultural Engineering,2013,3(5):76 -80
[3]鄒潔,趙維佳,汪海峰,等.大豆油中摻偽棕櫚油的檢測方法研究[J],中國油脂,2009,34(4):73 -76
Zou Jie,Zhao Weijia,Wang Haifeng,et al.Determination of palm oil adulterated in soybean oil[J].China Oils and Fats,2009,34(4):73 -76
[4]沈雄,鄭曉,何東平.餐飲業廢棄油脂鑒別檢測方法研究進展[J].中國油脂,2011,36(11):49 -51
Shen Xiong,Zheng Xiao,He Dongping.Advance in differential detection method of waste cooking oil[J].China Oils and Fats,2011,36(11):49 -51
[5]薛雅琳,王雪蓮,張蕊,等.食用植物油摻偽鑒別快速檢驗方法研究[J].中國糧油學報,2010,25(10):116 -118
Xue Yalin,Wang Xuelian,Zhang Rui,et al.An authentication method of edible vegetable oils[J].Journal of the Chinese Cereals and Oils Association,2010,25(10):116 -118
[6]劉燕德,萬常斕.芝麻油摻偽的近紅外透射光譜檢測技術[J].農業機械學報,2012,43(7):136 -140
Liu Yande,Wan Changlan.Analysis of sesame oil adulteration using near infrared transmission spectroscopy[J].Transactions of the Chinese Society for Agricultural Machinery,2012,43(7):136 -140
[7]張勇,叢茜,謝云飛,等.NIRS分析技術在農業中的應用進展[J].農業工程學報,2007,23(10):285 -290
Zhang Yong,Cong Qian,XieYunfei,et al.Progress in application of near infrared spectroscopy technology in agriculture[J].Transactions of the Chinese Society of Agricultural Engineering,2007,23(10):285 -290
[8]王菊香,邢志娜,申剛,等.光譜預處理和波長選擇對混胺燃料各指標近外光譜定量分析結果的影響比較[J].計算機與應用化學,2013,30(1):39 -42
Wang Juxiang,Xing Zhina,Shen Gang,et al.Effects of spectral preprocessing and wavelength selection on content determination in mixed - amine by NIR spectroscopy[J].Computers and Applied Chemistry,2013,30(1):39 -42
[9]黃富榮,羅云瀚,鄭仕富,等.全血膽固醇、甘油三酯近紅外光譜分析與模型優化[J].光學學報,2011,31(10):267-272
Huang Furong,Luo Yunhan,Zheng Shifu,et al.Near- infrared spectroscopic analysis and model optimization on cholesterol and triglyceride in whole blood[J].Acta Optica Sinica,2011,31(10):267 -272
[10]王銘義,郭建英,張佳寧,等.三級大豆油酸價的近紅外光譜檢測[J].食品科學,2011,32(22):171 -174
Wang Mingyi,Guo Jianying,Zhang Jianing,et al.Determination of acid value in third grade soybean oil by near infrared spectroscopy[J].Food Science,2011,32(22):171 -174
[11]宋鵬,張明,曹劉霞,等.食用油脂摻入異種油脂檢測方法研究進展[J].糧食與油脂,2009(11):4 -8
Song Peng,Zhang Ming,Cao Liuxia,et al.Current advances in detection of mixed different edible oils and fats[J].Cereals & Oils,2009(11):4 -8.
[12]劉善梅,李小昱,鐘雄斌.考慮品種差異的冷鮮豬肉含水率高光譜信號補正算法[J].農業工程學報,2014,30(4):272 -278
Liu Shanmei,Li Xiaoyu,Zhong Xiongbin.Hyperspectral signal correction algorithm for water content of cold fresh pork with considering difference between varieties[J].Transactions of the Chinese Society of Agricultural Engineering,2014,30(4):272 -278
[13]宋志強,沈雄,鄭曉,等.應用近紅外光譜對低碳數脂肪酸含量預測[J].光譜學與光譜分析,2013,33(8):2079 -2082
Song Zhiqiang,Shen Xiong,Zheng Xiao,et al.Low carbon number fatty acid content prediction based on near-infrared spectroscopy [J].Spectroscopy and Spectral Analysis,2013,33(8):2079 -2082
[14]楊仁杰,劉蓉,徐可欣.二維相關光譜結合偏最小二乘法測定牛奶中的摻雜尿素[J].農業工程學報,2012,28(8):259 -263
Yang Renjie,Liu Rong,Xu Kexin.Detection of urea in milk using two-dimensional correlation spectroscopy and partial least square method[J].Transactions of the Chinese Society of Agricultural Engineering,2012,28(8):259 -263
[15]黃富榮,李仕萍,余健輝,等.基于iPLS的血清膽固醇、甘油三酯近紅外定量分析[J].光譜實驗室,2011,28(8):2774-2778
Huang Furong,Li Shiping,Yu Jianhui,et al.Determination of cholesterol and triglyceride in serum based on interval partial least squares by near- infrared spectrum[J].Chinese Journal of Spectroscopy Laboratory,2011,28(8):2774-2778
[16]石吉勇,鄒小波,趙杰文,等.BiPLS結合模擬退火算法的近紅外光譜特征波長選擇研究[J].紅外與毫米波學報,2011,30(5):458 -462
Shi Jiyong,Zou Xiaobo,Zhao Jiewen,et al.Selection of wavelength for strawberry NIR spectroscopy based on BiPLS combined with SAA[J].Journal of Infrared and Millimeter Waves,2011,30(5):458 -462
[17]蔣雪松,陸輝山,張林,等.基于近紅外光譜對老陳醋的pH值和可溶性固形物定量與定性的檢測研究[J].紅外技術,2013,35(11):737 -740
Jiang Xuesong,Lu Huishan,Zhang Lin,et al.Qualitative and quantitative detection research of mature vinegar’s pH and SSC based on near infrared spectroscopy[J].Infrared Technology,2013,35(11):737 -740
[18]方慧文,曾愛民,江小明,等.近紅外光譜結合化學計量學技術在食品摻假分析中的應用[J].食品安全質量檢測學報,2012,3(5):427 -431
Fang Huiwen,Zeng Aimin,Jiang Xiaoming,et al.Application of near-infrared spectroscopy combined with chemometrics in food adulteration detection[J].Journal of Food Safety & Quality,2012,3(5):427 -431
[19]付元元,任東.支持向量機中核函數及其參數選擇研究[J].科技創新導報,2010(9):6 -7
Fu Yuanyuan,Ren Dong.Approach to SVM kernel functions parameters selection[J].Science and Technology Innovation Herald,2010(9):6 -7
[20]鐘燕萍,鐘振聲,陳蘭珍,等.近紅外光譜技術定性鑒別蜂蜜品種及真偽的研究[J].現代食品技術,2010,26(11):1280 -1283
Zhong Yanping,Zhong Zhensheng,Chen Lanzhen,et al.Qualitative identification of floral origin and adulteration of honey by near- infrared spectroscopy[J].Modern Food Science &Technology,2010,26(11):1280 -1283
[21]Shen Xiong,Zheng Xiao,Song Zhiqiang,et al.Rapid identification of waste cooking oil with near infrared spectroscopy based on support vector machine[J].Computer and Computing Technologies in Agriculture,2012,(10):11 -18.
Qualitative and Quantitative Analysis of Peanut Oil Adulteration by Laser Near Infrared Spectroscopy with SVM
Zeng Lulu1Tu Bin1Yin Cheng1Zheng Xiao1Song Zhiqiang1He Dongping2Qi Peishi3
(School of Mechanical Engineering,Wuhan Polytechnic University1,Wuhan 430023)
(College of Food Science and Engineering,Wuhan Polytechnic University2,Wuhan 430023)
(Pashun Group3,Wuhan 430023)
Qualitative and quantitative analyses of peanut oils adulteration were performed by combining near infrared(NIR)spectroscopy with support vector machines(SVM).With NIR spectrometer,the spectra of 188 peanut oil samples adulterated with waste oil,soybean oil,corn oil and canola oil were collected.Experiments demonstrated that with the SVC models,the accuracy of prediction reached to 100%.Upon wavelengths extraction,the wavelength number of full spectrum was reduced from 451 to 136.With the SVR regression models,the adulterated content of peanut oil could be predicted accurately,of which,the number of modeling variables for the non - full spectrum models was reduced from 451 to 66 with higher accuracy of prediction.Correlation coefficients of calibration and test sets reached to 99.88%and 99.90%,respectively.All the root-mean-square errors were lower than 6.99E-4.On this basis,the characteristic wavelengths extraction not only reduced modeling variables and improved the modeling efficiency,but improved the modeling predictive capability.It was validated by results that the combination of NIR spectroscopy with SVM could realize the qualitative and quantitative analyses of adulteration of peanut oil.
NIR,peanut oil,support vector machines,qualitative and quantitative,BiPLS
O657.3
A
1003-0174(2016)08-0126-06
“十一五”國家科技支撐計劃(2009BADB9B08),武漢市科技攻關計劃(2013010501010147),武漢工業學院食品營養與安全重大項目培育專項(2011Z06),武漢輕工大學2014年研究生創新基金(2014cx005)
2014-12-04
曾路路,女,1991年出生,碩士,智能檢測技術
鄭曉,男,1958年出生,教授,油脂壓榨原理與智能檢測