周小華,張 玫,相秉仁
(1.江蘇省食品藥品監督檢驗研究院,江蘇南京 210008;2.中國藥科大學,江蘇南京 210009)
近紅外光譜結合區間偏最小二乘法應用于花生油酸價的測定
周小華1,張 玫1,相秉仁2
(1.江蘇省食品藥品監督檢驗研究院,江蘇南京 210008;2.中國藥科大學,江蘇南京 210009)
采用近紅外光譜法結合不同區間偏最小二乘波長篩選法建立花生油酸價的定量分析模型。采用酸堿滴定法測定花生油樣本的酸價同時采集近紅外光譜數據;采用區間偏最小二乘法(iPLS)、向后區間偏最小二乘法(BiPLS)、移動窗口偏最小二乘法(mwPLS)優選光譜特征區間;采用偏最小二乘法(PLS)對優選出來的譜段建立酸價的定量模型。結果表明,采用mwPLS選擇的譜段建立的模型預測效果最佳,RMSECV和RMSEP分別為0.247 76和0.131 5,校正相關系數和預測相關系數分別為0.993 2和0.996 9。因此,近紅外光譜結合移動窗口偏最小二乘法可以快速準確測定花生油的酸價。
近紅外;區間偏最小二乘;花生油;酸價;定量分析
食用油中游離脂肪酸含量的多少,反映了食用油質量、精煉程度和儲藏品質變化,它是食用油品質評定的重要指標,常用酸價來表示。酸價以中和1 g油脂中的游離脂肪酸所需氫氧化鉀的毫克數表示。國家標準中,食用油的檢測是利用酸堿滴定的方法測定酸價。這種方法過程繁瑣,需要消耗很多有機試劑,不便于現場檢測。近紅外光譜法具有快速、無損、環保等特點[1],近年來在食用油有關成分的檢測應用方面有一定的報道[2-5],Yulan Rao等[5]首次將近紅外光譜法應用于花生油酸價的測定,結果較佳,校正相關系數為0.972 5,校正均方根誤差為0.308,預測相關系數為0.937 9,預測均方根誤差為0.333。本實驗采用近紅外光譜法結合不同區間偏最小二乘波長篩選法建立花生油中的酸價的定量分析模型,旨在利用改進偏最小二乘法可以有效提取復雜體系中目標光譜信息的優點,提高花生油中酸價定量模型的預測精度及穩定性。
1.1 材料
花生油:市售,一共采集117個樣品。
1.2 儀器
MPA型傅立葉變換近紅外光譜儀:德國Bruker公司,配有液體光纖探頭和InGaAs檢測器,以及
OPUSTM近紅外操作軟件包。
1.3 方法
1.3.1 花生油酸價測定[6]。
按照國標GB 2716—2005規定的酸堿滴定法對117個樣品的酸價進行測定。
1.3.2 近紅外光譜采集
液體光纖漫反射測樣:量取樣品15 mL裝于20 mL燒杯中。掃描次數:64次,分辨率:8 cm-1,掃描范圍:4 000~12 000 cm-1。每個樣品重復測定6次,取其平均光譜。測樣溫度:25℃?;ㄉ蜆悠返慕t外原始圖譜如圖1。

圖1 花生油樣品的近紅外原始圖譜
1.4 數據處理
考察了區間偏最小二乘法(iPLS)、向后區間偏最小二乘法(BiPLS)以及移動窗口偏最小二乘法(mwPLS)這三種波長篩選法對花生油中酸價檢測的影響。用內部交叉驗證均方根誤差(RMSECV)和校正相關系數(Rc)評估校正模型的質量,用預測均方根誤差(RMSEP)和預測相關系數Rp檢驗所建立模型的預測效果。所有的數據分析都在MATLAB?7.0上實現。
實驗選用市售花生油117個,根據Kennard-Stone算法[7]選取78個樣品作為訓練集,39個作為預測集。
2.1 iPLS模型
將整個光譜區域劃分為10、11、12、……、19、20個子區間,以考察不同數目的子區間劃分對模型性能以及最佳波長區間的影響。表1列出了不同子區間劃分的最佳局部模型的結果。由表1可以看出,在不同的區間劃分中,最佳局部模型的子區間主要集中在4 500~5 500 cm-1這一光譜區域內。建立在第18個子區間上的模型是所有模型中預測能力最強的一個,其交互驗證均方根誤差(RMSECV)值為0.222 1,因此,采用這一光譜區域(4 886.9~4 443.4cm-1)建模,并對驗證集樣品進行預測,其校正相關系數(Rc)為0.991 8,預測相關系數(Rp)和預測均方根誤差(RMSEP)分別為0.996 7和0.184 1。

表1 不同區間劃分時各部分的最佳模型
2.2 BiPLS模型
將光譜劃分為20個子區間進行BiPLS運算,從表2可以看出,根據最小RMSECV的原則,建立在2個子區間上的PLS模型為最佳模型。該PLS模型校正時的相關系數(Rc)和校正均方根誤差(RMSECV)分別為0.991 5和0.226 9,預測時的相關系數(Rp)和預測均方根誤差(RMSEP)分別為0.995 3和0.192 9。

表2 向后區間偏最小二乘法(BiPLS)優化結果
2.3 mwPLS模型
將窗口的寬度設置為95個波長通道跨度,窗口從左向右以每次一個波數點的速度移動,圖2給出了所建立的一系列寬度為95個波長的窗口偏最小二乘模型的性能譜RMSECV曲線,圖中的虛線表示基于全譜含有11個潛變量的最優全局偏最小二乘模型的交互驗證均方根誤差,RMSECV=0.853 7。圖中的光譜圖為樣本集的均值譜,進行了比例調節,以便對應和確定最優的建模窗口,圖中以橢圓示出了較優區域。并在此區域建立PLS模型,以含有6個潛變量的模型的性能最好,RMSECV=0.247 76。為了比較特征譜段建模與全譜建模的差異,采用PLS法對全譜進行了建模,結果見表3。可見mw-PLS模型的預測精度最好,表4列出了mwPLS模型預測集中39個樣品酸價的真實值與預測值。

圖2 mwPLS建模區間

表3 不同區間偏最小二乘法模型結果比較

表4 mwPLS模型預測集樣品酸價預測值與真實值的比較 mgKOH/g
采用區間偏最小二乘法及其改進算法篩選波段,3種方法都能有效選擇有用信息,從而提高模型的預測能力。全光譜模型的偏最小二乘模型精度并不高,區間偏最小二乘法處理所得的最佳模型,不論對校正集還是預測集模型的預測能力都好于全光譜模型,由于游離脂肪酸的含量小,花生油的近紅外光譜圖中大部分信息是與游離脂肪酸無關的干擾物質,用全譜進行建模時,引進了無關信息,不僅使得到的模型復雜化,而且降低了模型的穩定性與預測能力。用區間偏最小二乘法進行建模譜段的選擇,能有效地去除無關信息,從而提高模型的穩定性和預測能力。采用的3種方法即常規區間偏最小二乘法、向后區間偏最小二乘法以及移動窗口偏最小二乘法所得到的模型精度均好于全光譜模型。由于4 600 cm-1附近是順式不飽和脂肪酸中C=C和C-H的的合頻振動吸收,游離脂肪酸的吸收主要在這一波段,而5 500 cm-1附近是O-H伸縮振動的一級倍頻吸收,主要包含有水等非目標成分的信息,因此包括這一波段的BiPLS模型精度比iPLS和mwPLS的模型精度低。mwPLS模型的預測能力比iPLS模型的預測能力稍強(RMSEP較小),這可能是由于區間偏最小二乘法的區間固定,有效信息提取不完全的緣故。
近紅外光譜法結合移動窗口偏最小二乘法建立的花生油酸價定量模型預測準確度比現有的文獻方法高,可以實現花生油酸價的快速測定,可以用于花生油質量控制的現場檢測。
[1]陸婉珍.現代近紅外光譜分析技術[M].北京:中國石化出版社,2007.
[2]于修燭,張靜亞,李清華,等.基于近紅外光譜的食用油酸價和過氧化值自動化檢測[J].農業機械學報,2012,43(9):150-154.
[3]李書國,陳輝,李雪梅,等.食用油酸價分析檢測技術研究進展[J].糧油食品科技,2008,16(3):31-33.
[4]吳靜珠,石瑞杰,陳巖,等.食用油油酸的近紅外特征譜區優選[J].中國糧油學報,2015,30(2):118-121.
[5]Yulan Rao,Bingren Xiang,Xiaohua zhou,et al.Quantitative and qualitative determination of acid value of peanut oil using near-infrared spectrometry[J].Journal of Food Engineering,2009(93):249-252.
[6]GB 2716—2005,食用植物油衛生標準[S].
[7]Groot P J de,Postma G J,Melssen W J,Buydens L M C.Selecting a representative training set for the classification of demolition waste using remote NIR sensing[J].Anal.Chim.Acta.1999,392(1):67-75.
Determination of acid value of peanut oil by near-infrared spectrometry combined with interval partial least squares
ZHOU Xiao-hua1,ZHANG Mei1,XIANG Bing-ren2
(1.Jiangsu Food and Drug Supervision&Inspection Research Institute,Nanjing Jiangsu 210008;2.China Pharmaceutical University,Nanjing Jiangsu 210009)
Quantitative analysis model of acid value of peanut oil was performed using near-infrared spectrometry combined with different interval partial least squares(iPLS).Acid value of peanut oil were determined by acid-base titration while NIR spectra data were recorded;three improved partial least squares(PLS)methods,including interval partial least squares(iPLS),backward interval partial least-squares(BiPLS)and moving window partial least-squares(mwPLS),were used to find the most informative ranges;PLS regression models of acid value were built based on the optimal ranges.The results showed that the model by mw PLS method had the best predictive ability,the RMSECV and RMSEP were 0.247 76 and 0.131 5,and the calibration and prediction coefficient were 0.993 2 and 0.996 9.Rapidly and accurately determination of acid value of peanut oil can be achieved by NIR combined with mwPLS.
near-infrared;interval partial least squares(iPLS);peanut oil;acid value;quantitative analysis
O 657.3;TS 227
A
1007-7561(2017)02-0062-03
2016-10-27
周小華,女,江蘇南京,碩士研究生.