李子文,熊雅婷,張海紅,李宗朋,王健,馮斯雯,熊賢平,尹建軍
1(寧夏大學 農學院食品科學系,寧夏 銀川,750021)2(中國食品發酵工業研究院,北京,100015) 3(天地壹號飲料股份有限公司,廣東 江門,529000)4(華南理工大學 輕工與食品學院,廣東 廣州,510640)
?
近紅外光譜技術結合遺傳算法用于蘋果醋總酸定量分析
李子文1,2,熊雅婷2,張海紅1*,李宗朋2,王健2,馮斯雯2,熊賢平3,4,尹建軍2
1(寧夏大學農學院食品科學系,寧夏 銀川,750021)2(中國食品發酵工業研究院,北京,100015) 3(天地壹號飲料股份有限公司,廣東 江門,529000)4(華南理工大學 輕工與食品學院,廣東 廣州,510640)
利用近紅外光譜法對蘋果醋中的總酸含量進行定量分析,通過PLS法建立蘋果醋總酸定量分析模型,同時采用間隔偏最小二乘法(iPLS)、后向間隔偏最小二乘法(BiPLS)和組合間隔偏最小二乘法(SiPLS)以及遺傳偏最小二乘法(GA-PLS)對整個譜區進行光譜特征波段篩選。用決定系數(R2)、校正標準偏差(RMSEC)、預測標準偏差(RMSEP)以及最佳主因子數對模型進行評價,確定最佳建模方法。結果表明:進行特征波段篩選能夠對模型起到優化作用,并提高模型運算速度,其中GA-BiPLS及GA-SiPLS優化效果最為明顯,在極大減少蘋果醋總酸建模變量的同時,模型的R2分別達到0.989和0.986,RMSEP分別為0.042和0.044,有效地提高了模型的穩定性與準確度,表明了遺傳算法在果醋品質分析方面的巨大潛力。
蘋果醋;近紅外光譜技術;定量分析;波段篩選;遺傳算法
蘋果醋是蘋果深加工的一個重要方向,它是以蘋果、蘋果汁等為原料,經酒精發酵、醋酸發酵釀制而成的一種營養豐富、風味優良的酸性保健調味品。因其用途廣泛、功效卓越,已經成為果醋家族中的重要一員[1]。但是,目前果醋市場較為混亂,一些不法商家使用所謂的“三精一水”(香精、糖精、醋精)勾兌來進行果醋生產,嚴重影響了果醋行業的良性發展,長期飲用還會對消費者的健康造成危害。蘋果醋品質與其內部理化指標密切相關,其中總酸含量是衡量蘋果醋品質的重要指標之一。目前,國家標準所規定的測量方法為化學滴定法,整個檢測過程復雜耗時,且對檢測人員的技術水平要求較高,不能滿足蘋果醋品質快速檢測的要求。
近紅外光譜分析技術作為一種快速無損的檢測技術,具有無需樣品前處理,分析效率高,操作簡單等優點[2],近年來在食醋果醋安全檢測等方面得到了廣泛應用:郝勇等[3]采用近紅外光譜分析技術對食醋中的總酸和還原糖進行快速定量分析,為食醋品質的檢測提供了技術支持。黃曉瑋等[4]利用不同偏最小二乘法對食醋中總酸含量進行了快速檢測,且比較了各算法對模型建立的影響。王莉等[5]應用最小二乘支持向量機分析方法建立了果醋糖度快速檢測模型。以上研究均表明了近紅外光譜技術在食醋、果醋品質控制,成分分析中的巨大潛力,但目前對于蘋果醋總酸指標的近紅外分析研究仍較少,且未對模型進行深入優化。
本文擬對蘋果醋中的重要品質指標——總酸進行快速無損分析,采用間隔偏最小二乘法(iPLS)、后向間隔偏最小二乘法(BiPLS)和組合間隔偏最小二乘法(SiPLS),以及遺傳偏最小二乘法(GA-PLS)對整個譜區進行光譜波段篩選。比較分析各種光譜波段篩選方法對蘋果醋總酸預測模型的影響,降低模型的復雜程度,提高模型精度及運算速度。
1.1儀器設備
實驗使用QC-leader傅里葉變換近紅外光譜儀(北京中安信達科技有限公司)。光譜儀光源為鹵鎢燈,檢測器為溫控InGaAs,配有固體測量池及透反射蓋。光譜范圍為10 000~4 000cm-1,分辨率為8cm-1,掃描次數為32次;利用配套軟件NIRWareOperator采集蘋果醋樣品的近紅外光譜信息。
1.2材料
本試驗所用蘋果醋樣品共227個,由廣東天地壹號飲料有限公司提供,采用透反射方式掃描采集蘋果醋的近紅外光譜,標準正態變量變換(SNV)方法對光譜進行預處理。蘋果醋總酸值根據GBT12456—2008《食品中總酸的測定》,采用NaOH酸堿滴定法測定。
1.3實驗方法
1.3.1校正集與驗證集的劃分
在剔除掉3個異常點的基礎上,隨機保留50個蘋果醋樣本作為獨立測試集,以3∶1的比例對剩余174個樣本進行樣本集和驗證集劃分。本實驗采取Kennard-Stone(K-S)法[6]進行樣本集劃分。最終選擇了校正集樣本129個,驗證集樣本45個。校正集與驗證集的總酸值統計如表1所示。

表1 校正集與驗證集統計結果
1.3.2光譜變量選擇
遺傳偏最小二乘法GAPLS[7-8]是以生物進化論為基礎,模擬生物界物種競爭選擇的進化機制而建立的一種優化方法,以適應度函數為依據,通過對群體中個體施加遺傳操作來實現群體的迭代優化。但當變量數較多時,運行GAPLS可能會導致過擬合的風險[9],因此本實驗先采用iPLS[9-10]、BiPLS[11]及SiPLS[12]法對全光譜1501個變量進行預選擇,再結合GAPLS優化建模變量,最終構建定量預測模型。
1.3.3數據處理與分析
IPLS、BiPLS、SiPLS、GaPLS等程序均在MATLAB環境下運行,偏最小二乘計算應用UnscramblerX10.3光譜分析軟件(挪威CAMO公司)實現,模型的精確度與穩定性通過決定系數R2、校正標準偏差RMSEC、預測標準偏差RMSEP來評價,R2越接近1,RMSEP越接近0,RMSEC與RMSEP越接近,表明模型效果越好[13]。
2.1光譜波段優選
2.1.1間隔偏最小二乘波段選擇法(intervalPLS,iPLS)
考慮到區間分割數對選擇結果及模型的影響,將蘋果醋全光譜數據共1 501個波數點等分為k個子區間(k=10~40,間隔5),在每種分割情況下用間隔偏最小二乘法(iPLS)進行處理。當分割數為30時,iPLS所得RMSECV值最小為0.046,處理結果如圖1所示。其中,縱坐標代表各波段交叉驗證均方差(RMSECV),而虛線則表示全光譜區建模時的RMSECV值[14]。從圖1中可以看出第2、3、10和11個區間上的偏最小二乘模型的RMSECV值比全譜模型的RMSECV值小,因此本實驗選擇位于虛線以下的此四個波段進行建模,所對應的信息區間分別是4 196~4 596、5 800~6 196cm-1。

圖1 各區間模型的RMSECV值與全譜模型的RMSECV值比較圖Fig.1 Comparison of interval model’s and full spectrum’s RMSECV
2.1.2后向間隔偏最小二乘波段選擇法(backwardintervalPLS,BiPLS)
將整條光譜分為k個子區間(k=10~40,間隔5),在每種分割情況下運行BiPLS程序,采用留一法來計算RMSECV值。當分割數為15時,BiPLS所得RMSECV值最小為0.040 7,如表2所示。入選子區間為[2 12 14 13 6],所對應的信息區間分別是4 400~4 796cm-1、6 000~6 396cm-1和8 396~9 596cm-1,BiPLS共選擇了500個波長點,占全譜的33.3%。

表2 15個區間數的BiPLS優化結果
2.1.3組合間隔偏最小二乘波段選擇法(synergyintervalPLS,BiPLS)
在使用SiPLS法進行波段選擇時,不同的子區間數也會對選擇結果造成影響,同時相同的子區間數、不同的組合數的選擇結果也不盡相同[15]。因此在本實驗中,同樣將蘋果醋光譜分為k個子區間(k=10~40,間隔5),在不同分割數下,分別就不同組合數(1~4)進行計算。
當分割數為15時,入選子區間為[2 11 12 14],所得RMSECV值最小為0.039 7,所對應的信息區間分別是4 400~4 796cm-1、8 000~8 796cm-1和9 200~9 596cm-1,SiPLS共選擇了400個波長點,占全譜的26.6%,如圖2所示。

圖2 Si-PLS所選擇的最佳子區間Fig.2 Spectral region selection accomplished by Si-PLS
2.1.4遺傳偏最小二乘波段選擇法(geneticalgorithmsPLS,GAPLS)
本實驗采用GAPLS分別對iPLS、BiPLS以及SiPLS刪選出的波數變量進行進一步篩選。
GAPLS運行參數設置為:種群數30,變異概率Pm=0.01,交叉概率Pc=0.5,最大因子數10,遺傳迭代次數100次,計算每個數據點標識為“1”的概率,以RMSECV值確定出最佳的建模變量。
圖3-a、圖3-b與圖3-c分別顯示了GA-iPLS、GA-BiPLS與GA-SiPLS運算過程中各變量被選用的頻次,分別共選擇了68、126及123個波長點,占
全譜的4.5%、8.3%及8.2%。

a-GA-iPLS; b-GA-BiPLS; c-GA-SiPLS圖3 各變量被選用的頻次圖Fig.3 The frequency of each variable by chosen
2.2模型建立與評價
在上述各變量篩選方法的基礎上,分別建立蘋果醋總酸指標的全光譜-PLS,iPLS-PLS,BiPLS-PLS,SiPLS-PLS,GA-iPLS,GA-BiPLS以及GA-SiPLS定量模型,并通過計算得出最佳主因子數,同時對決定系數R2、校正標準偏差RMSEC和預測標準偏差RMSEP進行比較,以此來評價模型效果,模型計算結果如表3所示。

表3 蘋果醋總酸的不同PLS模型及性能評價結果
從表3可以看出,與全光譜相比,經光譜波段選擇之后,變量數顯著減少, R2相對增大,而RMSEP值明顯減小,主成分數有不同程度的減少,模型運算速度均有不同程度的提高,說明波段篩選能夠有效地優化模型。

GA-BiPLS與GA-SiPLS是在BiPLS及SiPLS的基礎上進一步對變量進行篩選,避免了BiPLS及SiPLS在2個相鄰波段或是一個小的區間中存在的共線變量[18],使R2進一步提高到0.989和0.986,同時RMSEP也分別減小到0.042和0.044。在保證了模型預測精度的同時,將變量數極大減少,同時有效保留了關鍵特征波長,降低了模型的復雜程度,加快了運算速度。而GA-iPLS是在iPLS法預選出的波段上進行優選,雖然減少了建模變量數,但RMSEC與RMSEP值并無十分明顯的變化。可能是由于iPLS法只能分別在1個子區間內建模的局限性,致使其他區間有效信息的遺失限制了模型效果的提高。對于蘋果醋樣本而言,相對于其余波段優化方法所建模型,GA-BiPLS與GA-SiPLS模型獲得了更好的效果。
2.3模型驗證
將50個未參與建模的樣品光譜分別帶入經GA-BiPLS和GA-SiPLS優化的模型中進行驗證,由圖4可以看到,各個理化指標的實測值與預測值點呈對角線分布,且經成對t檢驗,各項指標預測值與實測值無明顯差異(P>0.90)。經驗證,GA-BiPLS驗證模型R2為0.971,RMSEP為0.044;GA-SiPLS驗證模型R2為0.965,RMSEP為0.047;說明模型預測結果較為準確。

a-GA-BiPLS; b-GA-SiPLS圖4 蘋果醋總酸GA-BiPLS和GA-SiPLS模型理化值與預測值分布Fig.4 Predicted vs. reference values of total acid in apple cider vinegar by GA-BiPLS and GA-SiPLS model
4種波段優化方法所建模型均獲得了較高的模型精度,不僅充分說明了近紅外光譜技術可用于蘋果醋總酸定量分析,也證明了優化波段對建模分析的重要性。
比較4種波段優化方法,BiPLS和SiPLS模型效果優于iPLS模型,同時2種方法所選擇的波長范圍部分重疊,反映出了這2種方法波段優選的一致性及蘋果醋總酸的特征吸收。而GA-BiPLS和GA-SiPLS模型的穩定性及準確性均高于其余3種方法所建模型,同時所用變量最少,實現了波長選擇的目標,表明了遺傳算法在果醋品質分析方面的巨大潛力。遺傳算法結合BiPLS及SiPLS方法所建立的蘋果醋總酸定量分析模型,具有快速、穩定、準確的特點,可實現對蘋果醋總酸含量的快速無損檢測。
[1]許超群,王亞利,黃從軍,等. 蘋果醋的開發與研究綜述[J]. 中國調味品,2011,36(2):7-10.
[2]孫炳新,匡立學,徐方旭,等. 蘋果脆度的近紅外無損檢測[J]. 食品與發酵工業,2013,41(5):185-189.
[3]郝勇,余永建,朱勝虎. 食醋總酸和還原糖含量近紅外光譜檢測模型的優化研究[J]. 西北農林科技大學學報(自然科學版),2013,41(5):94-98,107.
[4]黃曉瑋,王開亮,石吉勇,等. 近紅外光譜結合不同偏最小二乘法無損檢測食醋中總酸含量[J]. 中國調味品,2011,36(1):107-110,113.
[5]王莉,李增芳,何勇,等. 應用近紅外光譜技術快速檢測果醋糖度[J]. 光譜學與光譜分析,2008,28(8):1 810-1 813.
[6]陸婉珍.現代近紅外光譜分析技術[M].北京:中國石化出版社,2007:59-90.
[7]褚小立,袁洪福,王艷斌,等. 遺傳算法用于偏最小二乘方法建模中的變量篩選[J]. 分析化學,2001,29(4):437-442.
[8]屠振華,籍保平,孟超英,等. 基于遺傳算法和間隔偏最小二乘的蘋果硬度特征波長分析研究[J]. 光譜學與光譜分析,2009,29(10):2 760-2 764.
[9]N?RGAARDL,SAUDLANDA,WAGNERJ,etal.Intervalpartialleastsquaresregression(iPLS):acomparativechemometricstudywithanexamplefromnear-infraredspectroscopy[J].AppliedSpectroscopy,2000,54(3):413-419.
[10]CHENQuan-sheng,JIANGPei,ZHAOJie-wen.Measurementoftotalflavonecontentinsnowlotus(Saussureainvolucrate)usingnearinfraredspectroscopycombinedwithintervalPLSandgeneticalgorithm.[J].SpectrochimicaActaPartA:MolecularandBiomolecularSpectroscopy,2010,76(1):50-55.
[11]鄒小波,趙杰文,黃星奕. 用向前和向后間隔偏最小二乘法建立蘋果糖度近紅外光譜模型[A]. 中國機械工程學會.2006年中國機械工程學會年會暨中國工程院機械與運載工程學部首屆年會論文集[C].中國機械工程學會,2006:6.
[12]彭海根,彭云發,詹映,等. 近紅外光譜技術結合聯合區間間隔偏最小二乘法對南疆紅棗糖度的測定[J]. 食品科技,2014,39(6):276-280.
[13]HEKai-xun,CHENGHui,DUWen-li,etal.OnlineupdatingofNIRmodelanditsindustrialapplicationviaadaptivewavelengthselectionandlocalregressionstrategy[J].ChemometricsandIntelligentLaboratorySystems,2014,134(15):79-88.
[14]呂強,何紹蘭,劉斌,等. 班菲爾臍橙可溶性固形物近紅外光譜特征譜區選擇![J]. 農業機械學報,2012,43(增刊):211-214.
[15]王加華,王軍,王一方,等. 基于近紅外光譜技術的腐竹脂肪定量分析[J]. 食品科學,2014,35(18):136-140.
[16]蔡健榮,湯明杰,呂強,等. 基于siPLS的獼猴桃糖度近紅外光譜檢測[J]. 食品科學,2009,30(4):250-253.
[17]JERRYWorkman,JRLOISWEYER. 近紅外光譜解析實用指南[M].褚小立,許育鵬,田高友,譯.北京:化學工業出版社,2009.
[18]彭云發,詹映,彭海根,等. 用遺傳算法提取南疆紅棗總糖的近紅外光譜特征波長[J]. 食品工業科技,2015,36(3):303-307.
Determinationoftotalacidcontentinapplecidervinegarbynearinfraredspectroscopycombinedwithgeneticalgorithm
LIZi-wen1,2,XIONGYa-ting2,ZHANGhai-hong1*,LIZong-peng2,WANGJian2,FENGSi-wen2,XIONGXian-ping3,4,YINJian-jun2
1(CollegeofAgriculture,NingxiaUniversity,Yinchuan750021,China) 2(ChinaNationalResearchInstituteofFood&FermentationIndustries,Beijing100015,China) 3(TianDiNo.1BeverageCo.Ltd.,Jiangmen529000,China) 4(CollegeofLightIndustryandFood,SouthChinaUniversityofTechnology,Guangzhou510640,China)
Thetotalacidofapplecidervinegarwasanalyzedquantitativelybynearinfraredspectroscopytechnology,andthequantitativeanalysismodelwasestablishedbypartialleastsquares(PLS).ThecharacteristicwavebandswereselectedfromthewholespectrumareausingiPLS,BiPLS,SiPLSandGA-PLS;themodelswereevaluatedusingR2,RMESC,RMSEPandtheoptimalnumberofmainfactorsindeterminingthebestmodelingmethod.Theresultsshowedthatthecharacteristicwavebandselectionwasvitaltomodeloptimization,andimprovedthemodeloperatingspeed.TheoptimizationeffectofGA-BiPLSandGA-SiPLSwasthemostsignificant.Whilegreatlyreducingthevariables, R2ofGA-BiPLSandGA-SiPLSmodelswere0.989, 0.986respectively,andtheirRMSEPwere0.042, 0.044separately.Thetwomethodseffectivelyimprovedthestabilityandaccuracyofthemodelandrevealedthehugepotentialofthegeneticalgorithminfruitvinegarqualityanalysis.
applecidervinegar;nearinfraredspectroscopy;quantitativeanalysis;bandselection;geneticalgorithm
10.13995/j.cnki.11-1802/ts.201601036
碩士研究生(張海紅教授為通訊作者,E-mail:nxdwjyxx@126.com)。
2015-07-08,改回日期:2015-08-31