李夢瑤,翟晨,王書雅,謝云峰,劉云國
(1.中糧營養健康研究院,營養健康與食品安全北京市重點實驗室,北京 102209;2.新疆大學 生命科學與技術學院,烏魯木齊 830002;3.國貿食品科技(北京)有限公司,北京 102209)
淀粉(starch)是農副產品的主要組成部分,被廣泛應用于食品加工業和化學工業中。近幾年,淀粉的生產和加工貿易取得了較大的發展[1-3]。目前,在牛肉醬、甜面醬等調味品加工方面,淀粉具有增加穩定性、改善口感和感官性狀的功能;在食物烹調中,淀粉作為調味品具有勾芡等作用[4-7]。不同種類的淀粉,其結構及理化性質不同,功能和使用效果差別較大。由于原料及制備工藝不同,淀粉成本具有一定的差異,部分生產者通過添加低成本淀粉來賺取更高的利潤。因此亟需研究一種簡單、快速、無損的淀粉種類鑒別及定量分析技術。
目前,淀粉種類鑒別多采用傳統感官評定方法和常規理化分析方法,這些方法受主觀因素影響較大,準確度難以保證,并且費時費力,破壞樣品,無法滿足淀粉種類的快速準確定性及定量分析需求[8-10]。隨著光譜技術和化學計量學的發展,近紅外光譜(near infrared spectroscopy,NIRS)技術,作為一種快速、無損、綠色的檢測技術,在農業、食品質量等方面得到了越來越多的重視和應用[11-14]。近年來,近紅外光譜技術多用于食品中淀粉含量的分析,對于淀粉品種的鑒別及混合淀粉中成分的定量分析研究較少[15-17]。
本研究通過對市售的73份4個不同種類(馬鈴薯、玉米、小麥、綠豆)的淀粉樣品進行光譜采集,通過主成分分析(principal components analysis,PCA),對不同種類淀粉建立了定性分析模型。對不同比例的馬鈴薯-小麥淀粉混合物進行光譜采集,優化光譜預處理方法,基于偏最小二乘法(partial least squares, PLS)建立小麥淀粉添加比例的預測模型。通過分析,該研究提出的快速、準確、無損定性定量預測方法可用于淀粉的種類鑒別及成分分析。
市售馬鈴薯淀粉、玉米淀粉、小麥淀粉和綠豆淀粉等樣品共73份:均購自當地超市;小麥淀粉純品、馬鈴薯淀粉純品:購自Sigma公司。淀粉的近紅外光譜在德國Bruker公司的MPA型多功能近紅外光譜儀上測定。本文所涉及的化學計量學方法均采用MATLAB和OPUS軟件完成。
1.2.1 淀粉近紅外光譜信息采集
將淀粉填裝至采樣杯,振蕩使樣品均勻后采用積分球漫反射方式進行掃描,采集淀粉的近紅外光譜。為保證試驗的準確性,對淀粉樣品進行 2 次平行采樣,并對平均光譜進行分析。光譜掃描范圍為4000~12000 cm-1,分辨率為16 cm-1,掃描次數為64次。
1.2.2 定性模型的建立與評價
對市售的17份馬鈴薯淀粉、12份綠豆淀粉、24份小麥淀粉和20份玉米淀粉進行近紅外光譜采集。通過矢量歸一化(vector normalization,SNV)、一階導數(first derivative,FD)、二階導數(second derivative,SD)、FD+SNV、SD+SNV等方法對原始光譜進行預處理,并對預處理的方法進行優化。在最佳預處理方法的基礎上,利用主成分分析(PCA)得到樣品的PCA得分,該計算過程通過MATLAB軟件實現。
PCA是多元統計分析中用來分析數據的一種方法,它是用一種較少數量的特征對樣本進行描述以達到降低特征空間維數的方法,通過找到幾個彼此互不相關,且能夠表征原來所有變量所具有信息的綜合變量來代替原始變量,簡而言之,這種用幾個互不相關的代表性變量來代表原來很多變量的統計學分析方法就成為主成分分析[18]。
1.2.3 定量模型的建立與評價
將購自Sigma公司的小麥淀粉和馬鈴薯淀粉純品制備成30組不同比例的混合物,按照Duplex法[19]以2∶1分為 2 組,其中校正集20個,預測集10個,樣本中小麥淀粉添加比例的統計結果見表1,校正集的小麥淀粉添加比例分布在7.29%~90.69%之間,預測集的小麥淀粉添加比例分布在18.04%~89.69%之間。數據劃分均勻,校正集的小麥淀粉添加比例范圍大于預測集,有利于構建穩健的預測模型。

表1 馬鈴薯-小麥淀粉樣本劃分Table 1 Division of potato-wheat starch sample
采用OPUS分析軟件對樣品的光譜圖進行多元散射校正(multiple scattering correction,MSC)、SNV、FD、SD、FD+SNV、SD+MSC等多種方式的預處理。在最佳預處理方法的基礎上,利用偏最小二乘法(PLS)建立不同比例的小麥淀粉-馬鈴薯淀粉和光譜數據之間的相關性模型,并選擇校正均方根誤差(root mean square error of calibration,RMSEC)、預測均方根誤差(root mean square error of prediction,RMSEP)、校正決定系數(RC2)、預測決定系數(RP2)和預測集相對分析誤差(RPD)作為模型的評價指標[20,21]。
綠豆淀粉、馬鈴薯淀粉、小麥淀粉和玉米淀粉的近紅外光譜見圖1a。


圖1 不同品種淀粉的原始光譜圖(a)和PCA散點圖(b)Fig.1 Original spectrogram(a) and PCA scatter plot(b) of different starches
由圖1a可知,不同種類的淀粉在12000~4000 cm-1范圍內,峰形、峰位以及吸光度的差別較小,無法直接鑒別。首先對光譜進行預處理,然后進行主成分分析,通過OPUS分析軟件得到的最佳預處理方法為SD+SNV,得到前兩個主成分的累積貢獻率為93.0%,基本包含了大多數的變量信息,選擇第一主成分和第二主成分的得分作圖(見圖1b),進而對樣品光譜進行分類。
由不同種類的淀粉樣品的主成分分布圖(見圖1b)中可知,綠豆淀粉和馬鈴薯淀粉可以被完全區分開,且綠豆淀粉聚合度較好,但馬鈴薯淀粉的樣品空間分布相對比較分散,可能是市售的馬鈴薯淀粉的原料品質及淀粉純度差異較大的原因。玉米淀粉和小麥淀粉樣品交叉重疊,區分不明顯,可能與兩種淀粉的理化性質相近有關,例如:小麥淀粉脂肪含量范圍為0.07%~0.15%,玉米淀粉脂肪含量范圍為0.1%~0.2%;小麥淀粉蛋白質含量范圍為0.3%~0.5%,玉米淀粉蛋白質含量在0.35%~0.45%,脂肪和蛋白質含量范圍交叉重疊[22,23]。近紅外光譜信息反映了蛋白質和脂肪中由C、H、O、N等組成的特殊價鍵信息。因此導致兩種淀粉光譜信息也存在交叉重疊現象,后期將進一步優化算法以進行玉米淀粉和小麥淀粉之間的區分。


圖2 馬鈴薯-小麥淀粉的原始光譜圖(a)和馬鈴薯- 小麥淀粉的FD+SNV光譜圖(b)Fig.2 The original spectrogram of potato-wheat starch(a) and FD+SNV spectrogram of potato-wheat starch(b)
不同比例的小麥淀粉和馬鈴薯淀粉的近紅外原始光譜見圖2a。為減少儀器噪聲或基線波動產生的誤差,以及消除大量冗余信息對有效光譜信息提取的干擾,首先對樣品原始光譜圖進行預處理,預處理方法包括:最小-最大歸一化、SNV、MSC、FD、SD、FD+ SNV、FD+MSC、SD+SNV、SD+MSC等,然后基于PLS方法建立小麥淀粉比例的預測模型。不同預處理方法建立模型的評價數據見表2。

表2 不同處理方法對模型的影響Table 2 Effect of different processing methods on the model

續 表
以預測均方根誤差(RMSEP)和決定系數(R2)為檢驗指標選擇最優預測模型。由表2可知,經FD+SNV預處理后,采用PLS法建立的馬鈴薯-小麥淀粉的定量模型效果最佳,其決定系數分別為0.9988和0.9982,且校正集的RMSEC和預測集的RMSEP值以及相對分析誤差(RPD)最小,這一結果表明該模型校正集擬合效果和驗證集的預測效果都較好。一階導數+SNV預處理后的光譜見圖2b。
以小麥淀粉添加比例的真實值及預測值為橫、縱坐標,得到校正集和預測集的散點圖(見圖 3)。校正集決定系數R2=0.9988,回歸方程為 y=0.9934x+0.374,驗證集決定系數 R2=0.9982,回歸方程為 y=1.0268x-1.48,相關性均達到極顯著水平,表明近紅外定量分析模型測定結果準確可靠。


圖3 馬鈴薯-小麥淀粉中小麥淀粉添加比例的校正集(a) 和預測集(b)的預測結果Fig.3 Prediction results of correction set(a) and prediction set(b) of wheat and starch addition ratio in potato-wheat starch
本研究基于近紅外漫反射技術,建立了一種淀粉種類的快速無損檢測方法。通過對不同種類的淀粉進行光譜采集,結合不同預處理方法及主成分分析法(PCA),建立了不同種類淀粉的鑒別分析模型,通過分析,馬鈴薯淀粉和豌豆淀粉可被較好地鑒別,玉米淀粉和小麥淀粉界限不明顯?;诙ㄐ苑治鼋Y果,建立淀粉混合物的定量分析方法,以不同比例的馬鈴薯淀粉和小麥淀粉的混合物為檢測對象,對混合物中小麥淀粉添加比例進行定量預測,采用多種光譜預處理方法,基于PLS建立混合物的預測模型,最優模型的校正集和預測集其決定系數分別為0.9988和0.9982,均方根誤差分別為0.385和0.347,預測相對分析誤差(RPD)為14.6。結果表明,該方法準確度高,且無需對樣品進行處理,操作簡單,可實現快速無損鑒別淀粉種類的目的。