盧莉,程曦,劉金仙,林燕萍,黃毅彪
(1.武夷學院茶與食品學院,福建武夷山354300;2.中國烏龍茶產業協同創新中心,福建武夷山354300)
小種紅茶是世界紅茶的鼻祖,起源于武夷山。2005年以來,小種紅茶在保留其傳統、獨特的品質特征的基礎上,不斷研發創新,開發了奇紅等高端紅茶產品,使其在市場上再次風靡。水浸出物是茶葉在熱水中所有可溶性成分的總稱,其含量的高低反映了茶湯的厚薄、滋味的濃強程度,是衡量茶葉質量的重要指標[1]。近紅外是波長為780 nm~2 526 nm(波數為12 820 cm-1~3 960 cm-1),介于中紅外光譜和可見光譜之間的一種電磁波。近紅外光譜技術承載的分析信息主要是有機物質中的含氫基團C-H,O-H,N-H)等振動的倍頻和合頻特征信息[2]。近紅外光譜分析技術是一種綠色分析技術,具有分析快速、處理簡單、無需試劑消耗等優點[3]。近年來國內外學者采用近紅外技術在茶葉產地溯源[4]、品質分析[5-6]、產品判別[7-8]等方面的應用已有不少的研究,其中在茶葉的化學成分的快速測定及模型構建方面也取得一定進展,Zhiming Guo 等[9]利用近紅外光譜結合多元校正方法建立綠茶中表沒食子兒茶素沒食子酸酯((-)-epigallocatechin gallate,EGCG)含量的校正模型,楊丹等[10]建立綠茶全氮量近紅外定量分析模型,趙峰等[11]優選并成功建立武夷巖茶的水分、茶多酚、咖啡因和粗纖維的定量分析模型。沈詩鈺等[12]采用偏最小二乘法建立白茶總黃酮含量的定量模型。董春旺[13]建立基于近紅外光譜檢測技術的小葉種工夫紅茶感官品質評分和理化品質指標的定量分析模型。
近紅外光譜在綠茶、烏龍茶、白茶、黑茶、紅茶等茶類的均有應用,但尚未見到該技術在小種紅茶品質成分快速定量測定方面的應用研究。本研究針對小種紅茶這一特種茶類單一建模,將近紅外光譜分析技術應用于小種紅茶品質成分的定量分析,針對性強。建模時可減少不同茶類建模時茶類間物質種類差別較大帶來的非建模屬性等其他無用信息的干擾,建模效果更好。相比常規的水浸出物檢測方法,近紅外光譜技術能實現水浸出物的定量快速無損檢測,操作簡便。
小種紅茶茶樣:一部分由武夷山正山茶業有限公司等企業提供,一部分采購于武夷山市內各茶企。為保證樣品的代表性,收集茶樣為2017~2018 年生產的不同品種、不同等級、不同區域、不同類別、不同廠家的茶樣,共76 個樣品。
1.1.2 儀器與設備
VERTEX 70 傅立葉近紅外光譜儀:美國布魯克儀器公司;HH-4 數顯恒溫水浴鍋:常州國華電器有限公司;SARTORIUS BS224S 電子分析天平:德國賽多利斯公司;FZ-102 微型植物粉碎機:天津市泰斯特儀器有限公司;SHZ-DIII 循環水真空泵抽濾裝置:鄭州長城科工貿有限公司;ZFD-A5040A 新型鼓風干燥箱:上海精宏實驗設備有限公司。
1.2.1 近紅外光譜(near infrared spectroscopy,NIRS)的采集
粉碎后的小種紅茶近紅外光譜采用傅立葉近紅外光譜儀進行光譜采集,光譜譜區采集范圍:4 000 cm-1~12 000 cm-1;掃描次數64 次,分辨率8 cm-1。溫度控制室溫恒定在25 ℃左右。每個樣品重復掃描3 次,取平均光譜進行建模。
1.2.2 水浸出物含量的測定
水浸出物含量測定:按國家標準GB/T8305-2002《茶水浸出物測定》[14]。
1.2.3 建模方法
偏最小二乘法是一種矩陣法,具有分析速度快、準確度高、預測性強等特點,能對嚴重重疊的譜峰進行多元校正,在一定的程度上可以消除譜峰的非線性[15]。因此,本試驗采用偏最小二乘法(partial least squares,PLS)建立小種紅茶水浸出物定量分析模型。
1.2.4 模型評價方法
通過外部驗證和內部交叉驗證法對模型進行檢驗,采用實測集與預測集R2,交互驗證均方根誤差(root mean square error of cross validation,RMSECV),RMSEP 作為模型性能的評價指標。R2越接近1,RMSECV 與RMSEP 值越小,說明模型的預測效果越好[16]。
使用OPUS 7.5 軟件進行數據格式的轉換,光譜預處理和模型建立,用Origin 8.0 軟件作圖。
采集的76 個小種紅茶樣品近紅外光譜疊加結果如圖1 所示。

圖1 小種紅茶樣品近紅外光譜圖Fig.1 NIRS spectra of Souchong samples
由圖1 可知,大于10 000 cm-1波數段主要貢獻噪聲,4 000 cm-1~10 000 cm-1波數段光譜信息豐富,為有效信息集中段,7 500 cm-1~10 000 cm-1波數段趨向平緩,4 000 cm-1~7 500 cm-1波數段光譜吸收峰多而尖銳。不同品種、不同等級、不同區域、不同類別、不同廠家的小種紅茶茶樣近紅外光譜相似,但是由于不同樣品所含化學成分的含量高低不同,導致其近紅外圖譜存在差異。
校正集和驗證集樣品含量分布見表1。

表1 校正集和驗證集樣品含量分布Table 1 Sample content distribution of calibration set and validation set
由表1 可知,76 個小種紅茶樣品水浸出物含量的測定結果,樣品中水浸出物含量的變化范圍較大,最大值和最小值都被劃分在校正集中,校正集和驗證集的平均值接近。將76 個小種紅茶樣品隨機分配為校正集和驗證集,校正集∶驗證集≈7 ∶3。
近紅外光譜采集時,噪聲、散射光、樣品背景等因素會影響有效特征信息的提取,導致近紅外光譜的基線漂移或平移。因此,需要對原始光譜進行預處理。多元散射校正多元散射校正(multiplicative signal correction,MSC)可以去除漫反射中樣品的鏡面反射及光譜的不重復性;歸一化可以消除多余信息,增加樣品間的差異性,標準歸一化(standard normal variate,SNV)主要用于消除樣品的不均勻造成的噪聲,散射以及光程變換對NIR 漫反射的影響;導數處理可消除基線漂移、背景干擾并且忽略譜線重疊,主要用于基線校正與提高光譜分辨率[17-18]。
本試驗比較了OPUS 軟件中自帶的幾種光譜預處理方法,包括無預處理(none pretreatment,NONE)、消除常數偏移量(elimination of constant offset,ECO)、減去一條直線(minus a straight line,MSL)、標準歸一化、最小-最大歸一化(min/max)、多元散射校正法、內部標準(internal standards,IS)、一階導數(first derivative,FD)和二階導數(second derivative,SD)等,不同預處理方法對模型效果的影響見表2。

表2 不同預處理方法對定量模型性能的影響Table 2 The effect of different pretreatment methods on the performance of the quantitative model
通過比較發現,預處理方法為內部標準時,相關系數和校正均方差和驗證均方差最接近最佳值。因此,得出光譜的最佳預處理方法為內部標準。
全波段光譜數據信息量大,含有冗余信息多,容易對模型建立產生影響和干擾[19]。不同光譜區所包含的信息不同,建模前對光譜波段進行篩選,可防止引入冗余信息,提高模型性能。不同光譜范圍對R2和RMSECV 的影響見表3。

表3 不同光譜范圍對R2 和RMSECV 的影響Table 3 Effects of different spectral range on R2 and RMSECV
通過表3 對比發現,在 4 000 cm-1~10 000 cm-1波譜區間,R2最接近1,RMSECV 最小,因此選擇此波段為最佳建模波段。
主成分數的選擇對定量模型的建立至關重要,主成分數太少,會導致部分有用的信息沒有包含在模型中,可能欠擬合;主成分數過多,又會導致將無用的噪音信號當作有用信息來建模,模型包含多余信息,可能過擬合。不同主成分數下RMSECV 見圖2。
由圖2 可見,主成分數為5 時,RMSECV 最小。因此,在本研究中,OPUS 軟件選擇最佳建模的主成分數為5。

圖2 不同主成分數下RMSECVFig.2 RMSECV in different principal components
經過比較分析,最終選用建立模型的光譜預處理方法為內部標準,主成分數為5,運用OPUS 7.5 軟件中的PLS 法建立模型。76 份小種紅茶樣品中54 份樣品作為校正集樣品,22 份樣品作為驗證集樣品,建立水浸出物近紅外定量分析模型。建模結果見圖3。

圖3 小種紅茶水浸出物含量的NIR 預測值與參考值的相關圖Fig.3 Correlation plots of NIR predicted values and reference values of water extract of Souchong
由圖3 可知,水浸出物模型校正集相關系數較高,為93.04%,預測集樣品相關系數為95.73%,說明模型校正集樣品擬合度較好,且模型預測性能較好。
小種紅茶水浸出物含量的NIR 預測值與參考值的偏差圖見圖4。

圖4 小種紅茶水浸出物含量的NIR 預測值與參考值的偏差圖Fig.4 Deviation plots of NIR predicted values and reference values of water extract of Souchong
由圖4 可知水浸出物模型的NIR 預測值與實測值的偏差為-1.2~1.3 范圍內,說明NIR 預測值與實測值較為接近,模型建立比較成功。
將22 個小種紅茶驗證集樣品的近紅外圖譜導入其水浸出物定量分析模型中,預測水浸出物的含量,NIR 預測結果與真實值比較見表4。

表4 22 份驗證集樣品的預測值和參考值Table 4 NIR predicted values and reference values of 22 samples in validation set
由表4 可知,預測值與真實值比較接近,絕對偏差為0.03%~0.93%,相對誤差在2.57%以內,誤差率較小,準確度較高。說明建模效果較好,所建立的模型預測結果較為準確,可應用于小種紅茶水浸出物含量的無損、快速檢測。
本試驗基于近紅外光譜技術,采用現行國標方法測定其水浸出物含量,并與其光譜對應,采用PLS 建立小種紅茶水浸出物模型。選用OPUS 7.5 軟件內部標準為光譜預處理方法,主成分數為5 建立小種紅茶水浸出物含量模型,所建立的模型R2為95.73%,RESEC為0.629,RESEP 為0.513。建立的模型效果較好,可用于小種紅茶水浸出物含量的快速測定,達到快速、無損檢測的目的。王玉霞等[20]結合PLS 建立了綠茶茶湯水浸出物的定量分析模型,發現其交叉檢驗和預測模型決定系數均在95%以上。陳美麗等[21]建立茉莉花茶水浸出物的定量分析模型,真實值與預測值的相關系數均達90%以上。說明近紅外光譜技術可用于水浸出物含量的快速檢測,與本研究結果一致。本次用于建模的小種紅茶樣本數量為76,在今后的研究中,將進一步擴大樣本數量,廣泛收集各種類型的小種紅茶代表性茶樣,進一步優化模型。