陳琳,董春旺,高明珠,葉陽.中國(guó)農(nóng)業(yè)科學(xué)院茶葉研究所,浙江省茶葉加工工程重點(diǎn)實(shí)驗(yàn)室,國(guó)家茶產(chǎn)業(yè)工程技術(shù)研究中心,農(nóng)業(yè)部茶樹生物學(xué)與資源利用重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 30008;2.中國(guó)農(nóng)業(yè)科學(xué)院研究生院,北京 0008
?
基于近紅外光譜的紅茶干燥中含水率無損檢測(cè)方法
陳琳1,2,董春旺1*,高明珠1,2,葉陽1
1.中國(guó)農(nóng)業(yè)科學(xué)院茶葉研究所,浙江省茶葉加工工程重點(diǎn)實(shí)驗(yàn)室,國(guó)家茶產(chǎn)業(yè)工程技術(shù)研究中心,農(nóng)業(yè)部茶樹生物學(xué)與資源利用重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310008;2.中國(guó)農(nóng)業(yè)科學(xué)院研究生院,北京 100081
摘要:為實(shí)現(xiàn)工夫紅茶干燥中含水率的快速檢測(cè),提出了基于近紅外光譜紅茶干燥中含水率無損檢測(cè)方法。隨機(jī)抽取6次干燥處理中的226個(gè)樣本,進(jìn)行波長(zhǎng)1 000~17 99 nm近紅外光譜掃描后按照國(guó)標(biāo)法測(cè)定含水率。對(duì)原始光譜數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)正態(tài)變量變換(SNVT)預(yù)處理,利用全局偏最小二乘法(PLS)、聯(lián)合區(qū)間偏最小二乘法(siPLS),分別構(gòu)建水分近紅外預(yù)測(cè)模型并驗(yàn)證。結(jié)果表明:用兩種方法檢測(cè)含水率,其準(zhǔn)確度都可靠,但利用siPLS法將全光譜劃分為13個(gè)區(qū)間,聯(lián)合4個(gè)區(qū)間用6個(gè)主成分?jǐn)?shù)構(gòu)建的水分預(yù)測(cè)模型效果更優(yōu),其預(yù)測(cè)集的相關(guān)系數(shù)R和預(yù)測(cè)均方根誤差RMSEP值分別為0.9593和0.0395,說明模型預(yù)測(cè)精度高,可以實(shí)現(xiàn)紅茶干燥中含水率的快速無損檢測(cè)。
關(guān)鍵詞:紅茶;含水率;近紅外光譜;模型
干燥是工夫紅茶初加工的最后一道工序,含水率是衡量工夫紅茶干燥效果和品質(zhì)的重要指標(biāo)。干燥過程中若能夠在線檢測(cè)工夫紅茶的含水率,則能有針對(duì)性的調(diào)控干燥進(jìn)程,保證茶葉品質(zhì)。目前考察工夫紅茶含水率的主要手段是烘干法,測(cè)量結(jié)果雖然準(zhǔn)確,但測(cè)量過程費(fèi)時(shí)費(fèi)力,不利于大樣本的快速檢測(cè)且無法起到在線監(jiān)測(cè)效果。
近紅外光譜(Near infrared,NIR)檢測(cè)技術(shù)具有簡(jiǎn)便、快速、無損、無污染、重復(fù)性好、便于實(shí)現(xiàn)在線控制等優(yōu)勢(shì)[1-3],且隨著化學(xué)計(jì)量學(xué)方法的逐步發(fā)展,近紅外檢測(cè)技術(shù)在農(nóng)產(chǎn)品和食品檢測(cè)領(lǐng)域的應(yīng)用也呈快速發(fā)展趨勢(shì)[4-7]。近紅外技術(shù)在茶葉內(nèi)含成分的快速檢測(cè)中已得到應(yīng)用。劉輝軍等[8]采用NLPLS建立茶多酚含量的近紅外預(yù)測(cè)模型,模型預(yù)測(cè)值與實(shí)測(cè)值相關(guān)系數(shù)為0.967,模型精度高;Chen等[9-10]利用不同光譜預(yù)處理方法,結(jié)合PLS、LS-VSM、BP-ANN等多元校正方法,建立了茶葉中咖啡因、茶多酚、主要兒茶素等物質(zhì)含量的預(yù)測(cè)模型,模型相關(guān)性高,可以實(shí)現(xiàn)快速檢測(cè);近紅外技術(shù)在水分檢測(cè)中也有不少成功的研究,但在紅茶過程中的應(yīng)用鮮有報(bào)道。毛罕平等[11]利用近紅外光譜技術(shù)對(duì)葡萄水分脅迫狀況進(jìn)行定量分析,分段逐步回歸法和主成分回歸法建立葉片干基含水率定量分析模型,預(yù)測(cè)值與實(shí)測(cè)值相關(guān)系數(shù)為0.94,RMSEP為0.15,可以實(shí)現(xiàn)有效預(yù)測(cè);湯修映等[12]用近紅外光譜技術(shù)進(jìn)行牛肉含水率檢測(cè),采用多元散射校正、變量標(biāo)準(zhǔn)化、直接正交信號(hào)校正等方法對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,采用MLR、PCR、PLSR等方法建立回歸模型,MSC預(yù)處理結(jié)合PLSR建模相關(guān)系數(shù)可達(dá)0.92,驗(yàn)證標(biāo)準(zhǔn)差為0.069;劉潔等[13]利用近紅外光譜技術(shù)對(duì)板栗含水率進(jìn)行快速無損檢測(cè),采用SPXY對(duì)樣本集劃分,采用一階微分、多元散射校正、變量標(biāo)準(zhǔn)化進(jìn)行預(yù)處理,PLS建立模型,結(jié)果表明一階微分結(jié)合偏最小二乘法建模性能最佳,栗仁檢測(cè)模型預(yù)測(cè)集預(yù)測(cè)值與實(shí)測(cè)值相關(guān)系數(shù)為0.8473,驗(yàn)證均方根誤差為2.35%,可以實(shí)現(xiàn)板栗含水率的快速無損檢測(cè)。
本文以226個(gè)紅茶干燥過程樣作為研究對(duì)象,采用SNVT結(jié)合PLS、siPLS對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,變量篩選,建立含水率定量分析模型。
1.1 儀器與設(shè)備
采用SupNIR-1520光譜分析儀(中國(guó)聚光科技有限公司)對(duì)茶葉樣本進(jìn)行漫反射光譜掃描。該光譜分析儀的主要技術(shù)參數(shù)如下,探測(cè)器:高靈敏的512陣元光電二極管陣列;波長(zhǎng)范圍:1 000~1 799 nm;光譜采樣間隔:1.5 nm;光譜分辨率:3.5 nm;波長(zhǎng)精度:±1 nm。采用光譜分析儀配套的RS2(美國(guó)ASD公司)軟件包進(jìn)行實(shí)時(shí)采集、分析輻射和輻照測(cè)量。試驗(yàn)中還用到SartoriusB S224S精密電子天平(德國(guó)Sartorius公司),精確度為0.0001 g;DK340S恒溫電烘箱(日木Yamato公司),靈敏度為±1℃。
1.2 樣品來源及光譜獲取
實(shí)驗(yàn)在浙江更香有機(jī)茶業(yè)有限公司實(shí)施,在6次干燥處理中隨機(jī)抽取226個(gè)樣本作為實(shí)驗(yàn)對(duì)象。樣本含水率范圍為5%~60%,涵蓋了茶葉的主要含水率范圍(3%~70%)。按照含水率百分含量平均分布原則,將226個(gè)樣本按照2∶1的比例進(jìn)行校正集(151個(gè))和驗(yàn)證集(75個(gè))的劃分,保證校正集的樣品組分百分含量信息包含驗(yàn)證集樣品的信息。樣本含水率統(tǒng)計(jì)信息如表1所示。
稱取約20 g完整葉片茶樣裝入樣品杯中,用壓樣器充分壓實(shí)后進(jìn)行光譜采集,每個(gè)樣本采集3次,取3次光譜平均譜作為該樣品的近紅外原始光譜。
1.3 茶葉含水率的標(biāo)準(zhǔn)檢測(cè)方法
樣本在光譜測(cè)量后,立即按GB 8304-1987測(cè)量含水率,重復(fù)3次,取平均值作為對(duì)照。

表1 試驗(yàn)樣本的具體情況Table 1 General information of tea samples
1.4 測(cè)量模型的評(píng)價(jià)指標(biāo)
模型的性能評(píng)估是建立預(yù)測(cè)模型的重要步驟,目前通用的模型評(píng)價(jià)指標(biāo)有:交互驗(yàn)證均方根誤差(Root mean square error of cross-validation,RMSECV)、預(yù)測(cè)均方根誤差(Root mean square error of prediction,RMSEP)、偏差(Bias)、相關(guān)系數(shù)(r)、預(yù)測(cè)相對(duì)標(biāo)準(zhǔn)誤差(Residual prediction deviation,RPD)。RMSECV主要用于評(píng)價(jià)建模方法的可行性及所得模型的預(yù)測(cè)能力,RMSEP主要用于評(píng)價(jià)所建模型對(duì)外部樣本的預(yù)測(cè)能力,r用于考察樣本預(yù)測(cè)值與實(shí)測(cè)值之間的相關(guān)程度。一個(gè)好的測(cè)量模型應(yīng)該有較低的RMSECV、RMSEP和Bias值,同時(shí)具有較高的r值和RPD 值[14-15]。本研究主要采用相關(guān)系數(shù)r、交互驗(yàn)證均方根誤差RMSECV和預(yù)測(cè)均方根誤差RMSEP進(jìn)行模型評(píng)估。
2.1 干燥樣本漫反射原始光譜
圖1是茶樣干燥加工過程中典型的近紅外漫反射光譜響應(yīng)曲線。從圖1中可以看出,曲線在波長(zhǎng)1 200 nm附近有反射峰,波長(zhǎng)范圍在1 300~1 450 nm時(shí)反射率急劇增大,這是綠色植物葉片的紅邊效應(yīng),在波長(zhǎng)1 550 nm后的近紅外波段反射率值相對(duì)比較平穩(wěn),由于葉片內(nèi)部液態(tài)水分的強(qiáng)烈吸收作用,而在波長(zhǎng)1 100 nm和1 300 nm附近出現(xiàn)明顯的低谷。光譜曲線首端和末端均未有明顯的高頻噪聲,因此可以選擇波長(zhǎng)1 000~1 799 nm的全波段范圍作為研究波段。

圖1 近紅外原始光譜曲線Fig.1 Original near infrared spectra

圖2 SNVT預(yù)處理后近紅外光譜曲線Fig.2 Near infrared spectra after SNVT pre-processing
2.2 光譜預(yù)處理
在光譜分析中,原始光譜含有與樣品組分無關(guān)的信息,受環(huán)境溫度、檢測(cè)器及樣品背景干擾等因素影響會(huì)夾入許多高頻隨機(jī)噪聲、基線漂移和光散射噪聲,需采用一定的預(yù)處理方法進(jìn)行消除[16]。本研究采用標(biāo)準(zhǔn)正態(tài)變量變換(SNVT)對(duì)光譜進(jìn)行有效信息提取,SNVT處理后的光譜曲線如圖2所示。由圖可知,SNVT預(yù)處理減少了光譜基線漂移的影響,可分辨重疊峰,提高分辨度和靈敏度。相比原始光譜,SNVT預(yù)處理可以提取光譜有效信息,減少誤差影響,提高建模精度。
2.3 回歸模型建立
常用的統(tǒng)計(jì)模型主要有多元線性回歸、主成分回歸、偏最小二乘回歸、人工神經(jīng)網(wǎng)絡(luò),最小二乘支持向量機(jī)等方法。本文采用全局偏最小二乘法(PLS)和聯(lián)合區(qū)間偏最小二乘法(siPLS)建立近紅外水分預(yù)測(cè)模型。
2.3.1 全局偏最小二乘回歸模型建立
基于matlab軟件,將近紅外光譜全波段作為特征譜區(qū)與茶樣水分含量建立回歸模型,用plsrmse函數(shù)畫出用不同主成分?jǐn)?shù)所建模型的交互驗(yàn)證均方根誤差RMSECV值,通過plsmodel函數(shù)建立樣本預(yù)測(cè)模型,分別對(duì)訓(xùn)練集和預(yù)測(cè)集中的含水率進(jìn)行預(yù)測(cè),得到相關(guān)關(guān)系圖如圖3所示。
結(jié)果表明,當(dāng)主成分?jǐn)?shù)為5時(shí)建立預(yù)測(cè)模型效果最好;訓(xùn)練集的預(yù)測(cè)值與實(shí)測(cè)值相關(guān)系數(shù)r為0.9858,RMSECV值為0.0226;預(yù)測(cè)集的預(yù)測(cè)值與實(shí)測(cè)值相關(guān)系數(shù)r為0.9566,RMSEP值為0.0407。
2.3.2 聯(lián)合區(qū)間偏最小二乘法
用近紅外全波段數(shù)據(jù)進(jìn)行分析時(shí),由于光譜數(shù)據(jù)較多,易引進(jìn)無用的光譜信息,從而影響水分預(yù)測(cè)模型的精度[17]。基于matlab軟件,利用siPLS先進(jìn)行特征光譜區(qū)間的選擇。將近紅外光譜全波段劃分為10、11、12、…、20個(gè)區(qū)間,分別嘗試聯(lián)合3~4個(gè)子區(qū)間,依據(jù)RMSECV值最小原則選擇最優(yōu)聯(lián)合區(qū)間,結(jié)果如表2所示。

圖3 水分PLS模型的訓(xùn)練集(a)和預(yù)測(cè)集(b)回歸模型圖Fig.3 Calibration(a)and prediction(b)regression curves of PLS models
siPLS校正模型的最優(yōu)聯(lián)合區(qū)間結(jié)果為,整個(gè)光譜區(qū)域(800個(gè)變量)被劃分為13個(gè)區(qū)間,4個(gè)子區(qū)間[1、6、10、13]聯(lián)合,主成分?jǐn)?shù)為6時(shí),RMSECV最小,所對(duì)應(yīng)的波長(zhǎng)范圍為1 000~1 062 nm、1 311~1 372 nm、1 557~1 617 nm、1 739~1 799 nm,參與建立模型的光譜變量數(shù)由800個(gè)降至246個(gè),所選區(qū)間在光譜中的位置如圖4所示。利用篩選出的特征波段建立茶葉含水率的預(yù)測(cè)模型,訓(xùn)練集和預(yù)測(cè)集的預(yù)測(cè)值和實(shí)測(cè)值之間相關(guān)關(guān)系如圖5所示。
訓(xùn)練集中,相關(guān)系數(shù)(r)和交互驗(yàn)證均方根誤差(RMSECV)分別為0.989和0.0199;預(yù)測(cè)集中,相關(guān)系數(shù)(r)和預(yù)測(cè)均方根誤差(RMSEP)分別為0.9593和0.0395。
2.4 兩種模型結(jié)果比較
從表3可以看出,PLS和siPLS所建模型其準(zhǔn)確度都可靠,但siPLS模型性能更好。因?yàn)镻LS利用近紅外光譜全波段進(jìn)行建模,全光譜含有大量與水分含量無關(guān)的冗余信息和噪音信息,不可避免地影響模型的精度和穩(wěn)定性,siPLS優(yōu)選光譜區(qū)間進(jìn)行建模,減少了無關(guān)信息影響,模型簡(jiǎn)化,精度提高[18-19]。

表2 不同區(qū)間數(shù)的聯(lián)合區(qū)間偏最小二乘分析模型結(jié)果Table 2 Results of siPLS calibration model with different spectral regions

圖4 聯(lián)合區(qū)間偏最小二乘模型選擇的最佳聯(lián)合區(qū)間[1、6、10、13]Fig.4 Optimal spectral region selected by siPLS with intervals number1,6,10 and 13

圖5 水分siPLS模型訓(xùn)練集(a)預(yù)測(cè)集(b)回歸模型圖Fig.5 Calibration(a)and prediction(b)regression curves tea moisture of siPLS models

表3 兩種預(yù)測(cè)模型的性能比較Table 3 Results and comparison of two models
通過對(duì)工夫紅茶干燥工序中226個(gè)茶葉樣本的水分和近紅外光譜進(jìn)行分析,表明基于近紅外光譜技術(shù)可以實(shí)現(xiàn)紅茶干燥中含水率的快速無損檢測(cè)。對(duì)近紅外光譜進(jìn)行標(biāo)準(zhǔn)正態(tài)變量變換(SNVT)預(yù)處理,可以減少噪聲干擾,提高所建模型精度。通過比較全局偏最小二乘回歸模型和聯(lián)合區(qū)間偏最小二乘回歸模型,發(fā)現(xiàn)siPLS可以提高模型精度,其水分預(yù)測(cè)模型的預(yù)測(cè)值與實(shí)測(cè)值相關(guān)系數(shù)r高達(dá)0.9593,RMSEP為0.0395。水分子中O-H鍵在近紅外光譜1 100 nm、1 400 nm、1 600 nm處有較強(qiáng)的吸收峰,siPLS篩選建模區(qū)間與其吸收峰呈現(xiàn)一定的相關(guān)性,為siPLS建模的良好效果提供了理論支撐。由于茶葉品種繁多,加工時(shí)間及鮮葉等級(jí)也存在著差異,導(dǎo)致光譜模型適用范圍存在局限,因此要實(shí)現(xiàn)在線、實(shí)時(shí)測(cè)量,還需要建立更穩(wěn)定的光譜測(cè)量模型[20],該模型需要大量覆蓋面廣的樣本,后續(xù)的研究可以針對(duì)不同種類、不同季節(jié)、不同等級(jí)的茶葉光譜特性進(jìn)行深入分析,以建立更有廣泛代表意義的光譜測(cè)量模型。
參考文獻(xiàn)
[1]戴瑩,馮曉元,韓平,等.近紅外光譜技術(shù)在果蔬農(nóng)藥殘留檢測(cè)中的應(yīng)用研究進(jìn)展[J].食品安全質(zhì)量檢測(cè)學(xué)報(bào),2014 5(3):659-663.
[2]林濤,于海燕,應(yīng)義斌.可見/近紅外光譜技術(shù)在液態(tài)食品檢測(cè)中的應(yīng)用研究進(jìn)展[J].光譜學(xué)與光譜分析,2008,28(2):285-290.
[3]陳壽松,鄭功宇,金心怡,等.茶葉含水率近紅外在線快速測(cè)定及其應(yīng)用研究[J].茶葉科學(xué),2014,34(4):337-343.
[4]段民孝,刑錦豐,郭景倫,等.近紅外光譜分析技術(shù)及其在農(nóng)業(yè)中的應(yīng)用[J].北京農(nóng)業(yè)科學(xué),2002,20(1):11-14.
[5]Fox G P,Osborne B,Bowman J,et al.Measurement of genetic and environmental variation in barley(Hordeumvulgare)grain hardness[J].Journal of Cereal Science,2007,46(1):82-92.
[6]傅霞萍,應(yīng)義斌,劉燕德,等.水果堅(jiān)實(shí)度的近紅外光譜檢測(cè)分析試驗(yàn)研究[J].光譜學(xué)與光譜分析,2006,26(6):1038-1041.
[7]孫通,徐惠榮,應(yīng)義斌.近紅外光譜分析技術(shù)在農(nóng)產(chǎn)、食品品質(zhì)在線無損檢測(cè)中的應(yīng)用研究進(jìn)展[J].光譜學(xué)與光譜分析,2009,29(1):122-126.
[8]劉輝軍,呂進(jìn),張維剛,等.茶葉中茶多酚含量的近紅外光譜檢測(cè)模型研究[J].紅外技術(shù),2007,29(7):429-432.
[9]Chen Q S,Zhao J W,Fang C H.Feasibility study on identifieation of green tea black and Oolong teas using near-inftared spectroscopy based on support veetor maehine(SVM)[J].Spectroehimiea Acta Part A,2007,66:568-574.
[10]Chen Q S,Zhao J W,Zhang H D,et al.Feasibility study on qualitative and quantitative analysis in tea by near inftared spectroscopy with multivariate calibration[J].Analytica Chimica Acta,2006,572(2):77-84.
[11]毛罕平,張曉東,李雪,等.基于光譜反射特征葡萄葉片含水率模型的建立[J].江蘇大學(xué)學(xué)報(bào):自然科學(xué)版,2008,29(5):369-372.
[12]湯修映,牛力釗,徐楊,等.基于可見/近紅外光譜技術(shù)的牛肉含水率無損檢測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(11):248-252.
[13]劉潔,李小昱,李培武,等.基于近紅外光譜的板栗水分檢測(cè)方法[J].農(nóng)業(yè)工程學(xué)報(bào),2010,26(20):338-341.
[14]Li Xiaoli,He Yong.Chlorophyll assessment and sensitive wavelength exploration for tea(Camellia sinensis)based on reflectance spectral characteristics[J].Hortscience,2008,43(5):1-6.
[15]李曉麗,程術(shù)希,何勇.基于漫反射光譜的初制綠茶含水率無損檢測(cè)方法[J].農(nóng)業(yè)工程學(xué)報(bào),2010,26(5):195-201.
[16]牛智有,林新.茶葉定性和定量近紅外光譜分析研究[J].光譜學(xué)與光譜分析,2009,29(9):2417-2420.
[17]江燕,楊眉,張學(xué)博,等.中藥飲片近紅外光譜水分定量模型的研究[J].藥物分析雜志,2013,33(9):1572-1577.
[18]吳瑞梅,趙杰文,陳全勝,等.近紅外光譜技術(shù)結(jié)合特征變量篩選快速檢測(cè)綠茶滋味品質(zhì)[J].光譜學(xué)與光譜分析,2011,31(7):1782-1785.
[19]張德濤,鄒小波,石吉勇,等.近紅外光譜結(jié)合不同偏最小二乘法快速檢測(cè)鎮(zhèn)江香醋的渾濁度[J].中國(guó)釀造,2012,31(1):169-171.
[20]周健,成浩,王麗鴛.近紅外技術(shù)在茶葉上的研究進(jìn)展[J].茶葉科學(xué),2008,28(4):294-300.
Nondestructive Measurement of Moisture of Black Tea in Drying Process Based on Near Infrared Spectroscopy
CHEN Lin1,2,DONG Chunwang1*,GAO Mingzhu1,2,YE Yang1
1.Tea Research Institute,Chinese Academy of Agricultural Sciences,Key Laboratory of Tea Processing Engineering of Zhejiang Province,National Engineering Technology Research Center of Tea Industry,Key Laboratory of Tea Biology and Resource Utilization of Ministry of Agriculture,Hzngzhou 310008,China; 2.Graduate School of Chinese Academy of Agricultural Sciences,Beijing 100081,China
Abstract:Moisture is an important index of tea drying effect and quality.To understand rapid detection of moisture in black tea,a nondestructive testing method was proposed based on near infrared spectroscopy(NIR).The diffuse reflectance spectra of 226 tea samples were scanned in the range of 1 000-1 799 nm.These samples were from 6 drying processes.Moisture contents of samples were immediately measured after spectral scanning.The original spectrum data were proposed by the Standard Normal Variate Transformation(SNVT).Two regression algorithms including Partial Least Square(PLS)and Synergy Interval Partial Least Square(siPLS)were used to develop models for determination of moisture contents respectively.The result showed that both models had high accuracy,but the performance of model with siPLS was better.It contained 13 spectral intervals combined with 4 subinterval and 6 principal component factors.The root mean square for prediction(RMSEP)and the correlation coefficient(Rp)reached 0.0395 and 0.9593,respectively.It showed that it is feasible to measure moisture content of black tea during drying process.
Keywords:black tea,moisture content,near infrared spectroscopy,model
作者簡(jiǎn)介:陳琳,男,碩士研究生,主要從事茶葉加工方面的研究。*通訊作者:dongchunwang@tricaas.com
基金項(xiàng)目:浙江省自然科學(xué)基金(LY16C160002)、浙江省“三農(nóng)六方”項(xiàng)目(2014005)。
收稿日期:2016-01-12
修訂日期:2016-01-18
中圖分類號(hào):TS272;O434
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1000-369X(2016)02-184-07