余梅,李嘉儀,范偉,鄭郁,李跑,3*,蔣立文,劉霞
(1.湖南農(nóng)業(yè)大學(xué) 食品科學(xué)技術(shù)學(xué)院 食品科學(xué)與生物技術(shù)湖南省重點實驗室,湖南 長沙 410128;2.湖南師范大學(xué) 醫(yī)學(xué)院,湖南 長沙 410013;3.湖南省農(nóng)業(yè)科學(xué)院 湖南省農(nóng)產(chǎn)品加工研究所,湖南 長沙 410125)
陳皮是由成熟柑橘皮經(jīng)長時間干制存儲而成的一種食藥同源產(chǎn)品,主要包括揮發(fā)油、黃酮類等功效成分,具有理氣健脾、燥濕化痰的功能。陳化年份不同,陳皮在藥理作用和化學(xué)成分的積累上均有差別,市場價格同樣具有較大的差別,因此市場中出現(xiàn)以低年份陳皮冒充高年份陳皮進(jìn)行售賣的現(xiàn)象[1]。目前對于陳皮年份的鑒別多采用感官評價法、高效液相色譜法(high performance liquid chromatography,HPLC)[2]、液相色譜-質(zhì)譜聯(lián)用(liquid chromatography-mass spectrometry,LC-MS)[3]及氣相色譜-質(zhì)譜聯(lián)用(gas chromatography-mass spectrometry,GC-MS)[4]等。感官評價法是對陳皮外部特征(顏色、氣味)等差異實現(xiàn)鑒別分析,具有操作簡單、快速等優(yōu)點,但鑒別的準(zhǔn)確度易受主觀條件及客觀環(huán)境因素的干擾。理化檢測法主要通過對陳皮中的成分組成和含量進(jìn)行測定以實現(xiàn)不同年份陳皮鑒別分析,準(zhǔn)確度高,但需要破壞樣品,且樣品前處理繁瑣,檢測時間長、檢測成本高。因此,亟需開發(fā)一種快速、無損、綠色的不同年份陳皮的無損鑒別方法。
近紅外光譜主要包含氫基團(tuán)化學(xué)健伸縮振動倍頻及合頻信息,作為近年來快速發(fā)展起來的一種新型綠色無損檢測手段,近紅外光譜技術(shù)具有重現(xiàn)性好、檢測成本低、操作簡單等特點[5-6]。可直接實現(xiàn)對未知樣品組分的定性定量分析[7-9],在農(nóng)業(yè)、食品、石油化工等領(lǐng)域皆有應(yīng)用[10-12]。在陳皮無損鑒別研究方面,郭念欣等[13]通過傅立葉近紅外光譜儀采集了不同產(chǎn)地陳皮光譜,結(jié)合主成分分析法實現(xiàn)了對陳皮產(chǎn)地的鑒別分析。周欣等[14]利用傅立葉變換紅外光譜法對7個產(chǎn)地陳皮中的揮發(fā)油進(jìn)行了分析,實現(xiàn)了新會陳皮和廣西陳皮的鑒別分析。但由于傅立葉近紅外光譜儀器存在價格較高、體積較大的問題,而光柵型便攜式近紅外光譜儀因具備輕便、成本低、易攜帶、功耗低等優(yōu)點得到了廣泛研究[15-17]。胡甜等[18]采用Micro NIR1700微型近紅外光譜儀實現(xiàn)了霍山石斛的快速鑒別研究。李曉云等[19]通過便攜式近紅外漫反射結(jié)合偏最小二乘回歸法建立了牛奶脂肪、蛋白質(zhì)和干物質(zhì)的定量分析模型。然而現(xiàn)階段尚缺乏利用便攜式近紅外光譜儀用于陳皮的研究。其次,便攜式近紅外光譜中常存在較為嚴(yán)重的背景、基線漂移以及噪聲干擾,隨著對近紅外光譜的深入研究,發(fā)現(xiàn)結(jié)合預(yù)處理方法可以扣除光譜中存在的干擾情況,常見的預(yù)處理方法包括:去偏置(De-bias)[20]、去趨勢(de-trend,DT)[21]、標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variable,SNV)[22]、多元散射校正(multivariate scattering correction,MSC)[22]、最大最小歸一化(maximum-minimum normalization,Min-Max)[23]、一階導(dǎo)數(shù)(first derivative,1st)[24]、二階導(dǎo)數(shù)(second derivative,2nd)[24]和連續(xù)小波變換(continuous wavelet transform,CWT)[25],然而不同光譜預(yù)處理方法消除的干擾情況有所不同,DT和De-bias常被用于消除光譜中存在的基線漂移干擾,SNV和MSC被用于消除由樣品顆粒分布不均勻及顆粒大小不同對光譜所造成的散射干擾,Min-Max用于消除光譜的絕對吸收值及多余信息,1st、2nd和CWT等求導(dǎo)算法常用于消除由儀器原因?qū)庾V造成的背景或基線漂移等干擾,在實際分析中,由于儀器或者樣品的原因,光譜中往往存在多種干擾情況,僅用單一預(yù)處理方法無法實現(xiàn)對光譜的優(yōu)化,常需結(jié)合和預(yù)處理組合方式以消除光譜中存在的多種干擾。因此本研究以5年、10年、15年、20年和25年新會陳皮為研究對象,通過光柵型便攜式近紅外光譜儀采集不同年份陳皮內(nèi)囊和外壁光譜信息,采用化學(xué)計量學(xué)方法對不同年份陳皮光譜進(jìn)行優(yōu)化,最后基于無監(jiān)督模式識別的主成分分析(principal component analysis,PCA)以及有監(jiān)督模式識別的獨立軟模型 (soft independent modeling of class analogy,SIMCA)和Fisher線性判別分析(fisher linear discriminant analysis,F(xiàn)LD)方法以建立不同年份陳皮的準(zhǔn)確鑒別模型。
樣品:江門市新會區(qū)嶺南臻寶陳皮茶葉有限公司成品包裝陳皮,分別為陳化年份5年、10年、15年、20年和25年新會陳皮,每個年份樣品分別制備30份,共計150份樣品。不同年份陳皮見圖1。不同年份的陳皮在外觀上具有較大相似性,僅憑肉眼較難區(qū)分各年份陳皮。

圖1 不同年份陳皮Fig.1 Different-age Citri Reticulatae Pericarpium
i-Spec Plus光柵型便攜式近紅外光譜儀:必達(dá)泰克光電科技(上海)有限公司,用于采集不同年份陳皮漫反射光譜信息。
采集不同年份陳皮內(nèi)囊和外壁的漫反射光譜信息,采集范圍11 190 cm-1~5 800 cm-1,為了減小由試驗操作帶來的誤差,每一樣品重復(fù)3次,取平均值作為該樣品的原始光譜。
1.4.1 光譜數(shù)據(jù)分組
光譜數(shù)據(jù)分析在MATLAB R2010b(The Mathworks,Natick,USA)軟件中實現(xiàn),光譜數(shù)據(jù)按照 Kennard-Stone方法以樣本個數(shù)比7∶3的比例分為105個校正集和45個預(yù)測集。
1.4.2 光譜預(yù)處理
為減小陳皮表皮厚度的不一致性和表面特征不均勻等因素的影響,需要采用預(yù)處理方法優(yōu)化光譜,試驗采用De-bias等8個單一預(yù)處理和1st-DT、1st-SNV、1st-MSC、CWT-SNV和CWT-MSC等組合預(yù)處理方法優(yōu)化光譜。
1.4.3 模式識別方法
為了實現(xiàn)不同年份陳皮無損鑒別分析,結(jié)合PCA、SIMCA和FLD方法分別建立不同年份陳皮鑒別模型。PCA是一種常見的無監(jiān)督的模式識別方法。該方法不需要先驗知識,鑒別能力較弱;SIMCA和FLD是兩類常見的有監(jiān)督模式識別方法,其原理有所不同,前者是在對每類樣品建立獨立的PCA模型的前提下對未知樣品進(jìn)行分類;而后者是在類內(nèi)差異小且類間差異大的前提下將數(shù)據(jù)在低維度上進(jìn)行投影,以實現(xiàn)不同樣品的分類。此外,F(xiàn)LD方法要求樣本數(shù)為變量數(shù)的3倍~5倍,常采用PCA方法對數(shù)據(jù)進(jìn)行降維處理,利用得到的主成分建立FLD模型。
圖2為不同年份陳皮內(nèi)囊和外壁的原始光譜圖。

圖2 陳皮內(nèi)囊及外壁原始光譜圖Fig.2 Original spectra of the inner capsule and outer skin of Citri Reticulatae Pericarpium
由圖2可知,內(nèi)囊和外壁光譜在11 190 cm-1~10 500 cm-1、6 000 cm-1~5 800 cm-1范圍均出現(xiàn)了明顯的噪聲干擾;雖然譜線大致走向趨勢一致,但光譜中出現(xiàn)了較為嚴(yán)重的基線漂移及譜峰重疊等干擾;光譜同時存在吸收峰強度弱、特征峰位不突出等問題,僅有兩個較為明顯的峰,在8 300 cm-1~8 000 cm-1附近處出現(xiàn)的吸收峰可能與C-H鍵伸縮振動的二倍頻吸收帶有關(guān)。在7 000 cm-1光譜中出現(xiàn)了較為明顯的吸收峰,可能是由于O-H鍵伸縮振動的二倍頻吸收帶有關(guān)。內(nèi)囊及外壁的光譜差異較小,且僅根據(jù)原始光譜無法鑒別不同年份的陳皮,可能是由于陳皮在成分含量及組分組成上具有一定的相似性。
為了實現(xiàn)對不同年份陳皮的鑒別分析,采用預(yù)處理方法優(yōu)化光譜數(shù)據(jù)后結(jié)合PCA方法建立鑒別模型見圖3。

圖3 不同年份陳皮PCA結(jié)果Fig.3 PCA results of different-age Citri Reticulatae Pericarpium
圖 3(a)、圖 3(b)為不同年份陳皮內(nèi)囊和外壁原始光譜數(shù)據(jù)的PCA結(jié)果,采用第一主成分(PC1)與第二主成分(PC2)進(jìn)行PCA分析,不同年份陳皮的置信橢圓都存在不同程度的重疊,僅根據(jù)原始光譜的PCA無法實現(xiàn)不同陳化陳皮的鑒別。為了提高鑒別結(jié)果,采用單一及組合預(yù)處理方法對光譜進(jìn)行優(yōu)化。圖3(c)為內(nèi)囊數(shù)據(jù)結(jié)合最佳預(yù)處理(CWT)得到PCA結(jié)果,鑒別率為44%,圖3(d)為外壁數(shù)據(jù)結(jié)合最佳預(yù)處理(DT)得到的PCA結(jié)果,其鑒別率為35%。和原始光譜的PCA結(jié)果相比,采用預(yù)處理后的鑒別率略有提高,表明預(yù)處理方法可以有效消除光譜中的干擾。然而,采用PCA方法仍然無法實現(xiàn)對不同年份陳皮的準(zhǔn)確鑒別分析。
為了實現(xiàn)不同年份陳皮鑒別分析,采用SIMCA模式識別法結(jié)合預(yù)處理方法建立不同年份陳皮的鑒別模型。SIMCA方法得到的鑒別率見表1。

表1 通過SIMCA和不同的預(yù)處理方法獲得的鑒別率Table 1 Identification accuracies obtained by SIMCA and different pretreatment methods
對于內(nèi)囊數(shù)據(jù),采用原始光譜數(shù)據(jù)結(jié)合SIMCA模式識別法可實現(xiàn)不同年份陳皮94%的鑒別分析;采用單一預(yù)處理后光譜得到了優(yōu)化,采用De-bias、DT、Min-Max和1st預(yù)處理方法在一定程度上提高了鑒別結(jié)果,鑒別率為96%。采用組合預(yù)處理方法對光譜進(jìn)行優(yōu)化后,僅有CWT-SNV預(yù)處理后的結(jié)果達(dá)到了94%,其余4種組合預(yù)處理方法得到的鑒別率反而有所降低,可能是多種預(yù)處理把差異信息也進(jìn)行了消除。對于外壁數(shù)據(jù)的分析,采用原始光譜結(jié)合SIMCA模式識別法的鑒別率為88%,采用SNV預(yù)處理后鑒別準(zhǔn)確率提高至94%。采用組合預(yù)處理方法對光譜優(yōu)化后,鑒別率有所降低,以1st-SNV和1st-MSC預(yù)處理后得到的結(jié)果為較佳,鑒別率為84%。以上結(jié)果表明,采用SIMCA結(jié)合預(yù)處理方法基本可以實現(xiàn)對不同年份陳皮的鑒別分析;與原始光譜和單一預(yù)處理結(jié)果相比,運用組合預(yù)處理方法可能會消除光譜中的有用信息,從而降低了鑒別率。
采用SIMCA模式識別依然無法實現(xiàn)不同年份陳皮的100%鑒別。為進(jìn)一步提高鑒別準(zhǔn)確率,通過FLD模式識別法結(jié)合不同預(yù)處理方法用于不同年份陳皮的鑒別分析。FLD模式識別法結(jié)合不同預(yù)處理方法的鑒別率見表2。

表2 通過FLD和不同的預(yù)處理方法獲得的鑒別率Table 2 Identification accuracies obtained by FLD and different pretreatment methods
與PCA和SIMCA模式識別法的結(jié)果相比,采用FLD方法后,內(nèi)囊原始數(shù)據(jù)的鑒別率上升到了96%;采用SNV預(yù)處理方法后可以實現(xiàn)100%的鑒別分析;結(jié)合組合預(yù)處理方法優(yōu)化內(nèi)囊數(shù)據(jù)后,其鑒別率反而有所下降,以1st-SNV和1st-MSC預(yù)處理后98%鑒別率為較佳。對于外壁數(shù)據(jù),采用FLD方法結(jié)合原始光譜便可實現(xiàn)不同年份陳皮96%的鑒別;光譜采用Min-Max、1st和CWT等單一預(yù)處理優(yōu)化后鑒別率提高至98%;在組合預(yù)處理方法的結(jié)果中,以1st-DT和CWT-MSC的結(jié)果較佳,鑒別率為98%。
為了更直觀地反映鑒別的效果,根據(jù)FLD前3個得分繪制三維圖見圖4。

圖4 利用SNV預(yù)處理內(nèi)囊數(shù)據(jù)和Min-Max處理外壁數(shù)據(jù)得到的FLD得分圖Fig.4 FLD scores of inner capsule data with SNV and outer skin data with Min-Max
圖4(a)和圖4(b)分別為采用SNV預(yù)處理內(nèi)囊數(shù)據(jù)得到的FLD結(jié)果和Min-Max預(yù)處理外壁數(shù)據(jù)的FLD結(jié)果,可以看到不同年份陳皮得到了較好的鑒別。結(jié)果表明,采用FLD方法可有效實現(xiàn)對不同年份陳皮的鑒別分析。其可能原因是FLD方法利用了先驗知識,在保證類內(nèi)差異越小且類間差異越大前提下,將數(shù)據(jù)在低維度上進(jìn)行投影以實現(xiàn)最佳的鑒別分析;而PCA方法是一種無監(jiān)督的分類方法,沒有利用先驗知識,單純利用方差信息進(jìn)行分類,鑒別能力較差;SIMCA方法是通過對每一類數(shù)據(jù)分別建立PCA模型,
再利用這些模型對未知數(shù)據(jù)進(jìn)行分類,依舊存在鑒別能力不夠強的問題,對于類間差異很小的樣本分析往往得不到滿意的結(jié)果。
基于光柵型便攜式近紅外光譜儀結(jié)合光譜預(yù)處理方法以及PCA、SIMCA和FLD等不同模式識別方法建立對不同年份陳皮的鑒別模型。由于儀器的限制,光譜中存在較為明顯的背景、基線漂移以及噪聲干擾,預(yù)處理方法可以有效消除光譜中存在的多種干擾。與主成分分析方法和軟獨立模式分類法結(jié)果相比,F(xiàn)LD方法結(jié)果最優(yōu),Min-Max、1st和CWT等單一預(yù)處理或1st-DT、CWT-MSC等組合預(yù)處理方法結(jié)合外壁數(shù)據(jù)得到的鑒別率為98%,而采用內(nèi)囊數(shù)據(jù)結(jié)合原始光譜便實現(xiàn)了不同年份陳皮100%鑒別分析。采用光柵型便攜式近紅外光譜儀結(jié)合合適的化學(xué)計量學(xué)方法能有效實現(xiàn)對不同年份的鑒別分析。