祁興普,劉純友,佀再勇,劉萍,傅曉雨,戰旭梅,陳通*
(1.江蘇農牧科技職業學院食品科技學院,江蘇 泰州 225300;2.廣西科技大學生物與化學工程學院,廣西 柳州 545006)
廬山云霧茶是我國傳統名茶,其主要產于江西省九江市境內的廬山,其色澤呈碧綠,茶湯清澈透明,滋味醇香甘潤,是綠茶中的上品[1-3]。相關資料表明[4-6],茶葉的品質等級差異是由其內在的化學成分組成以及在沖泡過程中所呈現出的感官屬性所決定的。而茶葉香氣則是眾多揮發性有機物質(volatile organic com-pounds,VOCs)綜合作用的結果,也是茶葉品質分級的重要判別依據,其直接關系到企業的經濟效益與消費者的喜愛程度。因此,茶葉中VOCs的差異組成可作為特征指紋譜用于直觀反映茶葉品質特征[7]。當前,不同等級茶葉之間的鑒別仍然依靠評茶師的感官評價,但該方法難以通過數字化方式表述VOCs信息組成,且由于不同等級茶葉之間品質成分差異不大,導致其正確識別率也并不理想[8]。因此,應用化學計量學方法提取茶葉VOCs中的表征性成分,實現茶葉品質等級的快速、準確、無損判別對現代茶葉的產業化發展顯得尤為重要。近年來,相關研究人員已采用氣相色譜-質譜聯用(gas chromatography-mass spectrometry,GCMS)[9]、氣相色譜-嗅聞[10]以及電子鼻、電子舌[11]等多種分析技術對茶樣中的VOCs成分進行分析檢測,并在產地識別、種類判別以及品質分級等方面均取得了較好的成果[12-14]。然而,這些分析方法均存在一定的局限性,如GC-MS聯用技術的檢測結果雖然準確可靠,但其設備運行環境要求苛刻,且操作繁雜、檢測成本高、耗時久,難以在現代化工業生產中得到推廣應用。離子遷移譜(ion mobility spectrometry,IMS)技術是基于氣相中不同的氣相離子在電場中遷移速度的不同來表征離子物質自身屬性的一項分析技術,目前已廣泛應用于爆炸物的痕量檢測[15]、非法藥物識別[16]、食品質量過程控制[17]、人體健康檢查[18]以及生物環境監測[19]等多個領域。氣相離子遷移譜(gas chromatography-ion mobility spectrometry,GC-IMS)是由氣相色譜和離子遷移譜兩種設備組合形成的聯用型分析儀器,其可發揮不同儀器各自的優勢,從而產生長處相互疊加的效果,具有無損、簡便、快捷、準確的優點,已廣泛應用于食品、農產品的品質檢測、質量控制以及過程分析控制等多個領域,而基于VOCs指紋信息將GC-IMS技術應用于茶葉品質的研究卻少有報道。
本研究以不同等級的廬山云霧茶為研究對象,引入數字圖像技術[20-21],通過分析GC-IMS二維譜圖篩選不同等級廬山云霧茶樣品之間VOCs的差異,并結合化學計量學方法建立廬山云霧茶的等級判別模型,為茶葉品質分析提供一種新的分析方法。
廬山云霧茶樣:廬山市七尖云霧茶有限公司(江西九江),63個茶樣,共3個等級,其中一級樣品為18個,二級樣品為20個,三級樣品為25個。茶葉等級評定主要依據采摘日期而定,高等級的茶樣采摘時間較早,且產量低。試驗前,將所有樣品保存于5℃冰箱中待測。
FlavourSpec@1H1-00128型GC-IMS設備:德國Gesellschaft公司;CTC-PAL自動進樣裝置:瑞士CTC Analytics AG公司;SE-54-CB-1型非極性石英毛細管柱(15 m ×0.53 mm ×1 μm):德國 CS-Chromatographie Service GmbH公司;EL204-IC型電子天平:梅特勒-托利多儀器有限公司。
樣品檢測前,參照陳熠敏等[22]、宋萌萌等[23]的預處理方法,將不同等級廬山云霧茶粉碎過篩待測,GC-IMS檢測條件如下。
頂空進樣條件:分別稱取2 g茶葉樣品置于20 mL頂空進樣瓶中密封,通過自動頂空進樣方式進樣,進樣體積200 μL,孵化溫度80℃,孵化時間30 min,進樣針溫度為85℃,孵化器轉速500 r/min。
GC條件:色譜柱溫50℃,載氣為高純度N2(純度≥99.999%),載氣流速控制程序為:起始流速2 mL/min,保持2 min后8 min內線性增加至15 mL/min,接著10 min內線性增至100 mL/min,最后10 min內線性增至150 mL/min,總分析時間為30 min。
IMS條件:3H電離源(6.5keV),漂移管溫度為45℃,漂移氣體為N2,漂移氣體流速為150 mL/min,漂移管溫度45℃,正離子化模式,漂移管長度9.8 cm,管內線性電壓為400 V/cm。
使用 MATLAB R2009b(The Mathworks Inc.)軟件繪制譜圖;采用GC×IMS Library Search 2.0.3(內置NIST2004與IMS數據庫)軟件進行特征化合物的鑒定;使用PRTools 5.0(荷蘭代爾夫特理工大學)工具包實現特征提取和模式識別分析。
在GC-IMS二維譜圖中,X、Y、Z軸分別對應遷移時間(ms)、保留時間(s)和離子強度大小(V),其本質為一個二維矩陣。因此,基于數字圖像原理,該矩陣數據可依據顏色映射表顯示為一幅灰度圖像,或者按照一定的顏色圖填充形成偽彩色圖像,顏色的差異用于表示Z軸數據的大小。
為觀察不同等級茶葉樣品的整體VOCs特征信息,按照等級歸屬分別計算每個等級內茶葉樣品的平均GC-IMS譜圖(即每個等級內矩陣的平均值)作為表征譜圖。另外,由于GC-IMS原始譜圖對應的矩陣維度較大(4 615×4 500),且不能很好地分辨茶葉樣品所產生的VOCs區域差異,對后續判別模型的學習和計算帶來不便。因此,為降低數據運算和提高可視化效果,截取遷移時間為7.698 ms~13.138 1 ms、保留時間為108.42 s~426.66 s內的數據矩陣進行可視化顯示,結果如圖1所示。
圖1 一級、二級和三級的廬山云霧茶GC-IMS譜圖Fig.1 GC-IMS chromatography plot of first-grade,second-grade and third-grade of Lushan Cloud-fog tea
由圖1可知,3種等級廬山云霧茶樣產生VOCs的種類在GC-IMS譜圖上呈現一定的相似性,表明3種等級茶樣均含有部分相同的VOCs,具體表現為在相同的遷移時間和保留時間垂直相交的特征區域均有信號峰產生,但對應VOCs的含量存在差異,表現為特征峰強度的不同(圖1中分別標記的實線矩形框);不同等級的茶葉樣品含有對應自身等級所獨有的揮發性有機物質,如圖1 A中實線箭頭方向指示的區域,該物質對應的區域在二級、三級茶葉樣品中均未出現,其為一級廬山云霧茶樣品所特有的香氣物質。
GC-IMS二維譜圖僅能夠提供直觀性的對比分析,不能實現準確的數字化表述。因此,如何從GCIMS譜圖中提取特征性VOCs信息用以表征不同等級樣品品質之間的差異顯得很有必要。為進一步觀察不同等級廬山云霧茶的VOCs差異變化,依據顏色混合原理(即加色混合),分別使用紅色、綠色、藍色3種單色對3個等級茶樣的平均矩陣數據進行映射,然后將得到的譜圖進行顏色混合處理,結果如圖2所示。
圖2 不同等級廬山云霧茶單色混合圖Fig.2 Monochromatic mix of maps of different grades of Lushan Cloud-fog tea
由RGB色彩模型可知,紅色與綠色混合可形成黃色,紅色與藍色混合可產生品紅色,綠色和藍色混合則形成青色,而3種顏色等量混合可形成白色。因此,結合圖2可知,圖中部分特征區域(如圖2中標記編號為11的特征峰對應物質為苯甲醛)對應的特征VOCs為一級廬山云霧茶所特有,部分特征區域對應物質為二級茶特有(見圖 2中標記編號為 5、8、9、13、20等區域對應的特征峰),而其它區域對應的VOCs則為3種等級茶樣所共有的VOCs物質(見圖2中標記編號為10對應的特征峰)。結合本研究的目的,使用Otsu自動閾值分割算法對混合處理后的顏色進行特征提取,最終共提取了47個特征峰變量作為表征不同等級茶樣之間的VOCs差異,以便結合化學計量學方法進一步分析,選取的特征區域見圖2中數字標識區域。
由于GC-IMS聯用設備所獲得數據為二維矩陣,故特征峰對應物質的檢索是同時依據保留時間和漂移時間進行確定(即十字交叉鑒別)。由于當前設備自帶的IMS譜庫化合物存儲量并不豐富,故不能實現所有特征峰的鑒別。在保留指數檢索誤差范圍為[-6,+6]、歸一化后遷移時間誤差范圍為[-0.01,+0.01]的條件下,部分特征峰對應揮發性物質檢索結果見表1。
表1 不同等級廬山云霧茶揮發性有機物質定性結果Table 1 Qualitative results of GC-IMS volatile compounds in the Lushan Cloud-fog tea
由表1可知,廬山云霧茶的VOCs主要為醇類、醛類、烯類以及少量的酮類、呋喃類等物質;其中正戊醇、苯甲醛(對應圖2中標記編號3和11的特征區域)等VOCs為一級茶樣所特有,同理二級茶樣中苯已醛、辛醛以及檸檬烯等物質為其主要特征物質,這與已有的報道相一致[24-25];而三級茶樣所含有的特征VOCs種類較少,且物質含量較低,表現為圖2中歸屬于三級茶樣的特征區域出現較少。由此可知,不同等級廬山云霧茶樣的VOCs成分在種類、含量等方面均存在差異,故可借助化學計量學方法進一步研究基于VOCs差異而實現不同等級茶葉判別的可行性。
將選取的47個特征區域的峰面積作為特征變量,組成63×47的矩陣進行主成分分析(principal component analysis,PCA),并取前2個主成分因子的得分向量作散點圖,其結果如圖3所示。
圖3 不同等級廬山云霧茶樣品主成分得分圖Fig.3 Principal component analysis of the Lushan Cloud-fog tea samples
由圖3可知,矩陣經過PCA后前2個主成分得分的貢獻率分別為54.78%、32.15%,累計方差貢獻率達到86.93%,表明前2個主成分能夠較好地代表原始數據的絕大部分有效信息。3種不同等級茶葉樣本在主成分得分圖中均有各自的歸屬類,第一主成分比第二主成分在分類邊界中起到的作用更大,但不同等級茶葉樣品的簇類邊界之間還存在一定的重疊現象,尤其是二級與三級樣品之間區域邊界不明顯或部分區域重疊,可能是由這2種等級茶樣產生的VOCs過于相似所導致。因此,需要進一步使用模式識別算法對其進行區分。
采用 K-最近鄰(K-nearest neighbor,KNN)法對經過PCA特征壓縮后的前2個得分向量進行模式識別。考慮到不同等級茶葉樣品數量各不相同,故按照7∶3的比例分別從對應等級中隨機選取樣本,劃分為訓練集和預測集,最終判別結果如表2所示。
表2 不同等級廬山云霧茶KNN識別結果Table 2 KNN classification results of different grades of Lushan Cloud-fog tea
由表2可知,訓練集中一級和二級廬山云霧茶樣品的識別率均為100%,而三級茶葉樣品中僅有1個樣品被誤判為二級樣品,其正確率為94.12%,預測集中一級和三級的樣品識別率為100%,二級茶葉存在1個樣品被誤判,其識別率為83.33%,產生誤判的原因可能是:一方面,二級茶葉樣品和三級茶葉樣品產生的VOCs種類非常相似,僅在物質成分的含量有所差異,導致二級和三級樣品之間的區域邊界部分重疊;另一方面,由于KNN算法是基于空間距離實現樣品類別的區分,導致其對數據的局部結構非常敏感。由此可知,基于GC-IMS構建的風味指紋譜圖結合化學計量學方法可實現不同等級廬山云霧茶的準確區分,其預測集區分度高達94.73%。
本研究以不同等級廬山云霧茶為研究對象,依據數字圖像技術并結合Otsu自動閾值分割算法實現GCIMS二維譜圖中差異特征峰的自動選取,從而構建了不同等級廬山云霧茶的差異指紋信息譜,并結合化學計量學方法建立不同等級的判別模型。試驗結果表明,選取的特征峰集合能夠有效表征不同等級廬山云霧茶的VOCs信息差異,KNN判別模型的預測集識別率可達94.73%,表明GC-IMS技術可用于茶葉品質信息的分析和檢測,數字圖像處理技術和化學計量學方法的引入可以更好地實現茶葉等級的數字化判別,該方法為基于VOCs成分差異分析茶葉品質提供了參考依據。