999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

超高效液相色譜-四極桿/飛行時間質譜鑒別紅葡萄酒的品種和產地

2022-10-17 04:56:32韓靜雯李國輝鐘其頂王道兵樊雙喜劉洋
食品與發酵工業 2022年19期
關鍵詞:分類模型

韓靜雯,李國輝,鐘其頂,王道兵,樊雙喜,劉洋

(中國食品發酵工業研究院有限公司,北京,100015)

葡萄酒是由水、糖、有機酸、酚類和揮發性化合物組成的復雜混合物,GB/T 15037—2006《葡萄酒》中定義葡萄酒為以鮮葡萄或葡萄汁為原料,經全部或部分發酵釀制而成的,含有一定酒精度的發酵酒。自2003年以來,葡萄酒的質量評價以及品種、產地真實性的研究也逐步深入。由于我國對于葡萄酒品種鑒別和原產地認證手段都還不夠成熟,缺乏相應的檢測方法予以支撐。以次充好虛報品種和產地的葡萄酒產品極大地損害了消費者以及葡萄酒行業的經濟利益,因此急需建立我國葡萄酒真實性鑒別的有效手段。

目前用于葡萄酒品種、產地鑒別的主要有穩定同位素技術[1-3]、氣相色譜質譜聯用技術[4-6],高效液相色譜技術[7]和紅外光譜技術[8]等。葡萄酒中物質的組成和數量與氣候條件、土壤、葡萄品種等因素息息相關,可利用揮發性成分和元素信息等非靶向或靶向代謝指紋圖譜分析判別葡萄酒差異相關的特征性化合物,從而進行不同品種和產地等信息的區分[9-10]?;瘜W計量學的逐步發展使得主成分分析(principal component analysis, PCA)、偏最小二乘判別分析(partial least square-discriminant analysis, PLS-DA)、支持向量機(support ector machine, SM)和隨機森林(random forest, RF)等被廣泛應用于食品領域進行品種鑒別和產地溯源[11-14]。此外,非目標篩查與多元統計分析相結合可大幅提升對不同地理環境的葡萄酒鑒別的準確率[7]。超高效液相色譜-四極桿飛行時間質譜(ultra-performance liquid chromatography-quadrupole-time-of-flight-mass spectrometry,UPLC-QTOF-MS)技術具有良好的分離能力、分辨率高、檢測限低并且能夠測定樣品成分和物質結構的特性,在葡萄酒的質量和真實性方面有很好的應用前景[11]。本研究以不同品種和產地的國產紅葡萄酒為對象,基于UPLC-QTOF-MS進行葡萄酒代謝組學分析,結合化學計量學手段,通過不同預測模型逐步對國產紅葡萄酒的品種和產地進行鑒定,通過綜合考慮不同模型之間正確率的對比以及各個模型對于異常點的容忍度和過擬合的可能性,選擇最優預測模型,為葡萄酒真實性鑒別提供方法支撐。

1 材料與方法

1.1 實驗儀器

Agilent 1290-6546超高效液相色譜-四極桿飛行時間質譜儀(配備Dual AJS ESI源),美國Agilent公司。

1.2 實驗試劑和樣品

甲酸(質譜純,≥99%),上海麥克林生化科技有限公司;甲醇(質譜純,99.9%),賽默飛世爾科技有限公司;超純水,美國Millipore公司。

所選樣品均為單一葡萄品種釀造,同時包含不同的品種、產地和年份信息,樣品年份范圍為2015年—2019年,主要集中在2017年和2018年。樣品品種和產地信息如表1、表2所示。

1.3 實驗方法

1.3.1 樣品的制備

準確量取1 mL紅葡萄酒樣品與2 mL甲醇置于玻璃管中,渦旋混勻后取2 mL經0.22 μm有機濾膜過濾后置于進樣瓶中,以供UPLC-QTOF-MS檢測。

質量控制(quality control, QC)樣品制備:所有待測樣品每個取0.5 mL置于三角瓶中,混合均勻,取混勻后的液體1 mL與2 mL甲醇置于玻璃管中,渦旋混勻后取2 mL經0.22 μm濾膜過濾后置于進樣瓶中,以供UPLC-QTOF-MS檢測。

1.3.2 試劑配制

流動相A:0.1%(質量分數,下同)甲酸水溶液;流動相B:100%甲醇。

1.3.3 色譜條件

色譜柱:ZORBAX Eclipse Pluse C18(2.1 mm×100 mm,1.8 μm);柱溫40 ℃;進樣量2 μL;流速0.3 mL/min;梯度洗脫程序見表3。

表3 正模式梯度洗脫程序Table 3 Gradient elution procedure in positie mode

1.3.4 質譜條件

在正模式下進行全掃描檢測。

參數設置:毛細管電壓3 500 ;干燥氣溫度300 ℃;干燥氣流速6 L/min;霧化氣壓力241.3 kPa;鞘氣溫度350 ℃;鞘氣流速11 L/min;碎裂電壓120 ;質量掃描范圍m/z50~1 700;采集速率2 spectra/s;參比離子m/z121.050 873和m/z922.009 798。

1.4 數據處理與統計分析

將在MassHunter Workstation(美國Agilent公司)采集的譜圖數據使用Profinder 10.0和Mass Profiler Professional(MPP)進行統計學分析并建立預測模型。

2 結果與分析

2.1 UPLC-QTOF-MS方法

UPLC-QTOF-MS不需要復雜的前處理過程,具有液相色譜中良好的分離機制,被視為代謝指紋圖譜分析的有效工具[15],其能夠在不需要標準物質的情況下對復雜樣品中的化合物成分進行鑒定和分析,具有高分辨率、高靈敏度、高選擇性和高精度的優點,能夠提供更加精確的相對分子質量和結構信息[16]。本研究對紅葡萄酒進行非靶向指紋圖譜分析,在沒有具體的目標物質的情況下,對液相色譜分離和質譜檢測在通用的方法參數基礎上加以優化,以獲得包含盡可能多的化合物信息的樣品數據。方法采用反相高壓色譜柱和梯度洗脫使得紅葡萄酒樣品中不同極性的化合物能夠在高水相向高有機相轉變過程中有效分離,在流動相水相中添加0.1%的甲酸能夠一定程度上幫助物質電離[14],所有的化合物可在16 min內被洗脫,m/z的范圍選擇50~1 700,儀器在掃描過程中會自動對參比離子進行檢測,以此來對樣品中檢測到的物質進行質量校準。

2.2 提取穩定化合物

圖1所示為以正模式掃描的QC樣品總離子流色譜圖。將獲得的QC數據導入Profinder中進行遞歸特征提取,通過峰高、保留時間和質量進行篩選,共篩選出1 470個特征化合物,在此基礎上在MPP中過濾掉變異系數(coefficient of ariation,C)≥20%的不穩定化合物,獲得970個C<20%的穩定化合物。樣品數據分組導入Profinder并依據獲得的穩定化合物進行目標特征提取,獲得樣品數據的PFA文件。在MPP中將所有數據用中位數對齊,建立預測模型。

圖1 質控樣品總離子流色譜圖Fig.1 Total ion chromatograms of QC samples

2.3 建立預測模型

2.3.1 PCA

PCA技術能夠提取分析原始數據中有效的化學信息作為新的主成分變量,有效地降低數據維度,選取方差最大的幾個主成分,通過對比不同組別樣本間的差異性建立分組模型[17-18]。將經QC數據篩選后的樣品數據導入MPP進行PCA,紅葡萄酒品種和產地的PCA結果見圖2。無論品種還是產地的樣本數據都相互交疊、重合程度極大。品種鑒別中3個主成分變量貢獻率分別為15.61%、9.81%和8.09%,產地鑒別中3個主成分變量貢獻率分別為15.33%、9.45%和7.91%,累計貢獻率為32.69%,小于35%,貢獻率低。提取的有效數據信息不充分,因此,PCA模型均無法成功區分葡萄酒品種和產地。

a-品種;b-產地圖2 品種和產地的PCA圖Fig.2 PCA of ariety and origin

2.3.2 PLS-DA

為了解決PCA模型主成分貢獻率低,無法對樣品的品種和產地進行區分的問題,進一步使用PLS-DA對樣品數據進行分析。PLS-DA可以同時實現多元線性回歸和主成分分析[10,19],相較于PCA模型,PLS-DA模型除了對數據進行降維處理,還能實現預測模型的構建,通過有監督的模式更好地明確樣本組間關系。PLS-DA模型對紅葡萄酒樣品品種和產地的分類可視3D模型見圖3。圖3-a中可看出3個品種數據點各自形成清晰可見的聚集分布,分類效果較好,圖3-b中4個產地分組間仍有較大部分的重疊。從正確率來看,模型對于樣品的品種和產地的識別能力均為100%,但對于品種鑒別的預測能力為83.81%,對于產地溯源的預測能力為71.43%。

a-品種;b-產地圖3 品種和產地的PLS-DA圖Fig.3 PLS-DA of ariety and origin

在品種鑒別的交叉驗證中赤霞珠、梅鹿輒和西拉的分類正確率分別為81.12%、80.95%和100.00%(表4);在產地溯源的交叉驗證中河北、寧夏、山東和新疆的分類正確率分別為71.97%、78.57%、50.00%和80.00%(表5)。根據這種有監督的分析,可以注意到西拉與其他2個品種差異較大,品種預測中赤霞珠和梅鹿輒正確率相對較低,但仍明顯呈現出聚類分布的趨勢,表明3個品種釀酒葡萄所生產的葡萄酒中的化合物組成存在一定程度的差異。產地預測中正確率低于80%,模型預測結果中,各個樣本組中被錯誤分類的樣品散落在其他幾個樣本組之間,沒有統一性,其葡萄酒數據間存在異常點,需要采用更為穩定與對異常點容忍度更大的模型進一步分析。

表4 PLS-DA模型的品種分類結果Table 4 The oeriew of ariety classification results obtained by PLS-DA model

表5 PLS-DA模型的產地分類結果Table 5 The oeriew of origin classification results obtained by PLS-DA model

2.3.3 SM

SM模型作為一種常見的廣義線性分類器,一般用于分類與回歸問題的研究,對數據異常點的容忍度優于PLS-DA,適用于較小的數據集,不容易造成過擬合現象[13,20]。本次構建的SM模型采用線性核函數和留一法交叉驗證,對于樣品的品種和產地和識別能力均為100%,對于品種鑒別的預測能力為97.48%,對于產地溯源的預測能力為85.07%(表6、表7)。訓練集和測試集的整體正確率較高,各個組別自身正確率除山東產地外均在80%以上,山東產地僅為64.00%(表7)。品種模型的訓練和預測正確率十分優異,3種釀酒葡萄所釀造的葡萄酒之間的差異明顯。但有13個山東產地的紅葡萄酒樣品被識別為了河北產地樣品,導致產地預測正確率出現了較大的偏差,這可能是由于山東省與河北省葡萄的主要種植地均在沿海地區,其地理環境、土壤條件以及種植方式均有相似之處,使得2個產地葡萄酒在一定程度上具有相同的化合物信息,導致無法正確分類。盡管SM對于數據異常點的處理較為優異,但仍然會受到相似性較大的數據點的影響,且組間樣本量差異較大,對模型分類預測結果造成影響。

表6 SM模型的品種分類結果Table 6 The oeriew of ariety classification results obtained by SM model

表7 SM模型的產地分類結果Table 5 The oeriew of origin classification results obtained by SM model

2.3.4 RF

為了進一步避免數據異常點對于模型的影響,使用對于異常點不敏感的RF,其作為一種非線性分類與回歸方法[21],區別于SM需要對多項參數進行調整優化,更為簡單直接,從原始樣本中抽取多個樣本單獨進行決策樹建模,通過對大量決策樹的預測匯總,投票得出最終預測結果,提高了模型的預測精度,一定程度上避免了過擬合等問題的出現[22-23]。圖4給出了決策樹≤500時紅葡萄酒樣品品種和產地分類的袋外誤差結果,在保證模型有效的基礎上設置盡可能少的決策樹個數以節省建模所需時間。品種鑒別中誤差最低點為0.003 597 122,對應的最小決策樹個數為257,產地溯源中誤差最低點為0.012 987 013,對應的最小決策樹個數為259。

a-品種;b-產地圖4 品種及產地溯源袋外誤差Fig.4 Out-of-bag error of ariety identification and origin traceability

根據篩選出的最小決策樹個數分別建立預測模型(見表8和表9)。2個模型在訓練過程中沒有出現錯誤分類,即識別能力均為100.00%,表明RF模型能夠分別對紅葡萄酒的品種和產地進行有效區分。整體品種分類的預測正確率為99.64%,赤霞珠、梅鹿輒和西拉的分類正確率分別為100.00%、97.62%和100.00%;整體產地分類的預測正確率為98.70%,河北、寧夏、山東和新疆的分類正確率分別為100.00%、98.21%、96.00%和98.57%。在針對2個模型的驗證中,所有組別的正確率均高于96.00%,驗證了RF模型的有效性。

表8 RF模型的品種分類結果Table 8 The oeriew of ariety classification results obtained by RF model

表9 RF模型的產地分類結果Table 9 The oeriew of origin classification results obtained by RF model

本實驗選取的3個葡萄品種赤霞珠、梅鹿輒和西拉在色素、花青素和一些酚類物質的種類和含量存在顯著差異[24],使得建立模型的干擾較少,較易得到準確率優異的品種預測模型。產地模型中克服了河北與山東產地樣品數據間的相似性,僅有2個山東產地樣品被識別為河北產地,有效避免了過擬合問題。同時,本研究在前期對數據進行了過濾以及特征化合物提取,篩選出的特征化合物在建立預測模型時更具有優勢,相較于同類研究僅使用部分目標酚類化合物及部分代謝物建立的RF預測模型(正確率91.75%)[25],預測正確率更高,性能更好。

3 結果與討論

使用UPLC-QTOF-MS在全掃描模式下對紅葡萄酒進行了代謝指紋圖譜分析,在獲得豐富信息數據的基礎上對紅葡萄酒進行品種鑒別和產地溯源具備可行性。不同葡萄品種(赤霞珠、梅鹿輒和西拉)釀制的紅葡萄酒除在PCA模型中無法實現聚類之外,在其他3種模型中均呈現出了較好的分類正確率,盡管各品種中包含了來自全國各地不同產地的信息,但其自身的差異性較小,識別率較高。而來自不同產地(河北、寧夏、山東和新疆)的紅葡萄酒受到產地間相似地理環境、土壤條件和種植方式等因素的影響,存在較多異常點信息,PCA和PLS-DA模型均無法實現準確分類,而對于異常點容忍度優異,過擬合現象發生概率較小的SM和RF模型,成功實現了對于不同產地的準確分類。本研究通過多元化、多維度的非靶向數據源構建了系統的預測模型,鑒別不同品種和產地的葡萄酒,從而建立了我國葡萄酒真實性鑒別的有效方法。

但同時,本實驗在樣品設置上存在一些不足,由于中國釀酒葡萄的主要種植品種為赤霞珠,因此無論是品種樣品設置還是產地樣品設置中赤霞珠都占據了大多數。各個產地的主要釀酒葡萄種植品種存在差異,使得產地模型的建立存在較大的干擾。另外,由于時間對葡萄酒的影響較大,盡管本次樣品中涵蓋了不同的時間信息,但差距較小,在未來的研究中,可以對葡萄酒中組分隨著時間產生的變化進行探究,進一步分析本研究中的2個模型是否具有長期的適用性,以及如何進行適度的更新調整,從而建立更加完善可靠的葡萄酒分析預測模型。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产欧美视频一区二区三区| 欧美成人综合在线| 伊人久久精品无码麻豆精品| 亚洲AV无码久久精品色欲| 呦女精品网站| 亚洲综合色婷婷中文字幕| 天堂网亚洲综合在线| 亚洲精品无码AV电影在线播放| 亚洲一区二区三区国产精华液| 91人妻日韩人妻无码专区精品| 亚洲一级毛片| 亚欧成人无码AV在线播放| 亚洲色偷偷偷鲁综合| 国产成人亚洲毛片| 中文字幕人妻无码系列第三区| 国产成人喷潮在线观看| 国模视频一区二区| 亚洲国内精品自在自线官| 中文字幕在线观看日本| 黄色福利在线| 永久在线精品免费视频观看| 国产人碰人摸人爱免费视频| 成人毛片在线播放| 99免费视频观看| 强奷白丝美女在线观看| 日本一区二区三区精品国产| 欧美h在线观看| 精品三级在线| 尤物精品国产福利网站| 97视频免费在线观看| 日本精品影院| 国产超薄肉色丝袜网站| 欧美精品在线免费| 在线人成精品免费视频| 波多野结衣一级毛片| 香蕉视频在线精品| 久久精品国产精品国产一区| 人人看人人鲁狠狠高清| 欧美成人午夜在线全部免费| 99re视频在线| 91九色国产porny| 亚洲精品视频免费看| 最新无码专区超级碰碰碰| 玖玖精品视频在线观看| 白浆免费视频国产精品视频| 久草青青在线视频| 在线欧美日韩国产| 欧美激情视频一区| 婷婷激情亚洲| 日本免费精品| 四虎国产永久在线观看| 欧洲高清无码在线| 久久精品丝袜高跟鞋| 日韩免费毛片视频| 国产成人狂喷潮在线观看2345| 欧美 亚洲 日韩 国产| 国产亚洲精品91| 国产女人18水真多毛片18精品| 亚洲黄色视频在线观看一区| 天天躁日日躁狠狠躁中文字幕| 国产人成在线观看| 国产在线拍偷自揄拍精品| 亚洲高清无码久久久| 国产精品亚洲一区二区三区z| 亚洲性影院| 成人年鲁鲁在线观看视频| 伊人色天堂| 91啦中文字幕| 久久青草免费91观看| 精品福利国产| 国产Av无码精品色午夜| 99视频精品全国免费品| 亚洲国产亚洲综合在线尤物| 成人午夜久久| 日韩国产黄色网站| 乱系列中文字幕在线视频| 91区国产福利在线观看午夜| 毛片在线看网站| 国产成人区在线观看视频| 亚洲综合色婷婷| 亚洲αv毛片| 思思热精品在线8|