999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于質譜與支持向量機的清香型白酒等級判別

2014-03-17 02:51:20程平言范文來
食品工業科技 2014年8期
關鍵詞:模型

程平言,范文來,徐 巖

(教育部工業生物技術重點實驗室,江南大學生物工程學院釀酒科學與酶技術研究中心,釀造微生物與應用酶學研究室,江蘇無錫214122)

基于質譜與支持向量機的清香型白酒等級判別

程平言,范文來*,徐 巖

(教育部工業生物技術重點實驗室,江南大學生物工程學院釀酒科學與酶技術研究中心,釀造微生物與應用酶學研究室,江蘇無錫214122)

不同等級白酒鑒別對控制白酒質量和保護消費者利益有重要意義,文中以牛欄山酒為例,研究清香型白酒質量等級鑒別方法。運用頂空固相微萃取質譜(HS-SPME-MS)技術獲取三類不同等級的57個牛欄山酒樣質荷比m/z 55~191范圍內的離子豐度值數據,分別進行偏最小二乘回歸分析(PLS)和主成分回歸分析(PCR),其中PLS模型的預測結果明顯優于PCR。同時PLS與PCR模型的回歸系數用于選擇重要特征離子,其中PLS與PCR回歸系數法分別選擇了12和10個離子,用選擇的離子變量構建支持向量機(SVM)模型,模型對測試集的預測準確率分別為80%和86.7%,其中PCR回歸系數法選擇的特征離子為m/z 71、103、104、106、127、149、161、179、183和184。

等級鑒別,頂空固相微萃取質譜,偏最小二乘回歸分析,主成分回歸分析,支持向量機

食品安全與質量等級鑒別已日漸引起人們的關注。目前,白酒研究大多采用色譜技術[1-3]和光譜技術[4]。其中范文來等[2]應用毛細管色譜法結合聚類分析清晰區分了四川地區與江淮流域的濃香型白酒;Yang等[4]應用近紅外光譜技術鑒別了三種不同品牌的白酒。它們大多是關于白酒不同產地、品牌的鑒定,而很少涉及同種酒不同質量等級的鑒別。近年來,頂空固相微萃取質譜技術[5](HS-SPME-MS)逐漸用于白酒鑒定,這一方法無需酒樣預濃縮及化合物解析,能夠快速用于大批量樣品鑒定。近期,Cheng等利用HS-SPME-MS技術實現了八種不同白酒的產地鑒別[6]及濃香型白酒的等級鑒別[7-8],主要采用了逐步線性判別分析[9]、偏最小二乘-判別分析[10]以及神經網絡等[11]化學計量學方法。

本文以清香型牛欄山不同等級酒為例,研究HS-SPME-MS技術結合偏最小二乘回歸分析(PLS)、主成分回歸分析(PCR)和支持向量機[12-13](SVM)等分析法,建立清香型白酒質量等級鑒別模型。首先,采用HS-SPME-MS技術分析獲取不同等級牛欄山原酒的離子豐度值數據;然后,經PLS和PCR分析選取重要特征離子,構建SVM模型,并比較模型的預測結果,確定最適等級鑒別模型及離子變量選擇方法。

1 材料與方法

1.1 材料與儀器

牛欄山酒樣 實驗選用三個等級的牛欄山酒樣,分別為特制大米查酒(DC)、特制二米查酒(EC)和優質酒(YZ),其中每類等級各有19個酒樣,采用分層抽樣法將整個樣品集分成訓練集(42個酒樣,每類等級14個)和測試集(15個酒樣,每類等級5個),其中訓練集用于構建等級鑒別模型,而測試集則用于驗證模型的準確性;氯化鈉 上海國藥集團,分析純。

Milli-Q超純水系統 Millipore,Bedford,MA,USA;自動頂空進樣系統 德國Gerstel公司;GC 6890N-MSD 5975氣相色譜-質譜聯用儀 美國Agilent公司。

1.2 實驗方法

1.2.1 樣品準備 將所有不同等級的牛欄山酒樣,用超純水稀釋到10%vol,取8mL置于20mL自動進樣頂空瓶中,加入3g氯化鈉,蓋上瓶蓋。

1.2.2 SPME條件 參考文獻[14],對方法適當改進,采用DVB/CAR/PDMS三相萃取頭于恒溫40℃下預熱5min,后在同一溫度下萃取吸附15min;萃取完成后,萃取頭插入氣相色譜儀進樣口中解吸分析物。由于本方法僅需獲得酒樣的整個頂空色譜圖而無需解析化合物,因此,將解吸時間設為10min。

1.2.3 質譜條件 EI電離源,電子轟擊能量為70eV,離子源溫度為230℃;掃描范圍為35~350amu。

1.2.4 化學計量學分析 文中采用PLS、PCR方法構建等級鑒別模型,并比較兩模型的鑒別結果。同時,PLS和PCR也用于篩選重要離子,借助PLS和PCR模型回歸系數值的大小,篩選出重要的特征離子。用篩選得到的離子變量構建SVM模型,并比較兩模型的預測準確性。文中所使用的軟件分別為Unscrambler 9.7,Matlab 2012a及Libsvm工具箱。

2 結果與分析

通過HS-SPME-MS技術獲取不同等級牛欄山酒質荷比m/z 55~191范圍內的離子豐度值,圖1顯示了牛欄山不同等級原酒的離子平均豐度質譜圖。不同離子的豐度值存在明顯差異,其中m/z 88離子作為基峰,在所有酒樣中它的離子豐度值最高,且它是乙酯類化合物的特征離子[5]。另外,低質荷比的離子豐度值明顯高于高質荷比離子,甚至某些離子的豐度值在圖中趨于0。圖1中顯示出牛欄山特制大米查酒、特制二米查酒以及優質酒的離子相對豐度變化趨勢基本相同,僅在某些離子處的豐度值存在明顯差異。其中特制大米查酒和特制二米查酒的離子豐度值要低于其優質酒,特別是在高質荷比的離子區域,它們的豐度值在圖1中趨于0??梢?,從質譜圖中無法得到能夠區分三類等級牛欄山酒的客觀可靠的差異,因此,需借助合適的化學計量學方法來提取重要的特征離子實現牛欄山酒等級的鑒別。

圖1 牛欄山三個等級酒質荷比m/z 55~191范圍內的離子平均強度質譜圖Fig.1 The average mass spectrum of Niulanshan liquors with different grades in the range of m/z 55~191

不同酒樣的離子豐度值構成數據矩陣,但在進行化學計量學分析前,需對數據進行標準化處理。首先,對觀測值進行標準化,將最高峰m/z 88離子的相對豐度值設為100%,其他離子的相對豐度值根據比例計算,這樣可排除因儀器、酒精含量等外在因素造成的離子豐度值差異對判別結果的影響;然后,對離子變量進行處理,由于某些離子的豐度值為零,采用四次方根法進行數據轉換[15]。另外,由于m/z 88離子作為基峰,在酒樣中的相對強度相同,因此將其去除,如此形成了57行(訓練集42個,測試集15個)×135(m/z 188離子豐度值為0)列的數據矩陣。

2.1 偏最小二乘回歸分析

PLS分析特別適用于X變量較多的情況,雖然此方法起初并非用于分類判別,但它的應用成功實現了這一目的[16]。首先,將牛欄山酒的不同等級作Y變量,并對它的值作如下定義:1=特制大米查酒,2=特制二米查酒,3=優質酒,若網絡模型的輸出值在0.7與1.3之間,則酒樣判別為特制大米查酒,若輸出值在1.7與2.3之間,則酒樣判別為特制二米查酒,若輸出值在2.7與3.3之間,則酒樣判別為優質酒。分界點的選擇標準與其他已報道的研究相似[17-18]。PLS回歸分析可降低變量維度,本文中篩選出7個主成分,占整個變量集方差的96%,此最適主成分數由交叉驗證的最低預測殘差確定。用訓練集酒樣構建PLS模型,在此過程中,采用留一法交叉驗證[19]測試模型的有效性,即每次留一個酒樣對由剩余酒樣建立的模型進行驗證,此過程重復n次,其中n為酒樣總數,模型的預測能力為n個模型預測準確率的平均值。選取前兩個成分來可視化酒樣的聚類結果,如圖2,不同等級的牛欄山酒樣基本能夠分開,僅少數酒樣發生部分重疊,其中特制大米查酒呈散狀分布,主要分布于第三象限中;特制二米查酒與優質酒分布較集中,呈平行分布。可見,PLS分析能夠實現不同等級牛欄山酒的分類聚集。

圖2 不同等級牛欄山酒的PLS得分圖Fig.2 The PLS two-dimensional diagrams of Niulanshan liquors of different quality grade

PLS模型的預測性能由R2、訓練集和交叉驗證的均方根誤差來確定。表1中顯示PLS模型對訓練集的R2和均方根誤差值分別為0.969和0.143。當R2值越接近1,模型的擬合結果越好,可見,此PLS模型對酒樣等級的擬合效果較好,能夠用于牛欄山酒樣等級的預測。從表1中可見,PLS模型對訓練集不同等級牛欄山酒樣的預測準確度都很高,分別為92.9%,100%和92.9%。

為了驗證模型對未知等級樣品的預測能力,本文中引入測試集,其所含酒樣未用于模型的構建。表1中顯示PLS模型對測試集中不同等級牛欄山酒樣的預測準確率分別為60%、100%和60%。另外,模型對測試集的R2為0.872,等級的整體預測準確率為73.3%。

表1 PLS和PCR模型的性能參數及不同等級牛欄山酒的預測準確率Table 1 The performance parameter and prediction accuracy of PLS and PCR model for Niulanshan liquors of different quality grade

2.2 主成分回歸分析

應用PCR分析時,對酒樣等級的預設值及分界點選擇標準與PLS模型相同。PCR分析同樣可以降低變量維度,最后以交叉驗證的最低預測殘差選出7個最適主成分,占整個變量集方差的95%。用訓練集酒樣構建PCR模型,在此過程中,與PLS模型相同,采用留一法交叉驗證測試模型的有效性。選取前兩個成分來可視化酒樣的聚類結果,如圖3,不同等級牛欄山酒樣的聚類效果不如PLS分析,不同等級的酒樣無法分離,特別是特制二米查酒與優質酒酒樣發生明顯重疊。

圖3 不同等級牛欄山酒的PCR得分圖Fig.3 The PCR two-dimensional diagrams of Niulanshan liquors of different quality grade

從表1中可見,PCR模型對訓練集的R2和均方根誤差值分別為0.879、0.284,模型預測性能明顯低于PLS模型,且R2值未接近于1,模型的擬合結果不太好。PCR模型對不同等級酒樣準確率分別為78.6%、85.7%和71.4%,準確率差異較大,且低于PLS模型,這可能受樣本數和酒樣代表性的影響。借助測試集來驗證PCR模型的泛化能力,不同等級酒樣的整體預測準確率為66.7%。從總體看,PLS模型對等級的判別結果優于PCR模型。

2.3 SVM模型比較

本文中PLS和PCR方法也用于變量選擇,提取重要的特征離子。這一選擇方法以回歸系數為基礎,根據PLS和PCR模型對各離子的回歸系數的大小來選擇重要離子,應特別注意回歸系數絕對值大的離子變量對等級判別越重要。對PLS和PCR模型,分別選取回歸系數絕對值大于1.1和0.7的離子。從圖4可見,PLS回歸分析選取了m/z 72、76、106、112、155、157、166、170、177、179、180、183共12個離子;而PCR分析選取了m/z 71、103、104、106、127、149、161、179、183、184共10個離子。其中兩種方法均選出了m/z 106、179、183這3個離子,需特別注意它們對等級判別的重要性。

圖4 PLS(a)和PCR(b)模型對m/z 55~191范圍內離子的回歸系數圖Fig.4 The regression coefficients of PLS(a)and PCR(b)models in the range of m/z 55~191

將兩種方法篩選出的離子,組成新的數據矩陣用作SVM模型的輸入集,牛欄山二鍋頭酒樣等級的預設值為輸出層,預設值及分界點選擇標準與PLS模型相同,構建SVM模型。SVM在解決小樣本、非線性及高維模式識別中表現出許多特有的優勢[20]。應用SVM過程中,需首先解決三個重要問題,分別是合適的輸入數據集、核函數和最優核參數。常用的核函數主要有徑向基函數、多項式和S型函數。與其他函數相比,徑向基函數應用更廣泛[21],因此本文中選用徑向基函數。在確定了核函數的基礎上,需確定最優的核參數g和懲罰因子c兩個參變量[22],才能準確地構建等級判別的SVM模型。SVM采用結構風險最小化原則來選擇最優參數,明顯優于傳統網絡的經驗風險最小原則[23]。本文中采取十折交叉驗證和網格搜索算法在2-10~210的區域內尋找最優c和g值(圖5)??梢?,根據PLS回歸系數法選擇的離子所構建的SVM模型的最優c和g值分別為45.25和0.707;而根據PCR回歸系數法選擇的離子所構建的SVM模型的最優c,g值分別為2和11.314。圖5中顯示了SVM模型的網格搜索過程,坐標點為最優參數c和g組合。

表2顯示了由所得的兩組最優參變量c和g值構建的SVM模型的性能參數和不同等級白酒的預測準確度??梢?,由PLS回歸系數法選擇的變量構建的SVM模型對測試集酒樣的R2和均方根誤差分別為0.895和0.081,略優于PCR回歸系數法。其中PLS回歸系數法構建的SVM模型對訓練集酒樣的預測準確率分別為85.7%、100%和92.9%,測試集酒樣的平均預測準確率為80.0%;由PCR回歸系數法構建的SVM模型對訓練集酒樣的預測準確率分別為92.9%、92.9%和100%,測試集酒樣的平均預測準確率為86.7%,僅2個特制大米查酒樣預測錯誤,造成模型預測錯誤的主要原因是用于構建模型的訓練集酒樣代表性不明顯。因此,若要提高模型的預測準確性,增加樣本數是必不可少的過程。

圖5 SVM模型的最優參數組合c和g的網格搜索圖Fig.5 The grid search process of optimal c and g parameter combination of SVM model

表2 不同離子選擇方法構建的SVM模型的性能參數及不同等級牛欄山酒的預測準確率Table 2 The performance parameter and prediction accuracy of SVM models built by two ion selection methods for Niulanshan liquors of different quality grade

圖6 PLS、PCR和SVM模型對測試集的預測誤差圖Fig.6 The prediction error of PLS,PCR and SVM model for the test set

由PCR回歸系數法選擇的離子構建的SVM模型對牛欄山不同等級酒樣的預測準確率更高。圖6比較了PLS、PCR和SVM模型對測試集的預測誤差值,很明顯,PLS和PCR模型的誤差值波動較大,而SVM1和SVM2模型的誤差值在第5號酒樣處出現很大波動,但對其他酒樣的預測誤差變化很平穩。綜合考慮,當以±0.3為臨界值時,由PCR回歸系數法選擇的變量構建的SVM模型的預測效果要優于其他模型,此外也說明PCR回歸系數法能有效用于提取重要的特征離子。另外,可考慮增加酒樣的樣本量,提高酒樣的代表性來完善模型,提高模型的預測準確度,降低誤差值。

3 結論

以±0.3為分界點選擇標準,PLS模型的等級預測準確率高于PCR模型,同時用PLS與PCR的回歸系數值選擇重要的離子變量,構建SVM模型。由PCR回歸系數法選擇的特征離子所構建的SVM模型,對測試集的預測準確率達86.7%,預測結果優于其他模型,選出的重要離子為m/z 71、103、104、106、127、149、161、179、183和184。因此,質譜技術與支持向量機相結合的方法能夠準確用于白酒等級鑒別;且PCR回歸系數法能有效地選擇重要的離子變量。

[1]祝成,張宿義,趙金松.不同感官等級白酒基酒的聚類分析[J].釀酒科技,2011(9):47-50.

[2]范文來,徐巖.應用GC-FID和聚類分析比較四川地區白酒原酒與江淮流域白酒原酒[J].釀酒科技,2007(11):75-78.

[3]溫永柱,范文來,徐巖,等.白酒中5種生物胺的HPLC定量分析[J].食品工業科技,2013,34(7):305-308.

[4]Yang GQ,Zhang SJ,Zhang HH.Study on discrimination of brands of Chinese distilled spirit using near infrared transmission andreflectancespectra[Z].WorldAutomationCongress,Kobe,2010.

[5]Jelen HH,Ziolkowska A,Kaczmarek A.Identification of the botanical origin of raw spirits produced from rye,potato,and corn based on volatile compounds analysis using a SPME-MS method [J].Journal of Agricultural and Food Chemistry,2010,58(24):12585-12591.

[6]Cheng PY,Fan W,Xu Y.Determination of Chinese liquors from differentgeographic originsbycombination ofmass spectrometry and chemometric technique[J].Food Control,2014,35(1):153-158.

[7]程平言,范文來,徐巖.基于質譜與化學計量學的濃香型白酒等級鑒別[J].食品與發酵工業,2013,39(6):94-98.

[8]Cheng PY,Fan W,Xu Y.Quality grade discrimination of chinese strong aroma type liquors using mass spectrometry and multivariate analysis[J].Food Research Internationa(lin press).

[9]Liu L,Cozzolino D,Cynkar W,et al.Geographic classification of Spanish and Australian Tempranillo red wines by visible and near-infrared spectroscopy combined with multivariate analysis [J].Journal of Agricultural and Food Chemistry,2006,54(18):6754-6759.

[10]Abdi H.Partial least squares regression and projection on latent structure regression[J].Wiley Interdisciplinary Reviews:Computational Statistics,2010,2(1):97-106.

[11]Marini F.Artificial neural networks in foodstuff analyses:Trends and perspectives A review[J].Analytica Chimica Acta,2009,635(2):121-131.

[12]Xu Y,Zomer S,Brereton RG.Support vector machines:A recent method for classification in chemometrics[J].Critical Reviews in Analytical Chemistry,2006,36(3-4):177-188.

[13]Liu F,He Y,Wang L.Determination of effective wavelengths for discrimination offruit vinegars using near infrared spectroscopy and multivariate analysis[J].Analytica Chimica Acta,2008,615(1):10-17.

[14]Fan W,Qian MC.Headspace solid phase microextraction and gas chromatography-olfactometry dilution analysis of young and aged Chinese“Yanghe Daqu”liquors[J].Journalof Agricultural and Food Chemistry,2005,53(20):7931-7938.

[15]Wold S,Sj?str?m M,Eriksson L.PLS-regression:a basic tool of chemometrics[J].Chemometrics and Intelligent Laboratory Systems,2001,58(2):109-130.

[16]Pereira AC,Reis MS,Saraiva PM,et al.Analysis and assessment of Madeira wine ageing over an extended time period through GC-MS and chemometric analysis[J].Analytica Chimica Acta,2010,660(1-2):8-21.

[17]Yu H,Zhou Y,Fu X,et al.Discrimination between Chinese rice wines of different geographical origins by NIRS and AAS[J]. European Food Research and Technology,2006,225(3-4):313-320.

[18]Cozzolino Dl,Smyth HE,Gishen M.Feasibility study on the use of visible and near-infrared spectroscopy together with chemometrics to discriminate between commercial white wines of different varietal origins[J].Journal of Agricultural and Food Chemistry,2003,51(26):7703-7708.

[19]Sampaio OM,Reche RV,Franco DW.Chemical profile of rums as a function of their origin.The use of chemometric techniques for their identification[J].Journal of Agricultural and Food Chemistry,2008,56(5):1661-1668.

[20]林翠香.基于數據挖掘的葡萄酒質量識別[D].長沙:中南大學,2010:38-39.

[21]Belousov AI,Verzakov SA,Von Frese J.Applicational aspects of support vector machines[J].Journal of Chemometrics,2002,16(8-10):482-489.

[22]CherkasskyV,MaYQ.Practicalselection ofSVM parameters and noise estimation for SVM regression[J].Neural Networks,2004,17(1):113-126.

[23]Gunn SR.Support Vector Machines for Classification and Regression[R].ISIS Technical Report,1998:5.

Quality grade discrimination of light aroma type liquor based on mass spectrometry and support vector machine

CHENG Ping-yan,FAN Wen-lai*,XU Yan
(Key Laboratory of Industrial Biotechnology,Ministry of Education,Laboratory of Brewing Microbiology and Applied Enzymology,School of Biotechnology,Jiangnan University,Wuxi 214122,China)

Quality grade discrimination of Chinese liquor was benefit for controlling liquor quality and safeguarding the interests of consumers.In this paper,taking Niulanshan for instance,we studied quality grade discrimination of Chinese liquor with light aroma type.Mass spectra of 57 samples were obtained by head space-solid phase microextraction-mass spectrometry(HS-SPME-MS)technology in the range of m/z 55~191.And then,the partial least squares regression(PLS)and principal component regression(PCR)models were developed by calibration set and predicted the quality grade of validation set.Obviously PLS model was superior to PCR model.The support vector machine(SVM)models were built by different ion selection methods,PLS regression coefficients and PCR regression coefficients;the prediction accuracy of SVM models for the test set was 80% and 86.7%,respectively.The ions,m/z 71,103,104,106,127,149,161,179,183 and 184 were selected by PCR regression coefficients.

quality grade discrimination;head space-solid phase microextraction-mass spectrometry(HSSPME-MS);partial least squares regression(PLS);principal component regression(PCR);support vector machine(SVM)

TS207.3

A

1002-0306(2014)08-0049-05

10.13386/j.issn1002-0306.2014.08.001

2013-07-05 *通訊聯系人

程平言(1988-),女,碩士研究生,研究方向:酒類風味化學。

國家高技術研究發展計劃(863計劃)(2013AA102108)。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧美成人免费一区在线播放| 亚洲九九视频| 国产精品免费电影| 精品夜恋影院亚洲欧洲| 欧美天天干| 色哟哟国产精品一区二区| 国产福利免费在线观看| 久久亚洲高清国产| 亚洲妓女综合网995久久| 不卡无码h在线观看| 99视频精品在线观看| 天天摸天天操免费播放小视频| 日韩成人午夜| 91久久偷偷做嫩草影院免费看 | 国产欧美日韩va| 亚洲αv毛片| 国产精品污污在线观看网站| 热久久国产| 久久福利网| 91网站国产| 国产成人亚洲无吗淙合青草| 国产一级小视频| 亚洲色精品国产一区二区三区| 国产经典在线观看一区| 97视频免费看| 美美女高清毛片视频免费观看| 夜夜拍夜夜爽| 国产成人a毛片在线| 久久精品国产精品一区二区| 亚洲精品男人天堂| 亚洲v日韩v欧美在线观看| 亚洲国产日韩欧美在线| 综合亚洲网| 久久综合色视频| 国产高清免费午夜在线视频| 福利小视频在线播放| lhav亚洲精品| www.狠狠| 91午夜福利在线观看精品| 精品国产网| 亚洲色图欧美在线| 国产青青草视频| 国产精品55夜色66夜色| 本亚洲精品网站| 2020国产免费久久精品99| 国产成人综合久久精品下载| 91 九色视频丝袜| 国产欧美高清| 理论片一区| 又黄又湿又爽的视频| 网友自拍视频精品区| 午夜福利视频一区| 九九精品在线观看| 国产熟睡乱子伦视频网站| 99re这里只有国产中文精品国产精品 | 亚洲AⅤ波多系列中文字幕 | 国产国产人在线成免费视频狼人色| 国产69精品久久久久孕妇大杂乱 | 国产欧美视频在线观看| 色网站在线免费观看| 在线欧美国产| 伊人福利视频| 日韩精品久久久久久久电影蜜臀| 思思99思思久久最新精品| 国产在线一区二区视频| 亚洲码一区二区三区| www亚洲天堂| 日本在线亚洲| 色屁屁一区二区三区视频国产| 久久久久久久久18禁秘| 国产无码精品在线播放| 天堂岛国av无码免费无禁网站| 成人免费视频一区二区三区 | 91破解版在线亚洲| 国产95在线 | 国产成人在线无码免费视频| 蜜桃视频一区二区| 欧美色香蕉| 99精品福利视频| 人妻丰满熟妇AV无码区| 欧美激情首页| 亚洲精品自拍区在线观看|