錢曙,邢建國,王雨,程輝
(浙江工商大學 計算機與信息工程學院,浙江 杭州,310018)
黃酒是世界上最古老的酒類之一,源于中國,與啤酒、葡萄酒并稱世界三大古酒。黃酒以大米、黍米、粟為原料,含有人體必需的多種氨基酸[1],其中包括有數(shù)種未知氨基酸。黃酒中的檢測方法主要有人為感官品評和理化指標檢測。前者主要憑借人的主觀感官感受來判斷,而這種判斷往往只是初步的口味是否純正的判斷,無法做到對其中化學物質(zhì)的定量檢測,并且受外界干擾和人為因素影響;后者是通過儀器判斷,方法主要有氣相色譜[2-3]、高效液相色譜[4-6]等,這些方法雖然準確率較高,但是往往檢測時間長并且成本也比較高。
隨著傳感器技術的發(fā)展和各種分類算法的不斷演進完善,目前已經(jīng)應用于飲料[7]、酒[8-11]等食品的檢測。電子鼻的分類大多使用傳感器陣列的穩(wěn)態(tài)值作為特征值和PCA、SVM、BPNN等分類算法[12-14]。由于受傳感器數(shù)量自身物理特性限制,金屬氧化物型氣敏傳感器與氣體反應至穩(wěn)態(tài)通常需要幾分鐘以上,恢復時間也較長[15],因此檢測一次往往需要較長時間,使得電子鼻的應用范圍大大受限。
本研究從流速調(diào)制的角度設計了一種電子鼻系統(tǒng),通過改變進氣流速,進而調(diào)節(jié)傳感器陣列中氣體分子的分布,進而提高識別正確率,縮短檢測時間。采用不同進氣流速下對應的區(qū)間梯度作為特征向量,并且在PCA算法的基礎上設計了一種改進的自適應PCA算法(AD-PCA)。將該系統(tǒng)應用于黃酒酒齡分類,對比了AD-PCA、SVM、BPNN幾種分類算法,以驗證此系統(tǒng)的有效性。
本文實驗材料為2017年3月份生產(chǎn)的5種不同酒齡的瓶裝黃酒(每種黃酒5瓶)(見表1),采購自當?shù)爻小?/p>
自主設計的基于流速調(diào)制的電子鼻系統(tǒng),其硬件模塊包括采樣閥、氣敏傳感器陣列、采樣氣腔、流量計、流速控制閥、氣泵、STM32F407微控制器、計算機和連接導管;其軟件模塊包括采樣控制模塊和數(shù)據(jù)處理模塊。硬件結(jié)構(gòu)框圖如圖1所示。
樣品氣體或潔凈的空氣由采樣閥進入氣腔,采樣閥的作用是控制實驗的進行和排廢,若采樣閥中通過的是樣品氣體則進行的是正常實驗環(huán)節(jié);若采樣閥中通過的是潔凈的空氣則進行的是一次實驗結(jié)束后的排廢環(huán)節(jié)。氣體通過采樣閥后進入氣腔,氣腔內(nèi)均勻分布有傳感器陣列,傳感器陣列由10個MOS型氣敏傳感器組成,氣體通過氣腔經(jīng)過流量計(用來直觀的顯示出當前流速)再經(jīng)由流速控制閥以某一進氣流速通過,本研究根據(jù)實驗實際情況設計了100、200、300、400 mL/min四種進氣流速,流速控制閥根據(jù)程序指令自動切換進氣流速。氣腔采集到的樣品數(shù)據(jù)值由采樣控制模塊傳輸?shù)綌?shù)據(jù)處理模塊,通過STM32F407微控制器的UART-to-USB發(fā)送到計算機端進行數(shù)據(jù)處理和分析。

表1 黃酒種類Table 1 Kinds of Chinese yellow wine

圖1 硬件結(jié)構(gòu)示意圖Fig.1 Figure of hardware structure
電子鼻系統(tǒng)采用的氣敏傳感器型號如表2:

表2 所用氣敏傳感器列表Table 2 List of sensors
在模式識別和模式分類中,常用的分類算法如PCA和SVM通常采用達到穩(wěn)態(tài)的數(shù)據(jù)(如平均值,最大值)進行降維分類,穩(wěn)態(tài)數(shù)據(jù)需要傳感器信號穩(wěn)定之后才能得到,而傳感器信號要達到穩(wěn)定一般需要較長時間,實驗完成后的排廢時間也很長,兩次測量時間間隔長,使得檢測速度慢,檢測周期長。為了提高檢測速度,縮短檢測周期,提出了一種改進的自適應PCA算法進行分類來驗證實驗結(jié)果,即使用不同流速下對應的區(qū)間梯度作為特征向量。

組成的特征向量為:

實驗過程中分別取每種酒齡的黃酒100 mL置于250 mL錐形瓶中,傳感器預熱1 h。樣品檢測前,先抽取60 s潔凈空氣,排出氣腔和導管內(nèi)的廢氣,待傳感器穩(wěn)定輸出后,依次以100、200、300、400 mL/min的進氣流速進行測試,每種流速的測試時間為10 s,之后由采樣控制模塊控制流速控制閥自動切換到下一進氣流速,總的檢測時間為40 s,一組檢測結(jié)束后,以最大進氣流速通入潔凈空氣進行2.5 min的排廢,每個樣本檢測25次。
本研究提出的一種改進的自適應的PCA算法(AD-PCA),使用不同流速對應的區(qū)間梯度作為特征向量,圖2為傳感器對三年陳黃酒一次采樣的原始數(shù)據(jù),從圖中可以看出各傳感器對樣品氣體的響應值曲線和響應值變化情況,進氣流速從小到大依次進行切換,在圖中可以看出,隨著時間的推移,采樣點的增加,流速的每一次切換,曲線均有明顯的斜率上的變化,傳感器與氣體剛開始反應時,響應值數(shù)據(jù)變化較慢,流速切換后反應明顯加快,響應值變化幅度明顯變大。
圖3是5種黃酒經(jīng)過AD-PCA算法處理后在不同流速下的三維散點圖,從圖中可以看到不同酒齡的黃酒分布的集中區(qū)域不同,不同流速下對應不同酒齡的黃酒的分布情況不同,100 mL/min流速下,無法區(qū)分酒齡分布,200 mL/min時,六年陳黃酒已經(jīng)區(qū)分開來,300 mL/min流速下,三年陳,六年陳和八年陳的黃酒已經(jīng)可以區(qū)分出來,最后400 mL/min流速下,各年份黃酒均區(qū)分出來。隨著流速的增大,不同酒齡黃酒的集中分布越顯著。相同種類黃酒分布比較集中,不同種類的黃酒分布則有一定距離。

圖2 三年陳黃酒傳感器響應值圖Fig.2 Response value of 3 years Chinese yellow wine

圖3 四種流速下的AD-PCA三維散點圖Fig.3 Scatter plot of AD-PCA under four kinds flow rates
AD-PCA的分類正確率如圖4所示,可以看出,隨著流速的增大,4種不同流速下的分類正確率均有提高,最終在400 mL/min流速下達到最高。
圖5是SVM分類算法得到的分類圖,總的樣本數(shù)為125個,每種黃酒的樣本總數(shù)為25個,將其中的15個作為訓練集,剩下的10個作為測試集。訓練集總數(shù)為75個,編號1~75;測試集總數(shù)為50個,編號為1~50。其中1~10為三年陳,11~20為五年陳,21~30為六年陳,31~40為八年陳,41~50為十年陳。

圖4 不同流速下AD-PCA分類正確率Fig.4 Correct classification rate of AD-PCA underdifferent flow rates
從圖5中可以看出,50個測試集數(shù)據(jù)中有4個分類錯誤,對應不同酒齡黃酒的正確率為:五年陳、六年陳、十年陳黃酒的分類正確率為100%;三年陳、八年陳黃酒的分類正確率為80%,平均分類正確率為92%。

圖5 SVM分類圖Fig.5 Classification graph of SVM
BP神經(jīng)網(wǎng)絡構(gòu)建根據(jù)系統(tǒng)輸入輸出特點確定BP神經(jīng)網(wǎng)絡的結(jié)構(gòu),由于樣本氣體輸入信號有40維(即4種流速下傳感器陣列中10個傳感器的響應值,共40維),待分類信號共有5類(即5種不同酒齡黃酒),所以神經(jīng)網(wǎng)絡的結(jié)構(gòu)為40-41-5,即輸入層有40個節(jié)點,隱含層有41個節(jié)點(40維輸入信號和1維分類信號),輸出層有5個節(jié)點。
從原始數(shù)據(jù)中提取125個樣本數(shù)據(jù),其中100個作為訓練樣本,剩下的25個作為預測樣本。圖6為測試集樣本的預測類別與實際類別的對比圖,得到的5種酒齡的黃酒分類正確率均為100%,可見使用BPNN算法能夠準確的分類出黃酒酒齡。平均分類正確率為100%。一方面該結(jié)果也驗證了AD-PCA中采用平均值作為特征向量得到的結(jié)果是比較準確的,另一方面也可能是因為數(shù)據(jù)樣本數(shù)較少,使得正確率結(jié)果較高。

圖6 預測分類和實際分類對比圖Fig.6 Comparison of forecast classification andactual classification
表3是3種算法的分類正確率表。采用AD-PCA算法,三年陳和六年陳黃酒最大分類正確率為100%,五年陳,八年陳和十年陳黃酒分別為88%,84%,96%,平均正確率為93.6%。采用SVM算法,五年陳,六年陳和十年陳正確率為100%,三年陳和八年陳為80%,平均正確率為92%。采用BPNN算法,三年陳,五年陳,六年陳,八年陳和十年陳正確率均為100%,平均正確率為100%。

表3 三種算法的分類正確率表Table 3 The correct classification rates of AD-PCA SVM and BPNN
自主設計了一種基于流速調(diào)制的電子鼻系統(tǒng),通過改變進氣流速來最大程度擴大傳感器對不同成分和不同濃度氣體的響應范圍。使用改進的自適應主成分分析算法(AD-PCA)、支持向量機算法(SVM)、誤差反向傳播神經(jīng)網(wǎng)絡算法(BPNN)進行分類識別。用黃酒酒齡分類驗證該電子鼻系統(tǒng),AD-PCA得到93.6%的平均分類正確率,SVM得到92%的平均分類正確率,BPNN得到100%的平均分類正確率,證明本系統(tǒng)可以有效縮短檢測時間,提高分類正確率,做到快速分類。
[1]陳佩仁,陳江萍,王林秋,等.黃酒產(chǎn)業(yè)發(fā)展的前世今生和未來淺析[J].釀酒,2015,42(4):111-114.
[2]嚴冬霞,高紅波. 靜態(tài)頂空—氣相色譜法分析不同年份黃酒中主要香氣成分[J]. 釀酒科技,2011(7):114-117,120.
[3]胡健,池國紅,吳苗葉,等. 利用風味物質(zhì)鑒別黃酒產(chǎn)地[J]. 釀酒科技,2009(6):17-19.
[4]江偉,蘭玉倩,黃毅,等. 固相微萃取與氣相色譜—質(zhì)譜聯(lián)用法對不同酒齡黃酒的微量風味分析與應用[J]. 食品與發(fā)酵工業(yè),2011,37(2):144-150.
[5]鮑忠定,孫培龍,許榮年. 動態(tài)頂空進樣GC/MS法測定不同酒齡紹興酒的揮發(fā)性醛類化合物[J]. 釀酒科技,2007(1):97-98.
[6]諸葛慶,李博斌,鄭云峰,等. 反相高效液相色譜法測定黃酒中的β-苯乙醇[J]. 食品科學,2009,30(14):175-177.
[7]楊智, 王楠, NIAMAT U, 等. 電子鼻對紅棗乳酸發(fā)酵飲料的品質(zhì)分析[J]. 西北農(nóng)業(yè)學報, 2015, 24(11): 149-156.
[8]楊利軍,湯旭祥,張千金,等. 基于智能電子鼻系統(tǒng)對不同品牌啤酒區(qū)分[J]. 食品科學, 2011,32(22):184-187.
[9]徐晚秀, 李臻峰, 張振, 等. 基于電子鼻的中國白酒酒齡檢測[J]. 食品與發(fā)酵工業(yè), 2016, 42(2): 144-149.
[10]張振, 李臻鋒, 宋飛虎, 等. 電子鼻結(jié)合化學計量法用于檢測黃酒酒齡[J]. 食品與機械, 2015(3): 57-61.
[11]繆璐, 何善廉, 莫佳琳, 等. 電子鼻技術在朗姆酒分類及原酒識別中的應用研究[J]. 中國釀造, 2015, 34(8): 106-110.
[12]SHI Z,YU T,ZHAO Q,et al.Comparison of algorithms for an electronic nose in identifying liquors[J]. Journal of Bionic Engineering,2008,5(3):253-257.
[13]FANY,XUE Y,LI Z, et al. Analyzing the flavor compounds in Chinese traditional fermented shrimp pastes by HS-SPME-GC/MS and electronic nose[J]. Journal of Oceanic University of China,2017,16(2):311-318.
[14]TANG X W, HE H J, GENG L H, et al. Evaluation of maturity and flavor of melons usingan electronic nose[J]. Agricultura l Science & Technology, 2011, 12(3): 447-450.
[15]周宇,孟慶浩,亓培鋒,等. 基于單類支持向量機的電子鼻在白酒真假識別中的應用[J]. 傳感技術學報,2015,28(12):1 741-1 746.