殷 勇 葛 飛 于慧春
(河南科技大學食品與生物工程學院, 洛陽 471003)
近年來,電子鼻的應用較為廣泛,在食品檢測領域的應用也尤為突出。這是因為食品樣品大多屬于復雜樣品,全面檢測各種成分,或是單靠感官檢驗很難準確界定食品的整體質量。于是,作為整體質量分析的電子鼻被認為是檢測食品最有潛力的一種方法[1-3]。電子鼻中氣敏傳感器往往因為老化、環境波動等因素而產生漂移現象[4-6],因此漂移是氣敏傳感器的固有特征。漂移問題的存在使電子鼻難以實現穩健檢測。所以,消除或降低漂移影響對電子鼻的檢測至關重要[7-8]。
關于漂移的研究,主要分為兩類:①漂移成分校正法,其目的是找到一種合適的校正信號將漂移分離出去,如用主成分分析法[9]、獨立成分分析法[10]、偏最小二乘法[11]等。②采用檢測模型校正法,如徑向基函數神經網絡[12-13]、自組織映射神經網絡[14]等模型補償方法。前者需要大量檢測數據作為先驗信息,局限于被測樣品本身的屬性,分離出的漂移信號也具有局限性,降低了電子鼻在實際應用中的適用能力;后者不是真正意義上的去漂移方法,僅靠模型補償漂移造成的影響,存在容易遺失記憶信息(漂移信息)等問題[15]。
針對以上不足,考慮到漂移是氣敏傳感器的固有行為這一特點,并參照文獻[16],本文從電子鼻空載數據的小波包分解層面研究漂移機制,提出漂移剔除方法,并將該方法應用于4種白酒的鑒別中,以提升電子鼻鑒別能力。
試驗用電子鼻系統是實驗室自行設計的,主要由氣敏傳感器陣列、A/D數據采集裝置、計算機模式識別分析軟件等部分組成。氣敏傳感器陣列由14個SnO2型金屬氧化物氣敏傳感器組成,分別是TGS800、TGS812、TGS813、TGS816、TGS821、TGS822、TGS824、TGS825、TGS826、TGS830、TGS831、TGS832、TGS842、TGS880。各型號傳感器對應的敏感特征詳見文獻[10]。在此電子鼻系統中,每個氣敏傳感器加熱電壓均為(5.0±0.05) V,回路測量電壓為(10.0±0.01) V。另外,此系統還配有溫、濕度傳感器來測量測試環境溫、濕度的變化,以期部分補償環境對氣敏傳感器的影響。溫、濕度傳感器的工作電壓也為(10.0±0.01) V。數據采集工作由12位高精度的A/D轉換裝置完成。數據處理與分析基于Matlab 2014和 SPSS 19.0實現。
選定4種白酒樣品為試驗材料,分別為瀘州老窖頭曲、綿竹頭曲3號、綿竹頭曲6號、一滴醇醇錦。它們分屬3個品牌,其中綿竹頭曲品牌包含質量等級相近的2種樣品,提高了電子鼻鑒別的難度,更適宜于檢驗空載條件下提出的漂移去除方法的有效性。4種樣品分別用LZLJ、MZ3H、MZ6H、YDCJ標識,基本信息見表1。另外,由預試驗可知,14個氣敏傳感器對4種白酒樣品均能產生不同程度響應的氣敏信號,因此該電子鼻的氣敏信號可用來表征樣品間的差異。

表1 白酒樣品的基本信息Tab.1 Basic information of white spirit samples
電子鼻空載條件下的測試信號,是電子鼻在沒有樣品下對測量室環境的響應信息。每天隨機測試4次(相當于測試4個空載樣本),取它們的平均值作為當天的空載數據。采用動態測量,數據采集間隔設為1 s,每個空載樣本采集1 000個數據。由于電子鼻漂移是時變信號,故空載試驗從2016年11月開始,到2017年2月止,共4個月,總計測量了188個空載樣本數據。期間,4種白酒樣品的測試也同時進行,與空載測量隔天交替實施。4種白酒在測量日均隨機取樣,以避免產生樣本測試結果的鏈式現象。
在白酒測量時,樣本測量前傳感器陣列先進行空采,以獲得各傳感器基準電壓,空采時間為20 s。然后進行樣本動態測量,動態采集時間為1 000 s。樣本取樣量為5 mL并置于蒸發皿中,然后將蒸發皿迅速放置于電子鼻的測量室內進行測量。測量結束后對各氣敏傳感器進行復原960 s,使各傳感器恢復到基準狀態,以便下一個白酒樣本的測量。每個白酒樣本動態測量時,數據采集間隔仍設為1 s,這樣每個樣本也采集1 000個數據。另外,在每個樣本測量過程中,一并測試測量室的溫、濕度信息。4個月內,每種樣品各測試47個樣本。對于每個樣本,均采用傳感器響應值減去對應的基準值作為該樣本的測試結果,以部分減小環境溫、濕度的影響,稱此方法為去基準處理[17]。在后續的分析中,所用的白酒數據均是去基準后的數據。
為了描述有載樣本、空載樣本在測試期間的漂移現象,對每個樣本(空載或有載樣本)用第1 000秒的測試值來表征該樣本。圖1給出了TGS832對綿竹頭曲6號樣品在4個月內測量結果的變化情況。圖2給出了4個月中TGS832空載數據的變化情況。

圖2 TGS832空載數據的變化描述Fig.2 Changing representation of no-load data from TGS832
由圖1和圖2可知,TGS832在空載下的漂移趨勢與有載樣本下的漂移趨勢基本一致,僅信號強度有明顯的不同。這說明了漂移是氣敏傳感器的固有行為。因此,在空載條件下進行漂移去除方法研究是必需的。
受文獻[16]的啟發,采用小波包分解系數研究漂移機制,以此給出漂移閾值的構建方法和去漂移方法。
對信號進行小波包分解時,首先得到相同頻寬的低頻信號和高頻信號;再一次分解時,又把低頻信號分解為兩個同樣頻寬的低頻、高頻部分,而高頻部分也同樣分解為高、低兩部分;依次類推[18]。
小波基函數的選擇是實施小波包分解的重要環節。Symlet小波是由Daubechies提出的一種近似對稱的小波基函數,它是對Daubechies (db)小波的一種改進,不僅具有db小波的優點,還具有對稱性,從而避免在信號分解或重構時信號失真,是一種性能優良的小波。所以選擇四階 Symlet小波作為基函數。另外,當小波包分解尺度增大,一些有用的信息可能會丟失,結合模擬計算試驗,選取三尺度分解。由于漂移是一種緩慢變化的時變信息,屬低頻信號,隱藏于低頻系數集中。所以,將低頻的逼近系數集作為分析對象。
圖3給出了1個空載樣本信號經四階 Symlet小波進行三尺度分解后低頻系數集中第131頻點下的系數變化規律,可以看出,它與圖1、2給出的變換情況相一致,這又進一步說明了用空載樣本的分解系數來研究漂移分離方法是合適的。

圖3 TGS832空載數據小波包分解系數的變化描述Fig.3 Changing representation based on no-load wavelet packet coefficients of TGS832 signals
電子鼻測試信號經小波包分解后得到一系列的分解系數,因氣敏信號與漂移信號分屬不同類別的信息,所以對應于不同的分解系數。由于漂移是由傳感器老化、環境波動等因素造成的一種復雜現象,不僅表現出長期緩慢的漂移現象,還存在環境波動造成傳感器信號的即時變化,這種即時變化也可認為是一種“即時漂移”。理論上,在測量對象不變的情況下,氣敏傳感器的測試結果應在某一范圍內波動。但是,因漂移(包括即時漂移)的存在,使測試結果往往超出該變動范圍,那么超出變動范圍之外的漂移就應被剔除。同樣,信號的小波包分解系數也需此種處理。所以,對空載條件下氣敏傳感器信號的小波包分解系數,可通過構建閾值函數來分離漂移系數。由此可給出如下的空載信號閾值分離函數:
空載樣本下閾值函數
αi1=ci-θi
(1)
空載樣本上閾值函數
αi2=ci+θi
(2)
式中ci——所測空載樣本在第i個小波包分解頻點下分解系數的均值
θi——所測空載樣本在第i個小波包分解頻點下分解系數的標準差
上述閾值函數解釋了空載條件下氣敏傳感器測試信號的限定范圍,即小于αi1或大于αi2均認為是漂移類信號,應剔除。然而,由于氣敏傳感器是利用氧化還原反應來實現氣味(體)測量的,當測量有載樣本時,測量信號受樣本揮發物、環境因素、老化程度等多因素交織影響,導致漂移信號的表現強度會出現變化。根據圖1~3所揭示漂移規律的一致性(相近性),分析認為,可對式(1)、(2)給出的閾值函數進行修正獲得有載樣本的閾值函數。
有載樣本下閾值函數
li1=miαi1
(3)
有載樣本上閾值函數
li2=miαi2
(4)
式中mi——調節系數
當有載樣本的閾值函數確定后,便可給出有載樣本小波包分解系數的校正公式
(5)
式中wij——第i個小波包分解頻點下第j個有載樣本的分解系數

在上述校正計算中,調節系數mi的確定非常重要。考慮到有載樣本與空載樣本氣敏傳感器響應強度的差別,經過反復計算試驗,mi計算公式為
(6)
式中wi——第i個小波分解頻點下的對應空采期間內待分析有載樣本分解系數的均值
上述小波包系數閾值處理思想是:在同一測試期間內,空載樣本信號分解系數的閾值經過調節放大后得到有載樣本的閾值,與直接分析有載樣本的分解系數相比更能真實地反映氣敏傳感器本身的漂移規律。對于有載樣本,當小波包分解系數在閾值范圍內時,傳感器采集信號體現了氣敏信息,分解系數不處理;當其超出該頻點下的閾值范圍時,認為包含了漂移信息,用臨近的閾值代替。這樣做的目的是,不僅保留了該頻點下真實信號的特征(不會與真實信號有明顯差異),還在一定程度上去除了漂移,而且還可保障重構信號的光滑性。
電子鼻漂移剔除方法描述如下:對空載樣本和有載樣本信號運用四階 Symlet小波函數進行三尺度小波包分解,分別得到相應的逼近系數集(低頻系數集);根據式(1)和(2)得到空載樣本的小波系數閾值;根據式(3)、(4)和(6)得到有載樣本小波包系數閾值;按式(5)對有載樣本的小波包分解系數進行校正,得到校正系數;對校正系數進行小波包分解逆變換,得到有載樣本的重構信號。
另外,考慮到漂移與環境影響的時變性,以及統計計算的可操作性,在上述步驟實施中,采用以每個月的測量樣本為處理單元,分別按月實施樣本信號的校正處理,以確保信號不會出現過度校正,防止校正信號出現失真現象。
由于電子鼻中每個傳感器產生的漂移信號各不相同,從空載條件下尋找漂移閾值應對各個傳感器分別處理;又由于每一種白酒樣品存在差異,響應信號強度不同,因此,每一種樣品的數據也分別處理。以MZ6H樣品為例,按照上述去漂移方法分別對每個傳感器的測量樣本數據進行處理,可得到14個氣敏傳感器對應于MZ6H樣品的重構信號。
圖4給出了TGS832測試結果經去漂移后的信號變化情況。從圖中可以看出,漂移現象明顯減小,試驗期間樣本測試結果的變化也變得相對平緩。

圖4 TGS832對綿竹頭曲6號樣本去漂移后的變化描述Fig.4 Changing representation of TGS832 after drift elimination to MZ6H samples
電子鼻信號的特征提取是其檢測過程中的必要環節。在進行鑒別分析時,特征選擇對鑒別結果有著很大的影響。文獻[19]指出,積分值(INV)特征體現了傳感器對樣本的總體響應情況。因此,選擇該特征參量作為電子鼻信號的表征量。積分值特征計算公式為
(7)
式中S——積分值N——數據個數,取1 000xi——1個傳感器對1個樣本的第i個采集值或重構值
Δt——相鄰兩采樣點的時間間隔,取1 s
另外,為了進一步補償環境溫、濕度的影響,把每個樣本測試過程中對應的溫、濕度積分值也分別作為模式識別系統的輸入值,起到基于模型的補償作用。
在進行鑒別分析時,選擇常用的Fisher判別分析(Fisher discriminant analysis,FDA)和BP神經網絡兩種方法。
3.2.1 Fisher判別分析
3.2.1.1 基于SPSS19.0平臺
分別對4種有載樣品去漂移前、后的電子鼻信號積分值特征矩陣進行FDA分析,結果如圖5所示。

圖5 去漂移前后的FDA鑒別結果Fig.5 FDA results of features before and after drift elimination
由圖5a可以看出,在數據去漂移前,4種酒的鑒別效果都不理想,4種樣品之間重疊現象比較嚴重,它們的鑒別正確率只有58.0%,交叉驗證率僅為38.8%。
由圖5b可以看出,通過去漂移算法處理之后,3類樣品都能很好地區分,尤其同一類的兩種樣品也能得到不錯的分離,鑒別正確率達到95.20%,交叉驗證率也達到了93.6%。
此FDA結果表明,該去漂移方法是有效的,極大地提高了4種樣本的鑒別正確率。

圖6 去漂移前訓練集與測試集FDA結果Fig.6 FDA results of training set and test set before drift elimination
但此方法存在不足之處,首先它的分類模式是整體分類,按“留一法”進行交叉驗證,不具有用先驗信息建立的鑒別模型實現對后續樣本鑒別的功能。因此,基于交叉驗證的FDA結果不能真正反映去漂移方法的有效性。在實際應用中,往往需要用前階段的樣本數據進行建模,并用所建的模型完成對后期樣本數據的鑒別預測。因此,應將測試樣本按測試時間先后順序分為訓練集和測試集。為了實現這一目的,實驗室根據FDA原理在Matlab r2014a平臺上構建了適用于用訓練集樣本的鑒別模型來判別測試集樣本的FDA程序。
3.2.1.2 基于具有測試集判別功能
分別從每種白酒樣品47個樣本中按測試時間先后順序選取前37個樣本來構造訓練集,共148個樣本,其余后期測量的10個樣本形成測試集,共40個樣本。基于這種數據集的模型構造方法,可揭示用先驗數據構建的鑒別模型對未來樣本的鑒別能力。
圖6給出了基于此FDA方法的訓練集、測試集去漂移前的鑒別結果。由圖6可以看出,在數據去漂移前,4種酒的鑒別效果都不理想,4種樣品之間重疊現象比較嚴重,訓練集的分類正確率只有54.73%,測試集為37.50%。

圖7 去漂移后訓練集與測試集FDA結果Fig.7 FDA results of training set and test set after drift elimination
圖7給出了基于此FDA方法的訓練集、測試集去漂移后的鑒別結果。由圖7可以看出,通過去漂移處理之后,4種樣品分類效果仍不理想,但與去漂移前相比,訓練集的分類正確率提高到78.38%,比去漂移前提高了23.65%,測試集也提高到65.00%。鑒別正確率的明顯提高表明該去漂移方法是有效的。鑒別正確率不高是因為4種樣品屬于復雜的分類問題,線性FDA鑒別方法不能較好地解決此類問題,為此嘗試了非線性的BP神經網絡分類方法。
3.2.2 基于BP神經網絡鑒別分析
為了進一步檢驗漂移去除方法的有效性,采用了BP神經網絡[20]對4種樣品進行鑒別分析。訓練集和測試集的構造同3.2.1.2節。
選用輸入層、中間層(隱層)和輸出層3層BP神經網絡進行模型構建。由于神經網絡的輸入為16個傳感器的特征值(包含溫、濕度傳感器信號積分值),輸出為4種白酒樣品,所以神經網絡輸入層神經元個數為16,輸出層神經元個數為4。當輸入層神經元傳遞函數選為直接傳遞的線性函數、隱層神經元傳遞函數選為 sigmoid函數、輸出層神經元傳遞函數選為 logsig函數、訓練函數選為 trainscg函數時,運用訓練集數據訓練神經網絡,學習效率設為0.001,訓練精度設為0.000 005,最大迭代次數為10 000,并通過試湊法確定了隱層神經元個數為22時,訓練效果較好。因此,該BP神經網絡的結構為
16×22×4。
用該網絡對樣本數據進行分類,結果顯示:訓練集的鑒別正確率由去漂移前的65.5%提高到去漂移后的100%,去漂移后測試集的正確率則達到了97.5%。其中,除了1個MZ3H樣本被錯分為MZ6H外,其余樣本完全可以得到正確鑒別。這是由于2種同類樣本酒的品質接近而不易區分造成的。測試集樣本神經網絡的鑒別結果充分說明了所提出的漂移去除方法是有效的。
漂移是電子鼻的固有行為。漂移的存在,使電子鼻的穩健鑒別能力得不到保證。針對這一問題,從空載角度出發,提出了一種電子鼻去除漂移方法。應用此方法對4種白酒樣品在4個月內的電子鼻信號進行了處理,并分別通過兩種鑒別方法進行了驗證。FDA的分析結果顯示,樣品處理后的鑒別正確率均有明顯提高,最低提高值為23.65%;BP神經網絡的訓練集鑒別正確率由處理前的65.5%提高到處理后的100%,處理后測試集的鑒別正確率也達到了97.5%。兩種鑒別方法的鑒別結果表明,該漂移去除方法顯著提升了電子鼻系統的鑒別能力,說明該方法是有效的。
1 GHASEMIVARNAMKHASTI M, MOHTASEBI S S, RODRIGUEZMENDE M L, et al. Potential application of electronic nose technology in brewery [J]. Trends in Food Science & Technology, 2011, 22(4): 165-174.
2 LOUTFI A, CORADESCHI S, MANI G K, et al. Electronic noses for food quality: a review [J]. Journal of Food Engineering, 2014, 144(144): 103-111.
3 HONG X, WANG J, HAI Z. Discrimination and prediction of multiple beef freshness indexes based on electronic nose [J]. Sensors & Actuators B Chemical, 2012, 161(1): 381-389.
4 HOLMBERG M, WINQUIST F, LUNDSTR?M I, et al. Drift counteraction for an electronic nose [J]. Sensors & Actuators B Chemical, 1996, 36(1-3): 528-535.
5 PADILLA M, PERERA A, MONTOLIU I, et al. Drift compensation of gas sensor array data by orthogonal signal correction [J]. Chemometrics & Intelligent Laboratory Systems, 2010, 99(1): 28-35.
6 ZUPPA M, DISTANTE C, SICILIANO P, et al. Drift counteraction with multiple self-organising maps for an electronic nose [J]. Sensors & Actuators B Chemical, 2004, 98(2-3): 305-317.
7 ZHANG L, TIAN F, LIU S, et al. Chaotic time series prediction of E-nose sensor drift in embedded phase space [J]. Sensors & Actuators B Chemical, 2013, 182(1): 71-79.
8 ZHANG L, ZHANG D. Domain adaptation extreme learning machines for drift compensation in E-Nose systems [J]. IEEE Transactions on Instrumentation & Measurement, 2015, 64(7): 1790-1801.
9 ZIYATDINOV A, MARCO S, CHAUDRY A, et al. Drift compensation of gas sensor array data by common principal component analysis [J]. Sensors and Actuators B Chemical, 2010, 146(2): 460-465.
10 殷勇, 吳文凱, 于慧春. 獨立分量分析融合小波能量閾值的電子鼻信號去漂移方法[J]. 農業工程學報, 2014, 30(24):325-331. YIN Yong, WU Wenkai, YU Huichun. Drift elimination method of electronic nose signals based on independent component analysis coupled with wavelet energy threshold value[J].Transactions of the CSAE, 2014,30(24):325-331. (in Chinese)
11 王虎玄, 胡仲秋, 龍芳羽,等. 蘋果汁中魯氏接合酵母早期污染的電子鼻識別研究[J/OL]. 農業機械學報, 2016, 47(1): 209-214. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20160127.DOI:10.6041/j.issn.1000-1298.2016.01.027. WANG Huxuan, HU Zhongqiu, LONG Fangyu, et al. Research on identification of spoilage in apple juice caused byZygosaccharomycesrouxiiat early stage using electronic nose[J/OL].Transactions of the Chinese Society for Agricultural Machinery, 2016, 47 (1): 209-214. (in Chinese)
12 GüNEY S, ATASOY A. Multiclass classification of n-butanol concentrations with k-nearest neighbor algorithm and support vector machine in an electronic nose [J]. Sensors & Actuators B Chemical, 2012,166-167(2): 721-725.
13 趙望達, 劉勇求, 賀毅. 基于RBF神經網絡提高壓力傳感器精度的新方法[J]. 傳感技術學報, 2004, 17(4):640-642. ZHAO Wangda, LIU Yongqiu, HE Yi. A new method to improve pressure sensor precision based on RBF neural network[J]. Journal of Transcluction Technology, 2004, 17(4):640-642. (in Chinese)
14 FU J, LI G, QIN Y, et al. A pattern recognition method for electronic noses based on an olfactory neural network [J]. Sensors & Actuators B Chemical, 2007, 125(2): 489-497.
15 劉濤, 黃智勇. 一種基于多重自組織圖的電子鼻漂移抑制方法[J]. 儀器儀表學報, 2012, 33(6): 1287-1292. LIU Tao, HUANG Zhiyong. Drift counteraction method for electronic nose based on multiple self-organizing maps [J]. Chinese Journal of Scientific Instrument, 2012,33(6): 1287-1292. (in Chinese)
16 楊波, 夏虹, 張曉玉. 基于自適應閾值的小波包在松動部件信噪分離中的研究[J]. 原子能科學技術, 2014, 48(11): 2045-2050. YANG Bo, XIA Hong, ZHANG Xiaoyu. Research on signal-noise separation in loose parts impact signal based on autonomous adaptive threshold wavelet packets [J]. Atomic Energy Science and Technology, 2014, 48(11):2045-2050. (in Chinese)
17 劉瑜. 基于電子鼻的氣體等級鑒別[D]. 重慶:重慶大學, 2006.
18 YE Z, WU B, SADEGHIAN A. Current signature analysis of induction motor mechanical faults by wavelet packet decomposition [J]. IEEE Transactions on Industrial Electronics, 2003, 50(6): 1217-1228.
19 于慧春, 褚冰, 殷勇. 食醋電子鼻檢測中一種特征參量評價方法[J]. 農業工程學報, 2013, 29(3): 258-264. YU Huichun, CHU Bing, YIN Yong. Evaluation method of feature vector in vinegar identification by electronic nose[J].Transactions of the CSAE,2013,29(3):258-264. (in Chinese)
20 DING S, SU C, YU J. An optimizing BP neural network algorithm based on genetic algorithm [J]. Artificial Intelligence Review, 2011, 36(2): 153-162.