劉偉玲 吳龍焦 張思祥 閆子琪



摘? 要: 為了評(píng)估惡臭對(duì)人類和環(huán)境的影響,需要有效鑒別出惡臭成分,設(shè)計(jì)并研發(fā)了以傳感器陣列為核心的在線檢測(cè)惡臭成分的電子鼻系統(tǒng)。針對(duì)傳感器響應(yīng)曲線幾何特征提取方式的不足,提出分段擬合曲線的方式進(jìn)行特征值提取。采用主成分分析(PCA)和線性判別分析(LDA)兩種降維方式對(duì)原始數(shù)據(jù)降維,并結(jié)合支持向量機(jī)(SVM)和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類識(shí)別。結(jié)果表明,SVM和BP神經(jīng)網(wǎng)絡(luò)結(jié)合LDA都能100%識(shí)別出三種惡臭物質(zhì),SVM結(jié)合PCA識(shí)別率為92%,BP神經(jīng)網(wǎng)絡(luò)結(jié)合PCA識(shí)別率為94%。
關(guān)鍵詞: 電子鼻系統(tǒng); 氣體識(shí)別; 特征值提取; 特征降維; 氣體分類; 在線檢測(cè)
中圖分類號(hào): TN98?34; TP212.9? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)06?0057?04
Research on mixed gas recognition based on electronic nose technology
LIU Weiling , WU Longjiao, ZHANG Sixiang, YAN Ziqi
( School of Mechanical Engineering, Hebei University of Technology, Tianjin 300130, China)
Abstract: In order to evaluate the impact of foul smell on human?beings and environment, it is necessary to effectively identify foul smell′s components. An electronic nose system with sensor array as its core for the online detection of foul smell′s components is designed and developed. As for the insufficiency of the geometric feature extraction method of sensor response curve, the method of segment fitting curve is proposed to extract feature values. The principal component analysis (PCA) and linear discriminant analysis (LDA) are used for the dimension reduction of original data, and the support vector machine (SVM) and BP neural network are combined with them for the classification and identification. The results show that both SVM and BP neural network combined with LDA can recognize three kinds of foul smell substances in 100%, the recognition rate of SVM combined with PCA is 92%, and the recognition rate of BP neural network combined with PCA is 94%.
Keywords: electronic nose system; gas identification; feature value extraction; feature dimension reduction; oder classification; only detection
0? 引? 言
隨著我國現(xiàn)代工業(yè)的迅猛發(fā)展,經(jīng)濟(jì)增長的同時(shí)也帶來了巨大的環(huán)境污染問題。惡臭作為一種環(huán)境污染,已經(jīng)成為當(dāng)今世界七大公害之一[1]。惡臭物質(zhì)對(duì)人體消化系統(tǒng)、呼吸系統(tǒng)和神經(jīng)系統(tǒng)都會(huì)造成不同程度的損害,嚴(yán)重危害人類身心健康。惡臭物質(zhì)成分不同,對(duì)人類造成的影響也不同。有效鑒別惡臭成分是治理惡臭和評(píng)價(jià)惡臭對(duì)人類影響的一個(gè)重要環(huán)節(jié)。因此,研究一款能夠智能鑒別惡臭成分的檢測(cè)系統(tǒng)具有重要意義。
電子鼻是模仿生物鼻的一種人工嗅覺系統(tǒng),它能夠快速、準(zhǔn)確獲取氣味特征,并根據(jù)這些特征準(zhǔn)確鑒別不同氣味的成分。與常規(guī)儀器分析法相比,電子鼻采樣時(shí)間和分析時(shí)間短,對(duì)復(fù)合惡臭物質(zhì)能實(shí)現(xiàn)有效鑒別。目前,電子鼻廣泛應(yīng)用于食品[2]、農(nóng)產(chǎn)品[3]、環(huán)境監(jiān)測(cè)[4]、安全[5]等領(lǐng)域。
1? 電子鼻系統(tǒng)與數(shù)據(jù)獲取
1.1? 電子鼻系統(tǒng)
電子鼻系統(tǒng)檢測(cè)裝置示意圖如圖1所示,電子鼻系統(tǒng)主要由氣體傳感器陣列、數(shù)據(jù)采集電路、數(shù)據(jù)處理軟件組成。傳感器陣列由2個(gè)金屬氧化傳感器(日本費(fèi)加羅公司:TGS2600,TGS2602)和2個(gè)光離子氣體傳感器(英國阿爾法公司:PID?A1,PID?AH)構(gòu)成。數(shù)據(jù)采集電路的核心是MSC1210Y5,將傳感器采集到的電壓信號(hào)轉(zhuǎn)換為24 bit 數(shù)字信號(hào),通過RS 485總線傳送給上位機(jī)(PC),經(jīng)LabVIEW進(jìn)行數(shù)據(jù)顯示和存儲(chǔ),通過Matlab進(jìn)行模式識(shí)別。
1.2? 數(shù)據(jù)獲取
在開始測(cè)試前,先對(duì)傳感器陣列通電進(jìn)行預(yù)熱,同時(shí)通入清潔空氣清洗傳感器陣列。實(shí)驗(yàn)包括三個(gè)過程:基線過程,先通入50 s清潔空氣清洗氣室,使傳感器基線達(dá)到穩(wěn)定狀態(tài);采樣過程,通入采樣氣體50 s,獲取傳感器的響應(yīng)值并記錄,采樣頻率為10 Hz;清洗過程,最后通入清潔空氣清洗氣室100 s,使傳感器恢復(fù)到初始狀態(tài),等候下一次測(cè)量。實(shí)驗(yàn)數(shù)據(jù)的獲取是通過循環(huán)這三個(gè)過程得到。
本文針對(duì)三種惡臭氣體:甲硫醚(C2H6S)、乙酸乙酯(C2H2O8)以及這兩種氣體的混合氣體進(jìn)行分析。甲硫醚和乙酸乙酯各取8種濃度,混氣取9種濃度。甲硫醚(1 ppm,2 ppm,3 ppm,5 ppm,10 ppm,15 ppm,20 ppm,25 ppm),乙酸乙酯(1 ppm,2 ppm,5 ppm,10 ppm,15 ppm,20 ppm,30 ppm,40 ppm)。將甲硫醚和乙酸乙酯分別按照5 ppm,10 ppm,20 ppm的比例進(jìn)行兩兩混合得到9種混合氣體。
2? 特征值提取
目前,大部分研究是直接對(duì)傳感器響應(yīng)原始曲線的幾何形狀進(jìn)行特征提取,如梁子躍提取曲線的面積、穩(wěn)態(tài)值、均值、恢復(fù)時(shí)間、某時(shí)刻的響應(yīng)值作為特征值[6],徐克明提取曲線的平均微分值、穩(wěn)定值、面積值作為特征參數(shù)[7]。該方法的優(yōu)點(diǎn)是簡單、直觀,但是該方法的缺點(diǎn)是易受外界環(huán)境干擾,若采樣過程中發(fā)生震動(dòng)、溫度變化時(shí),提取的幾何特征則不能精確反映樣本信息。
基于上述缺點(diǎn),本文提出了分段擬合曲線的方式進(jìn)行特征提取,將擬合參數(shù)作為特征值。
傳感器響應(yīng)曲線分為兩個(gè)階段:反應(yīng)階段和恢復(fù)階段。如圖2所示,Ⅰ為反應(yīng)階段,Ⅱ?yàn)榛謴?fù)階段。
反應(yīng)階段Ⅰ可簡化為圖3所示曲線,反應(yīng)階段等效為矩形虛線所示的階躍。
式中,A表示傳感器的反應(yīng)量。
傳感器響應(yīng)為一階線性模型,傳遞函數(shù)為:
式中,[τ]表示傳感器的時(shí)間常數(shù),不同類型的傳感器[τ]不同,同一類型傳感器對(duì)不同類型氣體響應(yīng)的[τ]也不同。
對(duì)式(1)進(jìn)行Laplace變換:
s域表達(dá)式為:
對(duì)式(4)進(jìn)行Laplace逆變換:
通過式(5)建立傳感器信號(hào)的響應(yīng)模型,提取反應(yīng)量A和反應(yīng)速率1/[τ]兩個(gè)特征值。
對(duì)于恢復(fù)階段Ⅱ,先對(duì)A/D數(shù)字量取相反數(shù),使之變?yōu)橥磻?yīng)階段一樣的上升趨勢(shì)模型,再通過式(5)提取反應(yīng)量和速率作為特征值。因此,對(duì)于一個(gè)傳感器響應(yīng)曲線,共提取4個(gè)特征值。
3? 特征降維
本文共提取4個(gè)特征值,若同時(shí)將它們作為模式識(shí)別的輸入,則會(huì)造成“數(shù)據(jù)冗余”和“維數(shù)災(zāi)難”問題[8],使得數(shù)據(jù)量過于龐大而難以處理。解決“數(shù)據(jù)冗余”和“維數(shù)災(zāi)難”的一個(gè)重要途徑是將高維特征空間中的數(shù)據(jù)投影到低維空間中,通過降維對(duì)原始數(shù)據(jù)進(jìn)行有效的信息提取和壓縮。
本文采用PCA和LDA兩種方式進(jìn)行數(shù)據(jù)降維,并將降維后的數(shù)據(jù)作為模式識(shí)別的輸入。圖4為三種氣體降維后的PCA和LDA分布圖。
一般認(rèn)為主成分累計(jì)方差貢獻(xiàn)率達(dá)到85%以上時(shí)即可認(rèn)為保留了大部分原始信息[9]。由圖4可知,PCA分布圖中,3種氣體線性不可分,而LDA能夠很明顯地區(qū)分三種氣體。說明采用LDA的識(shí)別效果優(yōu)于PCA。
4? 基于SVM和BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)氣體分類
本系統(tǒng)采用SVM和BP神經(jīng)網(wǎng)絡(luò)結(jié)合不同降維方式對(duì)三種氣體進(jìn)行分類識(shí)別,并通過識(shí)別率(正確分類的樣本個(gè)數(shù)與所有樣本總個(gè)數(shù)的比值)判定優(yōu)劣,識(shí)別率越高表明分類效果越好,反之,分類效果越差。相同成分不同濃度的氣體進(jìn)行20次平行試驗(yàn),從中隨機(jī)抽取16個(gè)樣本數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),剩下的4個(gè)樣本作為測(cè)試數(shù)據(jù)用于后期樣本預(yù)測(cè)數(shù)據(jù),因此訓(xùn)練數(shù)據(jù)共有400個(gè),測(cè)試數(shù)據(jù)共有100個(gè)。
4.1? 支持向量機(jī)實(shí)現(xiàn)氣體分類
支持向量機(jī)是基于統(tǒng)計(jì)學(xué)習(xí)方法,尋找一個(gè)最優(yōu)超平面作為高維空間中的決策函數(shù),實(shí)現(xiàn)不同類別的樣本區(qū)分,同時(shí)滿足分類間隔最大[10]。影響SVM模型的主要參數(shù)是懲罰參數(shù)[c]和核函數(shù)參數(shù)[g],確定好核函數(shù)后,通過交叉驗(yàn)證法和網(wǎng)格搜索法對(duì)懲罰參數(shù)進(jìn)行尋優(yōu)。常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、Sigmoid內(nèi)核、徑向基函數(shù)(RBF)。RBF是全局收斂的學(xué)習(xí)算法,具有學(xué)習(xí)速度快的優(yōu)點(diǎn),是使用最多的核函數(shù),因此本文采用RBF作為核函數(shù)。SVM識(shí)別流程圖如圖5所示,表1為基于不同降維方式的SVM分類結(jié)果。
表1表明,基于LDA的SVM模式識(shí)別方法具有最高的識(shí)別精度,能夠100%地識(shí)別出氣體類別,說明LDA+SVM分類器分類效果最優(yōu)。
4.2? BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)氣體分類
BP神經(jīng)網(wǎng)絡(luò)關(guān)鍵是確定各層神經(jīng)元個(gè)數(shù)和傳遞函數(shù)。輸入層神經(jīng)元的個(gè)數(shù)是根據(jù)分析數(shù)據(jù)種類確定,輸入層神經(jīng)元個(gè)數(shù)為2或16;輸出層神經(jīng)元的個(gè)數(shù)是根據(jù)識(shí)別氣體的類別個(gè)數(shù)來確定,在本系統(tǒng)中氣體類別數(shù)為3,那么輸出層神經(jīng)元個(gè)數(shù)為3;隱含層神經(jīng)元的個(gè)數(shù)可通過改變隱含層神經(jīng)元個(gè)數(shù),觀察BP神經(jīng)網(wǎng)絡(luò)性能確定。選擇Logsig作為隱含層神經(jīng)元的傳遞函數(shù),Sigmoid作為輸出層傳遞函數(shù)。圖6為BP神經(jīng)網(wǎng)絡(luò)分類識(shí)別流程圖。
BP神經(jīng)網(wǎng)絡(luò)期望輸出是0或1,輸出為0表示不含該氣體,輸出為1表示含有該氣體。然而由于分類前的數(shù)據(jù)經(jīng)過歸一化處理,實(shí)際輸出數(shù)據(jù)并不是整數(shù)0或1,而是[0,1]之間的某個(gè)數(shù)。本文規(guī)定:將實(shí)際輸出值大于0.8以上的數(shù)判定為1,小于0.1以下的判定為0。BP神經(jīng)網(wǎng)絡(luò)輸出3種不同類別的氣體,用[y1,y2,y3]表示,期望輸出為:
需識(shí)別出甲硫醚,則需同時(shí)滿足下列條件:
表2為基于不同降維方式的BP神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果。
由表2可知,直接用原始數(shù)據(jù)作為BP的輸入和LDA降維后的數(shù)據(jù)作為BP的輸入,識(shí)別率都能達(dá)到100%,PCA降維后的數(shù)據(jù)作為BP的輸入識(shí)別率為94%。表3為LDA結(jié)合BP神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果。
由表3可知,SVM和BP神經(jīng)網(wǎng)絡(luò)結(jié)合LDA識(shí)別效果優(yōu)于SVM和BP神經(jīng)網(wǎng)絡(luò)結(jié)合PCA,雖然直接將原始數(shù)據(jù)作為BP的輸入也能達(dá)到100%,但是采用LDA降維后的數(shù)據(jù)作為輸入可以減小數(shù)據(jù)量,降低計(jì)算難度,同時(shí)保證分類正確。
5? 結(jié)? 論
本文基于分段擬合曲線的方法對(duì)傳感器響應(yīng)曲線進(jìn)行特征提取,利用SVM和BP神經(jīng)網(wǎng)絡(luò)結(jié)合PCA/LDA檢測(cè)混合氣體。實(shí)驗(yàn)結(jié)果表明,本系統(tǒng)能夠準(zhǔn)確區(qū)分三種氣體,SVM和BP神經(jīng)網(wǎng)絡(luò)結(jié)合LDA識(shí)別率可高達(dá)100%。以后,可以對(duì)該系統(tǒng)進(jìn)一步優(yōu)化設(shè)計(jì),建立更加全面的數(shù)據(jù)庫,實(shí)現(xiàn)對(duì)不同惡臭氣體的類別檢測(cè)。
參考文獻(xiàn)
[1] 姬亞芹,陳麗,宮慶超,等.惡臭排放規(guī)律及其采樣和分析方法[J].中國環(huán)境監(jiān)測(cè),2013(3):137?143.
[2] 張謙益,包李林,熊巍林,等.電子鼻在兩種類型濃香菜籽油識(shí)別中的應(yīng)用[J].中國油脂,2018,43(10):144?146.
[3] 黃星奕,孫兆燕,田瀟瑜,等.基于電子鼻技術(shù)的馬鈴薯真菌性腐爛病早期檢測(cè)[J].食品工業(yè)科技,2018,39(24):97?101.
[4] 張嘉琪,冀大選,李杰一,等.基于LabVIEW平臺(tái)的電子鼻系統(tǒng)設(shè)計(jì)[J].傳感器與微系統(tǒng),2015,34(5):92?94.
[5] 趙野.基于電子鼻的早期電氣火災(zāi)探測(cè)技術(shù)研究[D].武漢:華中科技大學(xué),2014.
[6] 梁子躍,楊昊,黃燦燦,等.電子鼻的混合氣體分類研究[J].中國計(jì)量大學(xué)學(xué)報(bào),2017,28(3):388?393.
[7] 徐克明,王俊,鄧凡霏,等.用于山核桃陳化時(shí)間檢測(cè)的電子鼻傳感器陣列優(yōu)化[J].農(nóng)業(yè)工程報(bào),2017,33(3):281?287.
[8] 韋彩虹.基于電子鼻系統(tǒng)的混合氣體的定性分析和定量估計(jì)[D].杭州:浙江大學(xué),2012.
[9] PHILIP R C N, PAUL A T, JOHN F M. Missing methods in PCA and PLS: score calculations data with incomplete observations [J]. Chemometrics and intelligent laboratory systems, 1996, 35(1): 45?65.
[10] 鄒小波,趙杰文.支持向量機(jī)在電子鼻區(qū)分不同品種蘋果中的應(yīng)用[J].農(nóng)業(yè)工程學(xué)報(bào),2007(1):146?149.
[11] JHA S K, HAYASHI K. A novel odor filtering and sensing system combined with regression analysis for chemical vapor quantification [J]. Sensors and actuators B: chemical, 2014, 200: 269?287.