周紅標,張新榮,耿忠華
淮陰工學院 電子與電氣工程學院,江蘇 淮安 223003
基于遺傳小波神經網絡的白酒識別電子鼻
周紅標,張新榮,耿忠華
淮陰工學院 電子與電氣工程學院,江蘇 淮安 223003
白酒是中國特有的一種蒸餾酒,其由淀粉或糖質原料制成酒醅或發酵醪經蒸餾而得。酒質無色透明,氣味芳香純正,入口綿甜爽凈,酒精含量較高,經貯存老熟后,具有以酯類為主體的復合香味。目前,白酒的識別主要是通過感官評定和化學分析法檢測[1]。感官評定是評酒員憑眼觀、嘴品、鼻子聞等感官手段對酒體進行評價;化學分析法主要是利用色譜儀、光譜儀和毛細管電泳儀等快速檢測出白酒的主體成分構成。顯而易見,感官評定容易受到評酒員身體狀況、情緒及評酒環境的影響,化學方法只分析主體成分,對復雜酒體構成缺乏整體反映。
電子鼻是一種分析、識別和檢測復雜嗅味和揮發性成分的人工嗅覺系統,其得到的不是被測樣品中某種或某幾種成分的定性與定量結果,而是樣品中揮發性成分的整體信息[2]。電子鼻的模式識別單元主要是對氣味信息及其特征建立相應的數學模型,以達到對樣品氣味的全面分類,主要有統計模式識別和人工神經網絡方法[3-4]。前者所建模型都是采用線性判別方法,與電子鼻氣味數據非線性的本質不相符;后者較為典型的是BP神經網絡,由于其結構簡單、非線性處理能力強,應用較為廣泛。但BP神經網絡存在容易陷入局部極小和收斂速度慢等缺點,限制了它進一步的應用[5]。小波神經網絡(Wavelet Neural Networks,WNN)是建立在小波理論基礎之上的一種新型神經網絡模型,它兼具小波分析和神經網絡的優點,具有更強的非線性處理能力。但盡管如此,小波神經網絡的BP算法并沒改變,依然存在BP算法固有的缺點[6]。因此,本文提出了遺傳小波神經網絡,通過遺傳算法獲得小波神經網絡的最優初始化參數,將遺傳小波神經網絡應用于白酒識別電子鼻,對四種白酒樣品的5路傳感器采集的氣味數據進行處理,取得了令人滿意的識別效果。
1.1 小波神經網絡
小波是一種長度有限、平均值為0的波形,小波函數是由一個母小波函數經過平移和尺度伸縮得到,小波變換是指把某一基本小波函數φ(t)平移τ后再在不同尺度a下與待分析信號x(t)做內積:

等效的時域表達式為:

BP神經網絡是一種多層前饋神經網絡,其主要特點是信號前向傳遞,誤差反向傳播。前向傳遞時,輸入信號從輸入層經隱含層逐層處理,直至輸出層。如果輸出層得不到期望輸出,則轉入反向傳播,根據預測誤差調整網絡權值和閾值,從而使BP神經網絡預測輸出不斷逼近期望輸出。WNN是一種以BP神經網絡拓撲結構為基礎,把小波基函數作為隱含層節點的傳遞函數,信號前向傳播的同時誤差反向傳播的神經網絡[7],由于采用小波基函數,這使得WNN在很大程度上克服了BP固有的缺點。WNN也是3層網絡,包括輸入層、隱含層和輸出層,如圖1所示,X1,X2,…,Xk是WNN的輸入參數,Y1,Y2,…,Ym是WNN的預測輸出,ωij和ωjk是WNN的權值[8]。

圖1 小波神經網絡拓撲結構圖
當輸入信號序列為xi(i=1,2,…,k)時,隱含層輸出計算公式為:

式(3)中,h(j)為隱含層第 j個節點輸出值;ωij為輸入層和隱含層的連接權值;bj為小波基函數hj的平移因子;aj為小波基函數hj的伸縮因子;hj為小波基函數;l為隱含層節點數。
小波神經網絡輸出層計算公式為:

式(4)中,ωjk為隱含層到輸出層權值;h(j)為隱含層第 j個節點輸出;l為隱含層節點數;m為輸出層節點數。
本文隱含層選取的神經元激勵函數為Morlet母小波函數,其數學公式為:

有了網絡的預測輸出y(k),再根據期望輸出yn(k),就能計算出網絡的預測誤差:

然后根據預測誤差e修正小波神經網絡權值和小波基函數系數,類似于BP,采用梯度修正法,從而使小波神經網絡的預測輸出不斷逼近期望輸出。修正過程不再贅述,參見文獻[9]。由于小波神經網絡的結構和參數修正算法與BP本質上是一樣的,因此,需要人工確定相應的伸縮因子和平移因子以及各個權值和閾值。同時,小波神經網絡依然存在易陷入局部極小、收斂速度慢等BP網絡固有的缺點。因此,需要利用優化算法來獲取小波神經網絡的最好的初始值,遺傳算法就是一個典型的優化算法。
1.2 遺傳小波神經網絡
遺傳算法借鑒了達爾文的進化論和孟德斯鳩的遺傳學說,模擬生物界自然選擇和自然遺傳機制進化過程,通過全局隨機搜索來解決復雜問題[10]。它對問題空間進行二進制或實數編碼,用適應度函數作為評價依據,通過遺傳中的選擇、交叉和變異算子對個體進行篩選。隨著個體的不斷進化,適應度值好的個體被保留,適應度值差的個體被淘汰,直到完成最大進化代數或達到設定的適應度值,算法才結束。這里主要有編碼、適應度函數和遺傳操作三個關鍵問題。
就本文而言,由于變量較多,種群中個體采用實數編碼方式更直觀明了,包括隱含層節點數、輸入層與隱含層連接權值、隱含層閾值、隱含層與輸出層連接權值、輸出層閾值、伸縮因子、平移因子,共7個部分。
根據個體得到小波神經網絡的初始參數,用訓練數據訓練小波神經網絡后預測系統輸出,把預測輸出和期望輸出之間的誤差絕對值和作為個體適應度值F,計算公式為:

式(7)中,m為網絡輸出節點數;yn(k)、y(k)見式(6)定義;q為系數。
遺傳操作主要是利用選擇概率Pi、交叉概率Pc、變異概率Pm等生成新個體,產生下一代種群。個體的選擇概率是根據個體的適應度值來計算:

式(8)中 fi=k/Fi,Fi為個體i的適應度值。對于Pc和Pm的計算請參考文獻[9],這里不再詳述。
最后將新個體插入種群中,進行再迭代,最終利用遺傳算法得到了問題的最優解,解決了小波神經網絡中參數手動調整的困難。
遺傳小波神經網絡算法的具體步驟如下[11-12]:
步驟1設定遺傳算法中的參數,包括個體編碼長度、種群規模、遺傳代數、交叉概率、變異概率等。
步驟2按照公式(7)計算各個體的適應度值。
步驟3根據適應度值,利用遺傳算法的選擇、交叉和變異三個算子得到下一代群體。
步驟4將新的個體插入種群中,并計算新一代群體的適應度值。
步驟5計算網絡的誤差平方和,若達到設定值或達到設定的進化代數,則轉向步驟6;否則,轉向步驟3,繼續進行遺傳操作。
步驟6選出適應度最高的個體進行解碼,并將參數賦給小波神經網絡作為初始值,開始小波神經網絡的訓練和測試。
2.1 電子鼻
圖2是課題組研制的白酒電子鼻實驗裝置示意圖。傳感器陣列是由TGS2600(S1)、TGS2611(S2)、TGS2602(S3)、TGS2620(S4)和TGS2610(S5)共5個氣體傳感器構成。TGS2600對氣態的空氣質量檢測具有很高的靈敏度,TGS2611對天然氣等可燃氣體具有高敏感度,TGS2602對氣味氣體具有高敏感度,TGS2620對有機蒸汽(尤其是酒精)具有高敏感度,TGS2610對甲烷、乙烷、丙烷等可燃氣體具有高敏感度。

圖2 電子鼻實驗裝置示意圖
數據采集卡采用的是北京迪陽公司生產的U18,板卡上集成有12 bit分辨率的A/D轉換器,能提供16路單端或8路雙端模擬輸入通道,可通過USB總線與PC機連接,配合虛擬儀器軟件LabVIEW,能夠快速、方便地搭建一個通用的數據采集系統。電子鼻工作過程:將白酒等液體置入塑料制成的樣品池中,通過內置真空泵1將其揮發性成分吸入到由氣體傳感器陣列構成的氣室中;PC機啟動數據采集卡采集白酒氣味數據,一直到傳感器到達穩定狀態;下一個樣品測試前,內置真空泵2首先需要將上一次測試樣品的廢氣抽走,并利用新鮮空氣充分洗刷傳感器陣列;每一種傳感器對白酒混合氣味均有唯一的響應圖譜,通過PC機將5路圖譜呈現出來,并進行特征提取和模式識別。
2.2 數據采集及特征提取
2011年3月18日,從淮安某超市購買到洋河42°藍色經典、今世緣40°省接待、雙溝42°好運來和京都56°二鍋頭若干作為測試樣品。每次取15 mL待測樣品,利用電子鼻進行氣味數據采集,每個樣品測試30次,這樣就得到4種白酒樣品共120個樣本數據。如圖3所示為省接待樣品的傳感器信號強度圖,其中橫坐標是數據采集點數(32萬點),縱坐標是響應強度或幅值,每條曲線代表一個傳感器在采樣時間內的響應值變化。

圖3 藍地球樣品的傳感器信號強度圖
需要說明的是,由于在采樣操作的起始時刻,傳感器陣列暴露在空氣當中,它們的響應幅值幾乎一樣(稍大于0);在10萬點左右,響應值有明顯變化(樣品的揮發性成分影響傳感器輸出);在25萬點以后,5路傳感器的響應強度相對于其自身都維持在一個較為穩定的值,對于藍地球樣品,S2、S3和S4存在較大差異,但S1、S5比較相近。為了將5條曲線更清晰地展示出來,圖3給S1、S2、S3、S4分別疊加了8、6、4、2的常量,抬高了上述4個傳感器的響應曲線,在建立識別模型時分別減去疊加值,因此,并不影響模式識別的結果。
由于5路傳感器采集的原始氣味數據總計達到160萬點,直接利用原始數據建立識別模型是不可行的,在建模之前必須進行降維或特征提取。在白酒電子鼻中,本文采取的方法是截取一段傳感器穩態響應曲線,求取穩態響應值:

式(9)中,vkx表示第x個傳感器n個穩態響應點中第k點的序列值,實驗時,n取3 000,并且從25萬點開始。這樣,每個樣本就用5個數值特征值來進行表征,達到了降維目的。
3.1 網絡收斂性
從120個樣本中選取60組(每種白酒取15組)數據作為訓練集,剩余60組作為測試集。對訓練集和測試集數據統一采用[0,1]歸一化,四種白酒樣本的小波神經網絡輸出分別標記為:藍色經典0001、省接待0010、好運來0100、二鍋頭1000。
神經網絡的輸入層有5個神經元,輸出層有4個神經元,經遺傳算法優化的隱含層節點個數為9個。在相同條件下(都是三層網絡、各層節點數一樣),分別建立了BP神經網絡、小波神經網絡和遺傳小波神經網絡三種分類模型。對于BP網絡,隱含層和輸出層傳遞函數分別采用Sigmoid型tansig函數和線性purelin函數,訓練采用L-M優化算法trainlm函數。對于WNN,隱含層采用的是Morlet小波基函數。對于GA-WNN,種群規模為50,進化代數為100,交叉概率為0.5,變異概率為0.2。上述三種模型的學習目標都為0.001,學習率都為0.1。三種模型的誤差學習曲線如圖4所示。

圖4 BP、WNN、GA-WNN訓練誤差學習曲線
從圖4可以看出,傳統的BP網絡經過設定的最大步數1 000步訓練停止,但沒達到預期設定的理想誤差,這是因為傳統BP算法存在局部極小問題。小波神經網絡經過178步后收斂,雖然最終達到了預期的理想誤差,但訓練過程存在振蕩問題。遺傳小波神經網絡僅迭代94次就達到理想誤差0.001,訓練過程收斂性好,振蕩現象不明顯。由此可知,無論在收斂速度上,還是在預測的精度上,基于遺傳小波神經網絡的分類模型都比傳統BP網絡和小波神經網絡具有更好的效果。遺傳小波神經網絡避免了局部極小問題,從而快速地找到最優解,降低了學習時間。
3.2 網絡診斷精度
表1列出了電子鼻的8個氣味樣品特征值數據(從每種白酒樣本中隨機選擇2個)及其在遺傳小波神經網絡分類模型下的預測標簽和實際標簽。從表1可以看出,遺傳小波神經網絡模型正確識別出8個樣本。

表1 部分數據遺傳小波神經網絡分類結果
為了能夠利用本文的算法對自制的白酒識別電子鼻的性能進行全面的評估,將所采集到的120個樣本數據分別送入三個分類模型中進行10次同等條件下的測試。將每種白酒樣本正確檢出的個數與此種白酒的樣本總數之比作為分類準確率,比如在GA-WNN下,藍色經典樣本總數為150個,正確識別148個,因此分類準確率為148/150= 98.67%。表2列出了三種模型對四種白酒的最終測試集分類準確率。
從表2可以看出:對于藍色經典和二鍋頭樣本數據,三種模型的識別準確率都比較高,都達到了94.00%以上,但是對于藍地球和好運來樣本數據,GA-WNN分類準確率為97.67%和97.34%,明顯高于WNN的92.00%和91.34%以及BP的82.00%和80.67%。藍地球和好運來樣本識別準確率的大幅提高,主要是由于GA-WNN算法采用遺傳算法在全局范圍內確定了較優的網絡初值,很大程度上消除了BP網絡隨機選取初始值,易陷入局部極小的可能,獲得了良好的網絡性能,致使網絡具有較強的泛化能力。同時,通過10次實驗的極差和均方差也能說明GA-WNN網絡的穩定性較高,識別準確率波動不大。

表2 三種模型對四種白酒的分類準確率(%)
基于傳統BP算法的小波神經網絡具有BP算法的固有缺陷,收斂速度慢,并且存在振蕩問題。遺傳算法和小波神經網絡相結合的GA-WNN混合算法,充分發揮了遺傳算法的全局優化搜索能力、小波變換良好的時頻局部特性和神經網絡的自學習能力,其收斂速度和診斷精度明顯提高,更加適應用于白酒電子鼻中的模式識別算法。
[1]楊國強,張淑娟.電子鼻技術在酒類識別應用中的研究進展[J].山西農業大學學報:自然科學版,2010,30(1):92-96.
[2]劉紅秀,李洪波,李衛東.基于電子鼻的魚類新鮮度估計研究[J].中山大學學報:自然科學版,2010,49(2):28-30.
[3]Yu Huichun,Wang Jun.Discrimination of Longjing green-tea grade by electronic nose[J].Sensors and Actuators B,2007,122:134-140.
[4]賈洪鋒,盧一,何江紅,等.電子鼻在牦牛肉和牛肉豬肉識別中的應用[J].農業工程學報,2011,27(5):358-363.
[5]王美玲,王念平,李曉.BP神經網絡算法的改進及應用[J].計算機工程與應用,2009,46(35):47-48.
[6]聶鵬,諶鑫,徐濤,等.基于小波神經網絡的航空刀具磨損狀態識別[J].北京航空航天大學學報,2011,37(1):106-109.
[7]張坤,郁湧,李彤.小波神經網絡在黃金價格預測中的應用[J].計算機工程與應用,2010,46(27):224-226.
[8]Billings S A,Weih L.A new class of wavelet networks for nonlinear system identification[J].IEEE Transactions on Neural Networks,2005,16(4):862-874.
[9]韓志艷,王健,倫淑嫻.基于遺傳小波神經網絡的語音識別分類器設計[J].計算機科學,2010,37(11):243-246.
[10]周紅標,張宇林,胡金平.基于遺傳算法和BP神經網絡的CTG識別研究[J].重慶醫科大學學報,2011,36(7):68-71.
[11]張松華,何怡剛,李兵,等.基于遺傳小波神經網絡的RFID調制識別[J].計算機工程,2011,37(2):191-193.
[12]MATLAB中文論壇.MATLAB神經網絡30個案例分析[M].北京:北京航空航天大學出版社,2010.
ZHOU Hongbiao,ZHANG Xinrong,GENG Zhonghua
Faculty of Electronic and Electrical Engineering,Huaiyin Institute of Technology,Huai'an,Jiangsu 223003,China
The classification model of BP neural networks is put forward,which using electronic nose to acquire odor datum from four kinds of Chinese Liquors,aims at the research of Chinese liquors identification electronic nose.But the BP algorithm of neural network commonly used has several disadvantages,such as the slow convergence speed,the optimization procedure getting easily stacked into the minimal value locally and network parameter must be decided by experiment and experience.This paper designs a recognition classifier of Genetic Algorithm-Wavelet Neural Network(GA-WNN),which has global optimization capability of GA,non-linear approximation ability of wavelet and self-learning characteristic of neural network.The simulation results prove that it can improve the recognition accuracy and convergence rate,and the GA-WNN algorithm can be used in Chinese liquors identification electronic nose.
Chinese liquors identification;electronic nose;wavelet neural networks;genetic algorithm
為研究不同品質白酒快速識別的電子鼻技術,利用自制的電子鼻采集四種白酒樣品的氣味數據,建立了BP神經網絡分類模型。針對BP算法普遍存在的收斂速度慢、易陷入局部極小且網絡參數需要人工設定的缺陷,提出一種將遺傳算法的自適應全局優化搜索能力、小波分析的非線性逼近能力和BP算法自學習能力結合在一起的遺傳小波神經網絡白酒識別模型。仿真結果表明,與BP神經網絡和小波神經網絡相比,GA-WNN分類模型的收斂速度和分類準確率都得到了較大提高,可應用于白酒識別電子鼻。
白酒識別;電子鼻;小波神經網絡;遺傳算法
A
TS261.7;TP274+.2
10.3778/j.issn.1002-8331.1108-0350
ZHOU Hongbiao,ZHANG Xinrong,GENG Zhonghua.Chinese liquors identification electronic nose based on GA-WNN. Computer Engineering and Applications,2013,49(5):254-257.
江蘇省自然科學基金(No.08KJA460001);淮安市科技支撐項目(No.SN1045);淮陰工學院科技項目(No.HGC1009)。
周紅標(1980—),男,講師,主要研究領域:人工智能;張新榮,男,副教授。E-mail:hyitzhb@163.com
2011-08-24
2011-10-20
1002-8331(2013)05-0254-04
CNKI出版日期:2011-12-09 http://www.cnki.net/kcms/detail/11.2127.TP.20111209.1000.018.html