張志剛,陳紅巖,曲 健
(1.浙江農業商貿職業學院汽車技術系,浙江 紹興 312088;2.中國計量大學機電工程學院,杭州 310018)
多組分汽車尾氣定量檢測系統*
張志剛1,陳紅巖2*,曲 健2
(1.浙江農業商貿職業學院汽車技術系,浙江 紹興 312088;2.中國計量大學機電工程學院,杭州 310018)
針對混合氣體濃度檢測中,氣體間交叉吸收干擾及紅外光譜數據計算量過大等問題,提出了一種基于網格搜索的支持向量機方法,建立多組分混合氣體定量分析模型。運用網格搜索法對支持向量機建模中的參數進行優化選擇,并與遺傳算法優化的BP網絡建模效果作對比。實驗表明:SVM建模所用時間為39.824 s,BP神經網絡約為2 682 s;SVM建模預測結果均方差明顯低于BP網絡。SVM建模時間約為BP網絡的1/60,收斂速度更快,且預測精度更高。
氣體檢測;定量分析;支持向量機;BP神經網絡;交叉干擾
目前,氣體的定量分析技術已廣泛應用于食品安全、環境監測、生產安全等多個領域[1]。在進行多組分氣體同時測量時,待測氣體的吸收譜線存在嚴重的交叉重疊現象,如果不加以回歸分析修正,將嚴重影響測量的靈敏度和精度[2],需要后續的數據處理。
現代氣體檢測技術有人工神經網絡ANN(Artificial Neural Network)方法和支持向量機SVM(Support Vector Machine)方法等。其中,耿志廣[3]等將神經網絡與氣體傳感器陣列技術相結合,克服了傳感器陣列在混合氣體檢測中的交叉敏感現象;黃小燕[4[5]等利用粒子群優化算法對支持向量機進行參數優化,用于混合氣體定量分析,進一步提高了預測精度;李玉軍[6]等人將粒子群優化與最小支持二乘向量機相結合,并與遍歷優化算法相比較,尋優時間節省40倍以上,預測結果誤差水平相當。
本文以不分光紅外法[7](NDIR)氣體濃度傳感器為研究對象,對多組分混合氣體進行建模仿真分析。
SVM回歸校正模型,就是利用SVM核函數,將紅外光譜輸入數據利用線性映射函數Φ,映射到高維空間;在高維空間進行回歸分析,建立紅外光譜數據與待測氣體濃度的回歸校正模型,其回歸函數f(xi)可表示為:
f(xi)=ω·φ(xi)+b
(1)
式中:ω·φ(xi)為向量ω與φ(xi)的內積;ω為回歸系數,b為閥值。
引入Lagrange函數,得到的SVM回歸校正模型的回歸函數為:

(2)

高斯函數能較好的模擬光譜信號,因此選用RBF核函數。其基本形式如下:
K(xi,xj)=exp(-g‖xi-xj‖2),g>0
(3)
式中:參數g為gamma參數函數設置(若k為屬性的數目,則g默認為1/k)。
SVM的回歸模型的建立需要進行參數的優選,主要選擇核參數c和g。傳統的網格搜索法[8]的基本原理是:讓c和g在一定的范圍劃分網格并遍歷網格內所有點進行取值,最終取使驗證分類準確率最高的那組c和g作為最佳的參數。改進的網格搜索法,首先,在較大范圍內采用大步距進行粗搜,在尋得了局部最優參數之后,再在這組參數附近選擇一個小區間,采用小步距進行二次精搜,找到最終的最優參數,在保證準確率的前提下,縮短了尋優時間。具體的尋優過程如圖1所示。

圖1 改進網格搜索尋優流程圖
遺傳算法[9]是模擬自然界生物進化論和遺傳機制而成的一種并行隨機搜索方法。遺傳算法優化BP神經網絡流程如圖2所示。

圖2 遺傳算法優化BP神經網絡算法流程圖
4.1 實驗裝置與條件
測試系統利用不分光紅外法原理,經過MCU調制的紅外光源通過一定長度的氣室內,氣室中充有待測濃度的氣體。由于氣體對紅外線波段中特征波長紅外線能量的吸收,特定波長的光源通過氣體后,在相應譜線處會發生光強的衰減,紅外線的能量將減少,探測器檢測剩余的光強度并轉化為電信號,經朗伯-比爾定律計算后,得到系統檢測的氣體濃度值,但受到電壓波動、氣體脈沖、氣體間交叉干擾以及環境因素等影響,此時的濃度值并不準確,需要后續的模型仿真分析。
本實驗搭建的實驗裝置的原理如圖3所示。

圖3 NDIR測試系統原理圖
圖3中,檢測系統的核心部件—傳感器,包括進氣口、出氣口、紅外光源、氣室、探測器和信號處理電路等部分。
整個傳感器由MCU、光源、氣室、探測器、信號處理電路和LCD顯示屏組成。其中檢測的核心部件紅外光源和探測器的優劣,影響整個系統的檢測精度。紅外光源要求輻射的光譜成分穩定、輻射能量集中在待分析組分特征吸收波段范圍內且紅外線應平行于氣室的中心軸。紅外光源采用HawkEye公司生產的為快速電調制提供完美解決方案的IR55紅外光源,輸出光譜范圍為中紅外區2μm~20μm,而所需測量的CO、CO2、HC化合物的吸收光譜峰值主要在中紅外區3μm~5μm區域,所以IR55完全滿足紅外吸收法對混合氣體的測量要求,可以保證在3μm~5μm區域有足夠的光能量輸出。光源驅動電路由兩級放大電路組成,通過MCU產生的脈沖信號對紅外光源進行調制。探測器選用PerkinElmer公司生產的TPS4339熱電堆探測器,是基于熱電偶測溫原理,用于紅外光探測的2×2矩陣規則排列的4通道探測器,分別為CO檢測通道、CO2檢測通道、HC化合物檢測通道和參考通道。由許多熱電偶串聯而成,提高了探測器對紅外輻射產生溫度變化的響應度;各個輸出的熱電勢疊加,因此熱電堆探測器所產生的熱電勢遠遠大于普通的熱電偶探測器;在探測節點處增加了光接收面的面積,可更加有效的吸收紅外光;4個熱電堆探測器分別擁有獨立的密封了不同紅外濾光片的透射窗口,相互之間沒有信號干擾,最多可同時測量4種氣體。這些特點使得探測器應用于氣體檢測的信號處理能力明顯提高,分辨率和靈敏度顯著增強,滿足氣體檢測的需要。信號調理電路包括輸入濾波電路、放大電路、穩壓電路和輸出濾波電路。
4.2 網格搜索法優化SVM及建模分析
為提高檢測精度,對不同氣體進行獨立建模。以CO氣體為例,選擇其中的15組樣本為訓練集,建立SVM模型并查看模型在訓練集上的回歸效果;選擇剩余的5組樣本為測試集,用建立好的模型對測試集進行回歸預測,并驗證SVM模型的預測精度和水平(詳情見表1)。模型的建立需要對懲罰參數c(選取范圍0~100)和RBF核參數g(選取范圍0~1 000)進行合理的優化選擇,本文采用改進的網格搜索法進行參數尋優,根據尋優流程圖1,具體的步驟為:
(1)設定初始網格搜索的(c,g)范圍和步距。本實驗設定的初始范圍c為-10~10(取以2為底的冪指數后),g為-10~10。步距設為2。
(2)采用交叉驗證的方法,其中K取3,得到使分類準確率最高的局部最優參數,c=1,g=1。
(3)在得到的局部最優參數的附近,重新定義搜索范圍和步距,其中c為-4~4,g為-4~4,步距為0.5進行精細化選擇。二次尋優的結果如圖4所示。

圖4 參數選擇結果視圖
由圖4參數選擇結果圖可知,改進的網格搜索法得到的最優參數c=0.707,g=0.5,交叉驗證的均方差為0.004 2。選定好最優參數組合(c,g)后,便可以建立SVM回歸模型,對測試樣本進行回歸分析,驗證模型的準確率。

圖6 CO測試集預測效果
為了驗證模型回歸預測準確度,用建立好的模型對訓練集本身作預測,如圖5所示。將模型應用于測試集樣本的回歸分析,預測結果如圖6所示。

圖5 CO訓練集回歸效果
由圖5可知,SVM模型對訓練集本身做預測時,預測曲線基本吻合實際濃度曲線;由圖6可以看出,將訓練好的模型對測試集仿真預測時,預測曲線能夠反映真實的濃度信息。
4.3 遺傳算法優化BP網絡建模分析
按照如圖2所示的遺傳算法優化BP網絡[10]的流程圖,具體的優化步驟為:
(1)選取20組實驗數據中的15組做訓練樣本,剩余的5組做測試樣本,并將樣本數據進行歸一化處理。
(2)確定BP神經網絡的拓撲結構。本課題同時對3種組分的混合氣體進行定量分析,針對不同氣體采用獨立建模的方法,所以設置BP神經網絡的結構為4-7-1,即輸入層有4個節點,隱含層有7個節點,輸出層有1個節點。
(3)初始化網絡,得到網絡的初始權值和閥值。
(4)設置適應度函數為訓練數據預測誤差絕對值的和。
(5)初始化種群,種群規模選取10~30為宜,本實驗選擇20;迭代次數為100代;交叉概率選在0~1之間,本文選擇0.2;變異概率選擇0.1。
(6)根據兩個參數的優化范圍對粒子群的初始位置和速度進行初始化。個體被選擇的概率pi為:
(4)
交叉概率:例如第m個染色體am與第n個染色體an在l位進行交叉,則
(5)
式中:b為(0~1)之間的隨機小數。
變異概率:以第m個個體的第i個染色體ami為例,則
(6)式中:amax為ami的上限,amin為ami的下限;f(g)=r2(1-g/G)2;r2為隨機數,g為當前的迭代次數,G為設定的迭代次數;r為(0~1)之間的隨機小數。
(7)優化流程的結束條件為模型預測誤差和為0或者迭代次數達到設定值。未達到結束條件則轉第6步。
把遺傳算法得到的最優個體賦給BP神經網絡,對訓練集進行訓練,建立神經網絡回歸模型,之后對測試集進行回歸分析,得到測試集的模型預測結果。
根據圖2優化流程計算,可得到如圖7所示的遺傳算法優化過程最優個體適應度值變化曲線。橫軸為優化代數,縱軸為適應度值。
由圖7看出,最優個體的適應度值從最高的0.682遞減至最低的0.131,大約在迭代60次之后便趨于穩定狀態。將優化得到的最優個體賦給BP神經網絡,用訓練數據訓練100次之后,可以得到模型在訓練樣本和測試樣本的預測結果,如圖8和圖9所示。
由圖8可以看出利用訓練集建立的模型對CO訓練集本身做預測時,模型預測曲線和CO實際濃度值具有較大的偏差,誤差明顯;將模型應用于CO測試集的預測,如圖9所示,誤差很大,預測曲線不能準確地逼近真實濃度。

圖7 最優個體適應度值變化圖

圖8 CO訓練集回歸效果

圖9 CO測試集預測效果

圖10 CO預測誤差曲線
4.4 仿真分析
將SVM建模仿真誤差曲線與遺傳優化的BP網絡建模仿真誤差曲線,繪制如圖10所示。
由圖10可以看出,兩條誤差曲線相比,SVM模型預測誤差明顯減小,說明本實驗建立的SVM模型預測精度較高。
同樣地,可以得到兩種分析模型對其他氣體的仿真預測結果及平均絕對誤差,見表1。兩種優化方法的結果對比表,如表2所示。

表1 仿真結果對比

表2 尋優結果對比
由表1、表2可以看出:兩種方法建立的氣體定量分析模型的測試誤差水平,SVM建模優于遺傳算法優化BP網絡。采用網格搜索法優化的SVM,建模所需時間平均為39.824 s,而遺傳算法優化BP網絡的建模時間為2 682 s,因此SVM建模方法在處理氣體定量分析問題上,收斂速度更快,且精度水平更高。
本文將改進的網格搜索法用于SVM建模的參數尋優,對濃度范圍在0.5%~8%的CO、3.6%~12.5%的CO2及200×10-6~3 270×10-6的C3H83種組分混合氣體進行定量分析,選取其中15組樣本作為訓練集,建立了SVM回歸模型,并對訓練集進行預測分析,以檢測模型的準確度;選擇剩余的5組氣體樣本作為驗證集,驗證模型的預測精度和水平。在SVM參數的選取問題上,提出了改進的網格搜索參數尋優法,與遺傳算法優化BP網絡建模相比,SVM建模時間為39.824 s,BP網絡為2 682 s;SVM預測平均方差為0.020 1,BP網絡為0.035 2,SVM精度水平明顯高于BP網絡。因此,將網格搜索法與SVM相結合更適合處理混合氣體的定量分析,在智能檢測領域有一定的挖掘空間。
[1] 楊永杰,張裕勝,楊賽程,等. 一種PM2.5檢測傳感器設計[J]. 傳感器與微系統,2014,33(3):76-78,81.
[2] 曲健,陳紅巖,劉文貞,等. 基于改進網格搜索法的支持向量機在氣體定量分析中的應用[J]. 傳感技術學報,2015,28(5):774-778.
[3] 耿志廣,王希武,王寅龍,等. 基于人工神經網絡的電子鼻對混合氣體檢測研究[J]. 現代計算機(專業版),2010,(5):45-48.
[4] 黃小燕,趙向陽,方智勇. 電子鼻在氣體檢測中的應用研究[J]. 傳感器與微系統,2008,27(6):47-49,52.
[5] 曲健,陳紅巖,劉文貞,等. 基于自適應變異粒子群優化的SVM在混合氣體分析中的應用[J]. 傳感技術學報,2015,28(8):774-778.
[6] 李玉軍,湯曉君,劉君華. 基于粒子群優化的最小二乘支持向量機在混合氣體定量分析中的應用[J]. 光譜學與光譜分析,2010,30(3):774-778.
[7] 陳桄紅,徐科軍,陶波波,等. 不分光紅外氣體分析儀信號處理與控制系統研究與設計[J]. 電子測量與儀器學報,2013,27(11):1040-1046.
[8] 王興玲,李占斌. 基于網格搜索的支持向量機核函數參數的確定[J]. 中國海洋大學學報,2005,35(5):859-862.
[9] 馬永杰,云文霞. 遺傳算法研究進展[J]. 計算機應用研究,2012,29(4):1201-1206,1210.
[10] 袁力哲,楊憲江,王宇. 基于自適應遺傳BP算法的混合氣體定量檢測研究[J]. 儀表技術與傳感器,2013,(6):118-120.
System of Quantitative Detecting Multi-Component Automotive Exhaust*
ZHANGZhigang1,CHENHongyan2*,QUJian2
(1.Department of Automobile Technology,Zhejiang Agricultural Business College,Shaoxing Zhejiang 312088,China;2.College of Mechanical and Electrical Engineering,China Jiliang University,Hangzhou 310018,China)
For the problems of the quantitative analysis of mixed gas,it is difficult to calculate excessive data in infrared spectroscopy,as well as crosstalk between gases and other issues. A solution of improved grid search optimized SVM was proposed. It was to establish the models of a multi-component mixture gases quantitative analysis based on infrared spectroscopy.Then the related parameters are optimized based on the method of improved grid search,and compared to the effects of BP neural network optimized by genetic algorithm. Experiments show that the time of modeling by SVM was about 39.824 s,and optimized BP network is 2 682 s;and the prediction MSE of SVM was significantly less than BP. The time of modeling by SVM was about 1/60 of BP,convergence is faster and forecasting accurate is higher.
gas detection;quantitative analysis;SVM;BP neural network;cross interference

項目來源:浙江農業商貿職業學院2015年度科研項目(KY201533)
2016-05-03 修改日期:2016-07-19
TH744
A
1005-9490(2017)03-0773-06
C:7230;4145
10.3969/j.issn.1005-9490.2017.03.050