徐佳偉
(國網上海市電力公司市南集團,上海 20000)
氣體傳感器陣列檢測法可應用于諸多領域,如可燃性泄露氣體,有毒氣體或易揮發的有機氣體的監測、農產品與食品的質量檢驗、生物醫學以及變壓器油中溶解氣體在線監測等,它是利用氣體傳感器的交叉敏感性,有選擇地將若干氣體傳感器組成傳感器陣列,結合模式識別技術實現對氣體成分的檢測。模式識別算法在該方法中起著至關重要的作用,其識別效果直接決定著定性、定量分析的準確性。
目前應用最多的BP神經網絡模式識別法能夠有效地解決非線性映射問題,但是該算法采用梯度下降法,不但網絡的訓練速度慢,而且容易陷入局部極小值。近年來提出的先用主成分分析(Principal Component Analysis,簡稱PCA)對數據進行處理,將數據降維以后再通過神經網絡對數據進行分析,這樣處理以后可以使網絡更快收斂并且精度更高。
本文將主成分分析法引入到BP神經網絡模式識別中,對傳感器檢測的油中氣油進行處理。采用主成分分析消除傳感器陣列信號之間的相關性,將其變換結果作為BP神經網絡的訓練樣本。兩者結合應用于傳感器陣列信號的模式識別中,通過對比表明,將主成分分析與BP神經網絡相結合,能有效地降低氣體傳感器交叉敏感的影響,提高混合氣體的檢測精度。
本文所使用的氣體傳感陣列檢測系統由傳感器陣列、信號調理與數據采集單元以及神經網絡三部分組成(見圖1)。其中傳感器陣列是整個氣體檢測系統的基礎,由MQ1~MQ6六只氣體傳感器所組成。六只傳感器可分別用于檢測H2、CO、CH4、C2H4、C2H2、C2H6六種氣體,盡管每種氣體的傳感單元對各自檢測氣體的靈敏度明顯高于其余氣體。但存在交叉敏感的問題,特別是有些性質相近的氣體成分(如H2和C2H4、CH4和C2H6)交叉敏感[1]程度較深。若不采用一定的模式識別方法進行處理,則不能準確反映實際氣體的濃度。

圖1 氣體傳感陣列檢測系統框圖
信號調理單元主要由溫度檢測和加熱控制電路組成,通過對陣列中每個氣敏傳感器工作溫度的檢測,調節控制傳感器的加熱電流,使每個傳感器都在各自最佳溫度狀態下工作。數據采集單元將氣敏元件的電阻值變換成電壓值并放大一定倍數,采集后作為后續BP神經網絡的處理對象。

式中 rij——原來變量xi與xj的相關系數。

因為R是實對稱矩陣(即rij=rji),所以只需計算其上三角元素或下三角元素即可。
首先解特征方程|λI-R|=0(I表示單位向量,R表示相關系數矩陣)求出特征值λi(i=1,2,…n),并使其按大小順序排列,即λ1≥λ2≥…≥λn≥0;然后分別求出對應于特征值λi的特征向量ui(i=1,2,…n),即

式中 y1,y2,…y3——第1,第2,…,第n主成分。


由此可以進一步計算主成分得分:

本文采用動態配氣法中的流量比混合法來配制72組不同組分的混合氣體作為訓練樣本。并且由于氣體傳感器交叉敏感的影響,使得傳感器的電壓不僅與所檢測氣體有關,而且對其它檢測氣體也有一定的相關性。因此氣體傳感器的輸出電壓所反映的各種氣體的濃度信息有一定的相關性。我們可以采用主成分分析法消除這種相關性。
白石一文:這世界上所有的人一開始都只是陌生人,但就在發生一些事情或是累積一些莫名的感情之后,你也就無法忽視對方的存在。好比一只氣球因為空氣而膨脹,好比船帆順風推動一艘船,人類必須仰賴不具實體的偶然與心情上的變化,才能豐富自己的人生。
對樣本進行主成分分析得到六個主成分的特征根,其中特征根按從大到小排序,貢獻率和累積貢獻率如表1所示。

表1 主成分的貢獻率和累積貢獻率
通常主成分個數m的取值標準是使得累積貢獻率大于85%即可,為此選取前4個主成分。4個主成分的主成分載荷矩陣見表2,其中每一個載荷量表示主成分與對應變量的相關系數。

表2 主成分載荷矩陣
BP網絡學習是典型的有導師學習,其學習法則是對簡單的(誤差)學習規則的推廣和發展。一般地,BP神經網絡的訓練過程如圖4所示。

圖4 BP神經網絡訓練流程
其訓練的過程如下:
①初始化網絡及學習參數,如設置網絡初始權值、閾值矩陣、學習因子η等;
②前向傳播過程:對給定的訓練樣本輸入,計算網絡的輸出,并與期望輸出比較,若滿足誤差要求,則保存當前權值、閾值矩陣,若不滿足誤差要求,則轉入③;
③后向傳播過程:
1)計算同一層單元的誤差δpj;
2)修正權值和閾值;
3)返回②,按新的權值、閾值進行前向傳播。
通常,用網絡的均方根(RMS)誤差來定量地反映學習的性能。其定義為

式中 m——訓練集內模式對的個數;n——網絡輸出層單元個數。
為了對比說明采用主成分分析法對樣本數據進行預處理的優越性,本文構造了兩種結構的BP神經網絡。
神經網絡的結構方面,采用單隱層的神經網絡。其中輸入層神經元個數l=6,分別對應MQ1-MQ6六個氣體傳感器的輸出信號。輸出層神經元個數n=6,分別對應H2、CO、CH4、C2H4、C2H2、C2H6六種氣體的濃度。隱層神經元個數可通過經驗公式確定:

由于學習樣本中的氣體濃度值過大且分散性也較大,直接使用容易造成神經網絡的麻痹,使神經網絡不能收斂。為此,在分別采用兩種BP神經網絡進行訓練之前,需對傳感陣列的輸出電壓信號以及期望的氣體濃度進行歸一化處理:

其中xi、yi為經過歸一化處理之后的神經網絡訓練的輸入和輸出,Vi、ci為實際的傳感器電壓信號和氣體濃度,Vmax、Vmin、cmax、cmin分別為傳感器電壓信號的最大值和最小值以及氣體濃度的最大值和最小值。
為了驗證BP神經網絡主成分分析法的優勢,配制10組不同組分的氣體(見表3)來測試網絡的識別性能,這10組測試氣體模擬了變壓器正常運行,局部放電,低能放電,高能放電,低溫過熱,中溫過熱,以及高溫過熱時的各組分氣體含量。分別采用訓練好的BP神經網絡和BP神經網絡主成分分析法進行識別,識別結果見表4、表5。

表3 氣體濃度的期望值

表4 基本BP神經網絡識別結果
由表6可以看出,采用BP神經網絡主成分分析法進行模式識別,其識別精度較基本的BP神經網絡有所提高。
論文對氣體傳感器陣列法中最常用的BP神經網絡進行了介紹,并將主成分分析法與之結合,用于變壓器油中溶解氣體傳感器陣列檢測模式識別中。采用主成分分析法對傳感器陣列信號進行處理,提取4個主成分作為神經網絡的輸入。構造了兩種BP神經網絡,分別采用沒有經過任何處理的數據和經過主成分分析預處理后的主成分數據進行網絡的訓練和識別。結果表明經過主成分分析預處理之后的BP神經網絡的識別精度和對交叉敏感的的降低明顯優于另外一種網絡。

表5 基于主成分分析的BP神經網絡識別結果

表6 兩種方法的識別誤差
[1] 佟繼春,陳偉根,陳榮柱 .一種在線分析變壓器故障特征氣體的智能傳感器[J].高壓電器,2014,40(6):433-435,438.
[2] 趙海霞,武建 .淺淅主成分析方法[J].科技信息,2009-02-070.