張文濤 鐘文晶 胡伯勇 陸豪強(qiáng) 馬永光 董子健



摘要:針對(duì)火電廠制粉系統(tǒng)的故障征兆參數(shù)復(fù)雜、不易診斷的特點(diǎn),提出一種基于鄰域粗糙集(NRS)與相關(guān)向量機(jī)(RVM)的故障診斷方法。該方法首先利用鄰域粗糙集約簡(jiǎn)輸入的特征向量,并將約簡(jiǎn)得到的最優(yōu)決策表作為RVM的輸入,采用組合核函數(shù)代替?zhèn)鹘y(tǒng)的單一核函數(shù),利用網(wǎng)格搜索和交叉驗(yàn)證的方法確定最佳的核函數(shù)參數(shù)和組合核系數(shù),建立二叉樹RVM多分類模型,從而進(jìn)行制粉系統(tǒng)故障識(shí)別和診斷。實(shí)驗(yàn)結(jié)果表明,該方法故障診斷準(zhǔn)確率可達(dá)95%,且泛化能力強(qiáng)。
關(guān)鍵詞:制粉系統(tǒng);鄰域粗糙集;相關(guān)向量機(jī);故障診斷
中圖分類號(hào):TP27 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-5124(2019)08-0151-05
收稿日期:2018-05-08;收到修改稿日期:2018-06-20
基金項(xiàng)目:中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金(9160316004)
作者簡(jiǎn)介:張文濤(1992-),男,山東泰安市人,碩士研究生,專業(yè)方向?yàn)榘l(fā)電設(shè)備的故障診斷。
0 引言
制粉系統(tǒng)是電廠鍋爐的一個(gè)非常重要的子系統(tǒng),其工作狀況對(duì)于整個(gè)火電機(jī)組的安全和經(jīng)濟(jì)運(yùn)行具有非常重要的意義,一旦制粉系統(tǒng)發(fā)生故障,其后果不可估計(jì)[1]。20世紀(jì)80年代之前,一般都是依靠人工分析和信號(hào)處理來對(duì)故障進(jìn)行診斷和分析,這種方法效率低且準(zhǔn)確率不高。隨著技術(shù)的不斷發(fā)展,許多新的方法開始運(yùn)用到故障診斷之中。專家系統(tǒng)(ES)依據(jù)專家知識(shí),通過模擬人的思維對(duì)故障進(jìn)行推理和判斷,但是這種方法對(duì)知識(shí)的獲取比較困難,且自動(dòng)學(xué)習(xí)能力差[2]。支持向量機(jī)(SVM)是一種得到廣泛應(yīng)用的機(jī)器學(xué)習(xí)算法,文獻(xiàn)[3]利用核主元分析(KPCA)提取特征向量,將提取后的主元作為SVM的輸入,對(duì)故障進(jìn)行診斷和分類。隨著神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展,許多專家學(xué)者利用神經(jīng)網(wǎng)絡(luò)進(jìn)行制粉系統(tǒng)的故障診斷和故障識(shí)別。文獻(xiàn)[4]使用RBF神經(jīng)網(wǎng)絡(luò),但訓(xùn)練樣本過大時(shí),訓(xùn)練速度會(huì)很慢。文獻(xiàn)[5]提出基于粗糙集(RS)和概率神經(jīng)網(wǎng)絡(luò)的故障診斷方法,解決了樣本維數(shù)和訓(xùn)練速度的問題,但是粗糙集理論[6-7]會(huì)對(duì)數(shù)值型數(shù)據(jù)進(jìn)行離散化處理,造成信息損失。
相關(guān)向量機(jī)(relevance vector machine,RVM)是在SVM的基礎(chǔ)上提出的一種基于貝葉斯理論的稀疏學(xué)習(xí)算法[8],與SVM相比,具有以下優(yōu)點(diǎn):核函數(shù)的選取不受Mercer定理的限制;相關(guān)向量的數(shù)目遠(yuǎn)小于支持向量的數(shù)目;RVM無需手動(dòng)設(shè)置懲罰因子。RVM已在模式識(shí)別中得到了廣泛應(yīng)用[9]鄰域粗糙集理論[10]是對(duì)傳統(tǒng)粗糙集理論的擴(kuò)展,該方法可以直接處理數(shù)值型數(shù)據(jù),避免在離散化中數(shù)據(jù)損失的問題。因此本文提出一種基于鄰域粗糙集和RVM的制粉系統(tǒng)故障診斷方法,實(shí)現(xiàn)對(duì)多種故障的識(shí)別和診斷。
1 鄰域粗糙集理論
經(jīng)典粗糙集理論在處理連續(xù)型數(shù)據(jù)時(shí)需要將數(shù)據(jù)進(jìn)行離散化處理,但是離散化處理后會(huì)改變數(shù)據(jù)原始的屬性性質(zhì)。鄰域粗糙集是為了解決經(jīng)典粗糙集不便于處理數(shù)值屬性的數(shù)據(jù)集合而提出來的。
對(duì)于一個(gè)決策系統(tǒng)DS=(U,C∪D,V f),其中,U表示論域,C為條件屬性,D為決策屬性,V為各屬性值的集合,f代表信息函數(shù),表示樣本、屬性和屬性值之間的映射關(guān)系。
屬性約簡(jiǎn)就是將鄰域決策系統(tǒng)中不必要、冗余的屬性刪除,但又不影響系統(tǒng)本身的分類能力。通常情況下,屬性的約簡(jiǎn)并不是唯一的,可以有多個(gè)約簡(jiǎn)集合,所有約簡(jiǎn)集合的交集被稱為屬性的核,這是不能被刪除的[11]。在本文中,鄰域粗糙集約簡(jiǎn)使用前向貪心算法,其基本思想是以空集為起點(diǎn),計(jì)算所有屬性的重要度,保留屬性重要度最大的為約簡(jiǎn)后的集合,基于鄰域粗糙集的屬性約簡(jiǎn)算法如下:
1)輸入鄰域決策系統(tǒng)NDS=,設(shè)定重要度下限為Sigmin(Sigmin≥0),其中U為給定樣本集合,D為決策屬性,A表示生成鄰域的鄰域關(guān)系。
2)初始化約簡(jiǎn)集合red為空集。
3)對(duì)每一個(gè)屬性ai計(jì)算重要度Sig(a,B,D)=γB(D)-γB-{a}(D),式中B為條件屬性。
4)選擇最大的重要度,此時(shí)Sig(ak,B,D)=max(Sig(ai,B,D))。
5)如果Sig(ak,B,D)>Sigmin,red←red+ak,返回到步驟3),否則就輸出red。
2 相關(guān)向量機(jī)
2.1 RVM分類模型
RVTV1是一種可用于回歸或分類的基于貝葉斯的稀疏學(xué)習(xí)算法,下面針對(duì)二分類的RVM方法進(jìn)行介紹。給定訓(xùn)練樣本集{xn,tn}n=1N,其中x是輸入矩陣,tn∈{0,1}為分類的類別號(hào),N是訓(xùn)練樣本數(shù),RVM的分類函數(shù)可以定義:式中:w——權(quán)值向量;
K(x,xi)——核函數(shù)。
設(shè)P(t|x)為伯努利分布,則樣本數(shù)據(jù)的似然估計(jì)概率分布為式中,σ(·)為sigmold函數(shù)。
為了保持RVM模型的稀疏性,假設(shè)w服從均值為0的高斯先驗(yàn)概率分布:其中,α為N+1維的超參數(shù)向量,N(wi|0,αi-1)為高斯分布函數(shù)。
對(duì)于新的輸入向量x*,根據(jù)概率預(yù)測(cè)公式,目標(biāo)向量t*的條件概率為
由于不能通過解析的方法求解權(quán)重系數(shù)的后驗(yàn)概率p(w|t,α)和邊緣似然估計(jì)函數(shù)p(t|α),因此可以采用一種基于拉普拉斯估計(jì)的積分變換法來估算后驗(yàn)權(quán)重概率分布,具體可以參考文獻(xiàn)[12],本文在此不再贅述。
經(jīng)過多次迭代,大部分的權(quán)值都為0,剩下的少部分非零權(quán)值向量被稱為相關(guān)向量,只有相關(guān)向量對(duì)樣本數(shù)據(jù)的分類起作用,則RVM的分類函數(shù)可以表示為:
2.2 組合核函數(shù)的構(gòu)建
RVM的核函數(shù)可以有很多種,比如Gauss核函數(shù)、Poly核函數(shù)、Laplace核函數(shù)等,不同的核函數(shù)有不同的特點(diǎn),在訓(xùn)練時(shí)產(chǎn)生的相關(guān)向量的個(gè)數(shù)也不同,預(yù)測(cè)精度也不一樣[13]。本文采用一種局部Gauss核函數(shù)和全局Poly核函數(shù)組合核函數(shù)的形式,表達(dá)式為:其中,s表示組合核函數(shù)權(quán)重系數(shù),0≤s≤1。Gauss核函數(shù)的表達(dá)式為KGauss(xi,xj)=exp(-‖xi-xj‖2/γ2),γ為核函數(shù)的寬度;Poly核函數(shù)的表達(dá)式為KPoly(xi,xj)=(xiTxj+1)2,本文中選擇多項(xiàng)式級(jí)數(shù)為2。
2.3 多分類RVM
單一的RVM只能解決二分類問題,對(duì)于多分類問題,通常通過構(gòu)建多個(gè)二分類RVM實(shí)現(xiàn),常用的方式有一對(duì)一、一對(duì)多、有向無環(huán)圖和二叉樹等[14]。由于二叉樹RVM具有較高的訓(xùn)練和測(cè)試速度,且需要較少的分類器,故本文采用一種基于二叉樹RVM的多分類策略。
二叉樹RVM多分類算法的思想是:先將所有樣本數(shù)據(jù)的類別分成兩大子類,然后將子類進(jìn)一步劃分成兩個(gè)次子類,如此劃分下去,直到將所有的類劃分結(jié)束。對(duì)于N分類問題,只需要構(gòu)造N-1個(gè)分類器,因此計(jì)算效率高。基于二叉樹RVM多分類的制粉系統(tǒng)故障診斷模型如圖1所示。
3 基于鄰域粗糙集和RVM的制粉系統(tǒng)故障診斷方法
火電廠運(yùn)行環(huán)境復(fù)雜,而制粉系統(tǒng)故障類別多,且難以通過故障征兆判斷故障原因[15]。鄰域粗糙集在處理不完整數(shù)據(jù)和不精確知識(shí)時(shí),可以有效挖掘出數(shù)據(jù)內(nèi)部的信息,并將數(shù)據(jù)通過一定的原則進(jìn)行約簡(jiǎn)和提煉。基于此,本文提出基于鄰域粗糙集和RVM的制粉系統(tǒng)故障診斷方法,故障診斷的流程見圖2,具體步驟如下:
1)選取訓(xùn)練樣本,構(gòu)造鄰域決策系統(tǒng)。
2)對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理,消除量綱的影響,歸一化公式如下:
3)基于鄰域粗糙集理論,對(duì)訓(xùn)練樣本進(jìn)行屬性約簡(jiǎn),得到與決策屬性最相關(guān)的條件屬性。
4)對(duì)于屬性約簡(jiǎn)后的樣本數(shù)據(jù),構(gòu)造二叉樹RVM多分類器,并采用網(wǎng)格搜索和K折交叉驗(yàn)證的方法,確定最佳的核函數(shù)參數(shù)和組合核系數(shù),從而建立RVM故障診斷模型。
5)對(duì)測(cè)試樣本進(jìn)行故障診斷和識(shí)別。
4 仿真研究
4.1 性能分析
為了驗(yàn)證基于NRS-RVM故障診斷模型的有效性,選取UCI標(biāo)準(zhǔn)數(shù)據(jù)集(http://archive.ics.uci.edu/ml)進(jìn)行仿真實(shí)驗(yàn)。主要包括兩個(gè)實(shí)驗(yàn),實(shí)驗(yàn)一驗(yàn)證經(jīng)過鄰域粗糙集屬性約簡(jiǎn)之后的數(shù)據(jù),可以提高分類精度,實(shí)驗(yàn)二主要比較RVM與SVM模型的性能,實(shí)驗(yàn)中選用的數(shù)據(jù)集如表1所示。
將經(jīng)過約簡(jiǎn)后的數(shù)據(jù)和未約簡(jiǎn)的測(cè)試數(shù)據(jù)的進(jìn)行分類對(duì)比,分類算法采用RVM算法,對(duì)比結(jié)果如表2所示。
從表2中可以看出經(jīng)過鄰域粗糙集約簡(jiǎn)之后的數(shù)據(jù),分類準(zhǔn)確率都得到了提高。這說明經(jīng)過鄰域粗糙集的屬性約簡(jiǎn),不僅可以減少計(jì)算量,去除冗余信息,而且可以提高分類準(zhǔn)確率。
利用前面所提的約簡(jiǎn)后的數(shù)據(jù)集,分別采用SVM和RVM對(duì)測(cè)試數(shù)據(jù)進(jìn)行分類,從訓(xùn)練時(shí)間、測(cè)試時(shí)間、向量個(gè)數(shù)和分類準(zhǔn)確率4個(gè)方面比較它們的性能,對(duì)比結(jié)果如表3所示。
從表3中可以很直觀地看出,在分類準(zhǔn)確率方面,RVM和SVM都能取得不錯(cuò)的效果,RVM略高于SVM。RVM的訓(xùn)練時(shí)間雖然要比SVM長,但是RVM有著比SVM更短的測(cè)試時(shí)間,并且相關(guān)向量的個(gè)數(shù)遠(yuǎn)遠(yuǎn)少于SVM的支持向量的個(gè)數(shù),說明了RVM模型的優(yōu)越性,可以應(yīng)用在故障診斷方面。
4.2 實(shí)例分析
制粉系統(tǒng)的主要故障有磨煤機(jī)堵煤、磨煤機(jī)斷煤、煤粉自燃、一次風(fēng)管堵塞等。本文選取決策屬性D={1,2,3,4},分別對(duì)應(yīng)正常狀態(tài)、磨煤機(jī)堵煤、磨煤機(jī)斷煤和煤粉自燃等4種狀態(tài)。選擇跟制粉系統(tǒng)相關(guān)的11個(gè)條件屬性C={c1,c2,c3,c4,c5,c6,c7,c8,c9,c10,c11},分別為磨煤機(jī)電流、磨煤機(jī)齒輪箱推力瓦溫度、磨煤機(jī)潤滑油溫度、磨煤機(jī)人口溫度、磨煤機(jī)一次風(fēng)流量、磨煤機(jī)人口壓力、磨煤機(jī)進(jìn)出口壓差、磨煤機(jī)出口溫度、磨密封風(fēng)與一次風(fēng)差壓、分離器出口壓力、給煤量。一共選取160組數(shù)據(jù),每類數(shù)據(jù)40組,其中取每類數(shù)據(jù)的前30組作為訓(xùn)練集,后面10組數(shù)據(jù)為測(cè)試集樣本。
首先將數(shù)據(jù)進(jìn)行歸一化處理,然后采用前面所述的鄰域粗糙集屬性約簡(jiǎn)算法,對(duì)數(shù)據(jù)進(jìn)行約簡(jiǎn),得到的最優(yōu)條件屬性表為{c1,c2,c4,c5,c8,c11},由原來11個(gè)條件屬性,減少為6個(gè),大大減少了樣本集的數(shù)據(jù)量,這樣既能保證原始數(shù)據(jù)信息不會(huì)損失,又能為后面的RVM建模提供方便。
本文采用網(wǎng)格搜索和5折交叉驗(yàn)證的方法尋找最優(yōu)的核函數(shù)參數(shù)和組合核系數(shù),根據(jù)最優(yōu)參數(shù),建立二叉樹RVM多分類故障診斷模型。測(cè)試集樣本的故障診斷結(jié)果如圖3所示。
從圖中可以看出,一共40個(gè)測(cè)試樣本,每類有10個(gè),有2個(gè)測(cè)試樣本被診斷錯(cuò)誤,故障診斷準(zhǔn)確率可以達(dá)到95%。
為了驗(yàn)證本方法的有效性和優(yōu)越性,再使用SVM算法進(jìn)行制粉系統(tǒng)的故障診斷,文中借助LIBSVM軟件包,選擇RBF核函數(shù),并采用網(wǎng)格搜索和交叉驗(yàn)證的方法確定SVM的懲罰因子C和核函數(shù)參數(shù)σ。兩種方法在測(cè)試樣本數(shù)據(jù)上的訓(xùn)練時(shí)間、測(cè)試時(shí)間、向量個(gè)數(shù)和診斷準(zhǔn)確率的比較如表4所示。
從表4中可以很直觀地看出,在制粉系統(tǒng)故障診斷準(zhǔn)確率方面,RVM和SVM都能取得不錯(cuò)的效果,RVM略高于SVM。RVM的訓(xùn)練時(shí)間要比SVM長,這是由于RVM在計(jì)算過程中要進(jìn)行大量的迭代,因此RVM模型的訓(xùn)練時(shí)間比較長,但在實(shí)際的工程應(yīng)用中,故障診斷模型都是提前訓(xùn)練好的,并不會(huì)影響故障診斷的效率。RVM有著比SVM更短的測(cè)試時(shí)間,說明RVM的分類速度快,泛化能力強(qiáng)。更重要的是,RVM的相關(guān)向量的個(gè)數(shù)只有11個(gè),遠(yuǎn)遠(yuǎn)少于SVM的支持向量的個(gè)數(shù),這說明RVM故障診斷模型的稀疏性好,在大樣本數(shù)據(jù)時(shí)也能取得良好的效果。
5 結(jié)束語
針對(duì)火電廠制粉系統(tǒng)故障類別多,難以通過故障征兆判斷故障原因的問題,本文提出一種基于鄰域粗糙集和RVM的故障診斷方法,不僅解決了經(jīng)典粗糙集在離散化時(shí)的數(shù)據(jù)損失問題,而且減少了測(cè)試時(shí)間,大大提高了故障診斷準(zhǔn)確率,對(duì)于實(shí)際工業(yè)過程中制粉系統(tǒng)的故障診斷具有一定的啟示作用。
參考文獻(xiàn)
[1]錢虹,茅大鈞,葉建華,等.火電廠磨煤機(jī)出口溫度異常分析和故障診斷系統(tǒng)[J].自動(dòng)化儀表,2009(7):22-24.
[2]王禹新,牛玉廣.基于專家系統(tǒng)的制粉系統(tǒng)故障診斷的研究[J].儀器儀表與分析測(cè),2010(3):1-3.
[3]劉定平,葉向榮,陳斌源,等.基于核主元分析和最小二乘支持向量機(jī)的中速磨煤機(jī)故障診斷[J].動(dòng)力工程,2009(2):155-158.
[4]陳斌源,朱軍.基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的中速磨煤機(jī)故障診斷[J].發(fā)電設(shè)備,2011,25(5):323-326.
[5]費(fèi)樹岷,李延紅,柴琳.基于RSPNN的制粉系統(tǒng)故障診斷[J].控制工程,2012,19(3):412-415.
[6]SHEN L,TAY F,QU L,et al.Fault diagnosis using rough setstheory[J].Compute Ind,2000,43(1):61-72.
[7]王國胤,姚一豫,于洪.粗糙集理論與應(yīng)用研究綜述[J].計(jì)算機(jī)報(bào),2009,32(7):1229-1245.
[8]TIPPING M E.Sparse bayesian learing and the relevancevector machine[J].Journal of Machine Learing Research,2001,1(3):211-244.
[9]張亞男,楊慧中.基于RVM組合核優(yōu)化的軟測(cè)量模型研究[J].系統(tǒng)仿真學(xué)報(bào),2018(1):272-277.
[10]胡清華,于達(dá)仁,謝宗霞.基于鄰域粒化和粗糙逼近的數(shù)值屬性約簡(jiǎn)[J].軟件學(xué)報(bào),2008,19(3):640-649.
[11]江峰,王莎莎,杜軍威,等.基于近似決策嫡的屬性約簡(jiǎn)[J].控制與決策,2015,30(1):65-70.
[12]盧錦玲,繩菲菲,趙洪山.基于相關(guān)向量機(jī)的風(fēng)機(jī)齒輪箱故障診斷方法[J].華北電力大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,44(2):91-96.
[13]PSORAKIS I,DAMOULAS T,GIROLAMI M A.Multiclassrelevance vector machines:an evaluation of sparsity andaccuracy[J].CEEI:Transactions on Neural Networks,2010,21(10):1588-1598.
[14]薛寧靜.多類支持向量機(jī)分類器對(duì)比研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2011,32(5):1792-1795.
[15]樊帥,肖軍.鍋爐制粉系統(tǒng)故障診斷方法[J].熱力發(fā)電,2015,44(2):13-17,23.
(編輯:商丹丹)