蒲健飛,任少君,周東陽,曹 軍,范 偉,司風琪
(1.東南大學 能源熱轉換及過程測控教育部重點實驗室,南京 210096;2.西安熱工研究院有限公司,西安 710054)
隨著信息化的發展,火電機組自動化程度越來越高,對電站設備的安全性和可靠性提出了更高的要求。基于數據驅動的故障監測與診斷方法具有數據代表性好和方法通用性強等優點,受到了學術界和工業界的廣泛關注。基于數據驅動的故障監測和診斷方法主要分為兩類:一類是基于有標簽數據的有監督方法,如人工神經網絡(ANN)[1]、支持向量機(SVM)[2]等;另一類是基于無標簽數據的無監督方法,如多元統計方法(MSPM)[3]和高斯混合模型(GMM)[4]等。有監督故障診斷方法對于難以獲得大量故障工況樣本的過程具有較大的局限性,并且對未知故障類型診斷能力差;無監督故障診斷方法通過設備正常運行數據建立故障監測模型并計算故障限值,當統計指標超過限值時進行故障預警。無監督故障診斷方法因具有通用性強、建模樣本易獲得等優點在工業領域得到了廣泛的使用。
無監督故障診斷方法中基于MSPM的故障診斷算法(如主成分分析(PCA)[5]、偏最小二乘(PLS)算法[6])通過計算故障監測指標平方預測誤差Q和T平方(T2)進行故障監測,需要設備運行數據服從高斯分布才能保證監測的限值的有效性[7]。在實際熱工過程中,隨著負荷的變化,設備運行模態(工況)隨之發生變化,使得設備運行數據呈高斯混合分布。針對運行數據呈高斯混合分布的多模態過程[8],GE Z Q等[9]通過模糊C均值算法對訓練樣本進行分割并建立多個子模型對多模態過程進行監測,該方法在線監測時計算量大,降低了在線監測效果。YU J等[10]提出一種基于GMM的多模態過程故障監測方法,并通過基于概率的全局貝葉斯推理作為監測指標進行故障監測,但傳統GMM受初始參數的影響容易陷入局部最優解。YANG M S等[11]通過在期望最大化(EM)算法目標函數中加入信息熵的方式提出魯棒高斯混合模型(RGMM)算法,實現了高斯成分數的自適應更新,避免模型參數陷入局部最優。當監測到故障發生時需要進一步進行故障變量定位,傳統貢獻圖通過計算故障統計量貢獻進行故障分離,由于拖尾效應[12]的影響,造成分離結果誤診率高。
針對歷史數據呈高斯混合分布的多模態熱工過程,筆者提出一種融合監測指標的引力搜索算法(GSA)[13]故障分離方法。首先,使用RGMM算法建立故障監測模型,監測到故障后計算故障樣本各變量的貢獻;其次,利用融合監測指標的GSA對潛在故障變量進行故障重構;最后,確定樣本中的故障變量。分別采用多模態數學算例和高壓加熱器(簡稱高加)作為研究對象,驗證該算法在多模態熱工過程的故障監測和診斷中的有效性。
設原始數據集X∈Rm×n(R為實數組成的矩陣)為C個模態的測量數據,X=[x1,x2,…,xm],其中:C為GMM成分數;m為樣本數量;n為變量數量;x為任意時刻觀測值。其概率密度函數p(x|θ)可以表示為:
(1)

第k個高斯成分的密度函數為:
(2)
式(2)中模型參數通過EM算法[14]進行迭代求解。
根據貝葉斯理論計算隱變量的過程如下。
(3)

調整系數β(0≤β≤1)可以定義為:
(4)
然后更新模型參數,即
(5)
(6)
(7)


(8)
(9)
RGMM算法計算流程見表1。

表1 RGMM算法計算流程
當設備發生故障時需要及時進行故障預警,防止故障進一步惡化。針對多模態過程,建立基于RGMM的故障監測模型并通過故障監測指標GBID和GBIP進行故障預警。
定義樣本點x對于第k個高斯成分的修正馬氏距離Dr為:
Dr[(x,Ck)|x∈Ck]=
(x-μk)T(vk+φI)-1(x-μk)
(10)
式中:φ為極小值,用于去除協方差矩陣的奇異性;I為單位矩陣。
樣本x屬于第k個高斯成分的后驗概率P(Ck|x)為:
(11)
全局監測指標GBIP定義為:
Dr[(x,Ck)|x∈Ck]}
(12)
選取置信度為γ,當GBIP>γ時,認為設備發生故障,反之,認為設備運行正常[10]。
基于局部馬氏距離的全局監測指標[15]GBID為:
(13)
GBID指標的限值L根據F分布[16]計算,計算公式為:
企業對于IPO的困惑,宋彬也給予了解讀。“新三板企業IPO始于2007年,受企業資質和IPO暫緩等因素的影響,歷年IPO數量分布不均。2016年前,新三板企業IPO數量較少,2017年以來,已成功IPO的新三板企業數量激增,其中2018年已達18家。”從新三板企業IPO情況來看,截至2018年9月30日,已有55家新三板企業成功過會,其中已有48家成功登陸A股市場。“新三板企業IPO板塊中,目前55家已過會的新三板企業中,有28家選擇登陸創業板,9家選擇登陸中小板,18家選擇登陸主板,符合新三板企業‘小而精’的總體特征。”
(14)
式中:L為置信度為γ時的GBID指標的限值;γ的取值通常為95%和99%;n和p分別代表樣本數量和變量數。當GBID≥L認為設備發生故障,反之則運行正常。
當故障監測指標超過限值時,表明設備發生故障,需要進一步進行故障分離,分離出故障發生的參數,定位故障變量。
基于重構的故障分離方法為根據故障變量通過測量值x找出對應的正常值x*,即單故障時為x*=x-s(p)fp,多故障時為x*=x-s(p)fp-s(q)fq。其中:s(p)、s(q)為故障變量;fp、fq分別為s(p)、s(q)對應的故障幅值。基于GSA重構的故障分離方法是通過找出故障變量和對應的故障幅值使故障監測指標達到最小值。
以GBID監測指標為例:
Dr[(x-sf),Ck]}
(15)
當GBID降到控制限以下時,表明s為真正的故障變量,f為對應的故障幅值。
GSA是一種源于萬有引力定律的啟發式智能優化算法,通過粒子位置的移動搜索空間中的最優位置,獲得優化問題的最優解,GSA具有收斂速度快、全局搜索能力強的優點[13]。
將故障重構轉化為最優解問題,選取重構故障變量集,當minGBID小于限值時,證明該變量集為故障變量,反之,證明該變量集并非真實的故障變量。

表2 基于GSA-RGMM算法故障重構流程
通過重構的方式進行故障分離需要先預設故障變量,再對故障變量進行重構實現故障分離,隨著維度的升高,變量組合會呈指數增長,計算量較大。為此,采用組合優化的思想是將故障變量逐個定位出來,計算出故障樣本在各變量的高斯混合貢獻,選取高斯混合貢獻最大的變量加入重構變量集,如果重構監測指標低于故障限值,則重構變量集即為真實故障變量,否則根據重構后的樣本更新高斯混合貢獻,選取其中貢獻最大的變量加入重構變量集,直至重構監測指標低于故障限值,輸出真實故障變量。
式(10)可以改寫為:
Dr[(x,Ck)|x∈Ck]=
(16)

(17)

(18)


圖1 基于GSA-RGMM算法的故障監測與診斷流程
為驗證提出的故障監測與分離方法的有效性,建立如下數值案例[10]:
(19)
式中:[e1,e2,e3]T為均值為0、方差為0.01的白噪聲;[s1,s2]T為服從高斯分布的數據源。
在數據源中設置如下3種分布狀態,分別表示不同的操作模態。
(1)分布1:s1=N(5,0.6);s2=N(20,0.7)。
(2)分布2:s1=N(10,0.8);s2=N(12,1.3)。
(3)分布3:s1=N(16,1.5);s2=N(30,2.5)。
由式(19)生成3 000組正常運行的數據作為訓練數據,其中3個模態各占1 000組,見圖2。

圖2 多模態仿真數據
故障模擬形式為:
xfault=x*+f
(20)
由式(19)生成正常工況樣本,并通過式(20)的方式進行故障仿真。
故障1:取500組模態1數據,歸一化后從第100組樣本開始,在變量1上加入幅值為0.3~0.5的偏差。
故障2:取500組模態2數據,歸一化后從第100組樣本開始,在變量2上加入幅值為0.004(k-100)的偏差,其中k為樣本序號。
故障3:隨機選取500組3個模態數據,歸一化后從第100組樣本開始隨機選擇2個變量分別加入幅值為0.8~1.0的偏差。
通過正常工況樣本訓練RGMM并通過GBIP和GBID對故障仿真數據進行監測。為證明RGMM算法的有效性,采用GMM算法和PCA算法對故障仿真數據進行監測,并與RGMM算法進行對比,結果見表3。

表3 故障監測準確率 %
由表3可以看出:在多模態過程中當故障幅度較小時,RGMM算法相比于PCA和GMM算法具有更強的敏感性,監測準確率更高。
當監測到故障后還需要進一步通過故障分離方法定位故障變量,判斷故障類型。采用故障診出率(FDR)和故障誤診率(FAR)這兩個評價指標對診斷結果進行評價[17]。有效的故障分離算法具有較高的故障診出率和較低的故障誤診率。
為驗證提出的故障分離算法效果,將所提方法與傳統貢獻圖(CP-PCA)、重構PCA(RB-PCA)和GMM算法的結果進行對比,結果見表4。在多模態過程中由于PCA算法的故障監測準確率較低,導致其故障診出率低于GSA-RGMM算法。當故障幅度增加時,受殘差污染的影響,CP-PCA和GMM算法誤診率高于GSA-RGMM算法,表明基于重構的 GSA-RGMM算法能有效降低故障誤診率。

表4 故障分離結果 %
高加作為火電機組回熱系統的重要組成部分,對保障火電機組的安全經濟運行具有重要作用。高加長期運行于高溫、高壓和變工況環境中,容易發生管路泄漏和積垢等故障,影響機組安全穩定運行。以某660 MW燃煤機組1號高加作為研究對象,采集2020年6月29日—7月4日高加相關測點數據(見圖3)。由圖3可以看出:受調峰影響,機組負荷呈白天高、夜晚低的趨勢,并且高加運行參數與負荷具有較強的相關性。

圖3 1號高加運行數據
1號高加運行參數概率密度分布見圖4。

圖4 1號高加運行參數概率密度分布
由圖4可以看出:高加運行參數呈高斯混合分布。采用穩態篩選算法[18]提取2 000組穩態運行數據建立基于RGMM、GMM和PCA算法的高加監測模型。為驗證算法多模態過程中的故障監測與分離的有效性,采用分段熱力計算方法建立高加故障仿真模型[19],該仿真模型涉及9個變量,分別為6個輸入變量(tsin、twin、pwin、h、pst、qmw)和3個輸出變量(Δt、θ、Dod),具體描述見表5。

表5 1號高加仿真模型變量名稱及范圍
選取800組穩態樣本作為測試樣本,并在201組樣本點處加入表6中所列故障。根據故障仿真結果和文獻[19]中的故障特征分析,得出模型故障類型與對應故障參數(見表6)。

表6 1號高加故障列表
通過不同監測模型得到高加故障的監測準確率,結果見表7。

表7 故障監測準確率 %
圖5和圖6分別為故障d、故障e監測結果圖。由圖5和圖6可以看出:RGMM算法相對于PCA算法和GMM算法具有更高的準確率。在高加建模過程中,RGMM算法在處理分布復雜的熱工過程數據時相比于GMM算法具有更強的魯棒性,并且模型精度更高。

圖5 故障d的故障監測結果

圖6 故障e的故障監測結果
監測到故障后再通過提出的GSA-RGMM算法進行故障分離,同時與基于PCA算法的CP-PCA、RB-PCA和GMM算法進行對比,故障分離效果比較見表8,圖7和圖8分別為故障d、故障e的故障分離結果,所提算法具有更高的故障診出率和較低的故障誤診率。

表8 故障分離結果 %

圖7 故障d故障分離結果

圖8 故障e故障分離結果
為提高多模態熱工過程故障監測與診斷準確性,采用RGMM算法建立故障監測模型,并使用兩個故障監測指標(GBIP和GBID)進行實時故障監測,當故障指標超過限值時表明設備發生了故障。提出GSA-RGMM算法分離相關故障參數。該方法先通過高斯混合貢獻法計算故障樣本各變量的高斯混合貢獻,根據貢獻大小逐步選擇變量加入重構變量集,直至基于GSA算法重構的監測指標低于故障限值,輸出故障變量,完成故障分離。
以多模態數值算例和某燃煤機組1號高加為研究對象,驗證該算法的有效性,結果表明:相比于PCA算法和傳統GMM算法,RGMM算法具有較高的故障監測準確率;同時,相比于CP-PCA、RB-PCA和GMM算法,GSA-RGMM算法能準確分離出故障變量,具有較高的故障診出率和較低的故障誤診率,表明該算法在多模態熱工過程故障監測與診斷中的有效性和可行性。