郗 濤,王 博,吳賢慧,王莉靜,張建業(yè)
(1.天津工業(yè)大學(xué) 機械工程學(xué)院,天津 300387;2.天津城建大學(xué) 控制與機械工程學(xué)院,天津 300384)
隨著水輪機、渦輪發(fā)動機、離心機等流體旋轉(zhuǎn)設(shè)備的廣泛應(yīng)用,相應(yīng)的設(shè)備運行與維護也越來越受重視,目前各大企業(yè)為了降低運維成本,相繼建立了基于物聯(lián)網(wǎng)的設(shè)備運行實時監(jiān)控系統(tǒng),但只能對關(guān)鍵參數(shù)進行在線監(jiān)測,無法對設(shè)備運行的可靠性進行評價。因此研究準確高效的設(shè)備在線運行可靠性評價方法,實現(xiàn)準確的可靠性預(yù)測,對于降低設(shè)備故障頻率、延長設(shè)備安全運行時間、指導(dǎo)預(yù)防性維修具有重要意義。
在設(shè)備運行可靠性評價領(lǐng)域,荊岫巖等[1]提出了一種基于比例協(xié)變量模型的抽水蓄能機組軸系運行可靠性評估方法,該方法需要獲取故障數(shù)據(jù)計算初始故障率,但是由于設(shè)備故障種類多,導(dǎo)致難以得到準確的初始故障率;URBAHA 等[2]提出一種基于聲發(fā)射監(jiān)測評估飛機燃氣輪機轉(zhuǎn)子葉片的可靠性評價方法,但該方法僅適用于故障發(fā)生后的維修期間,無法實現(xiàn)運行中的實時評估;陳衛(wèi)沖等[3]通過對軸承溫升、機組振動信號識別分析,實現(xiàn)泵站故障的原因分析與智能預(yù)警,完成了大型泵站運行狀態(tài)的評價;王紅軍等[4]對振動信號進行處理,構(gòu)建高維特征空間,計算當前狀態(tài)與正常狀態(tài)的特征子空間的夾角,來表征設(shè)備的運行可靠性。但是旋轉(zhuǎn)設(shè)備在實際運行中,振動源多且復(fù)雜,存在振動信號不易提取,安裝振動傳感器增加運維成本的問題[5]。
由于流體旋轉(zhuǎn)設(shè)備內(nèi)部流體物料的不固定性與不穩(wěn)定性,設(shè)備往往在多種工況條件下運行。而工況變化進一步導(dǎo)致電流、溫度等監(jiān)測參量的變化[6]。針對流體旋轉(zhuǎn)設(shè)備存在多工況運行的問題,本文提出分工況進行設(shè)備運行可靠性評價的方法。通過建立監(jiān)測數(shù)據(jù)、工況條件、運行狀態(tài)與系統(tǒng)可靠性之間的聯(lián)系,基于高斯混合模型(Gaussian Mixture Model,GMM)實現(xiàn)設(shè)備運行可靠性在線評價。
在不同環(huán)境溫度和不同負載情況下,基于傳感器采集的設(shè)備運行數(shù)據(jù)存在較大差異,若只考慮單一工況,勢必影響可靠性評價的準確性,為了提高可靠性評價的準確性、可靠性、普適性,故進行工況劃分。由于流體旋轉(zhuǎn)設(shè)備無法簡單的通過重力傳感器實現(xiàn)工作負載識別,故本文通過設(shè)備歷史運行數(shù)據(jù)采用聚類的方法實現(xiàn)工況劃分。
分別使用基于密度的空間聚類算法(DBSCAN)和基于快速搜索和發(fā)現(xiàn)密度峰值的聚類算法(DPC)在公開數(shù)據(jù)集上進行對比分析。本文采用C-MAPSS 公開數(shù)據(jù)集中的test_FD002數(shù)據(jù)作為測試數(shù)據(jù)集進行聚類分析,該數(shù)據(jù)集由美國航天航空局創(chuàng)建,模擬了渦輪風扇發(fā)動機的實際退化過程,包括6 種工況下21 個傳感器參數(shù)信息,最后采用3 種常用的聚類性能評價指標評價算法性能,選擇聚類性能較好的算法應(yīng)用于設(shè)備的工況劃分。
DBSCAN 是一種能夠很好地識別噪聲點,可以實現(xiàn)快速聚類[7]。該算法主要根據(jù)設(shè)定的鄰域半徑(Eps)和樣本在鄰域半徑內(nèi)包含的最小鄰域點個數(shù)(Minpts)實現(xiàn)聚類。但是該算法存在鄰域半徑和最小領(lǐng)域點個數(shù)難以確定,且參數(shù)對聚類效果特別敏感的缺點。
DPC 算法是由ALEX RODRIGUEZ 等[8]于2014 年提出,該聚類算法不需要提前指定聚類個數(shù),能夠自動發(fā)現(xiàn)聚類中心點,實現(xiàn)高效聚類。對于每一個數(shù)據(jù)點,都可以計算它的局部密度ρi和該點距離高密度點的最小距離δi,其局部密度定義為:
式中,χ(·)為邏輯判斷函數(shù);dij為xi與xj之間的距離;dc為截斷距離。
δi是通過計算數(shù)據(jù)點xi與其他更高密度點的最小距離,δi定義為:
使用聚類評價指標對上述2 種聚類算法在公開數(shù)據(jù)集C-MAPSS 上進行聚類效果評價。已知數(shù)據(jù)集X={x1,x2,…,xn},真實類標簽為U={U1,U2,…,UT},聚類劃分結(jié)果為V={V1,V2,…,VC},采用聚類精度(ACC)、調(diào)整互信息指數(shù)(AMI)、調(diào)整蘭德系數(shù)(ARI)評價聚類性能為:
式中,N1為正確聚類的樣本數(shù);N為總樣本數(shù);H(U),H(V)分別為U和V的熵;MI(U,V)為互信息;E{MI(U,V)}為互信息的期望值;a為在真實和試驗情況下都屬于同一個簇的點對數(shù)目;b為在真實情況下屬于同一個簇而在試驗情況下不屬于同一個簇的點對數(shù)目;c為在真實情況下不屬于同一個簇而在試驗情況下屬于同一個簇的點對數(shù)目;d為在真實和試驗情況下都不屬于同一個簇的點對數(shù)目[9]。
借助公開數(shù)據(jù)集對上述2 種聚類算法的聚類結(jié)果進行對比分析,得到聚類效果見表1。

表1 聚類效果分析Tab.1 Clustering effect analysis
可以發(fā)現(xiàn),DPC 具有更高的聚類精度,故本文選擇DPC 聚類方式對設(shè)備運行工況進行劃分。
為了實現(xiàn)對設(shè)備運行工況的實時在線識別,本文選擇XGBoost 算法[10]對含工況類別的歷史數(shù)據(jù)集進行訓(xùn)練,構(gòu)建工況識別模型。
XGBoost 樹模型以CART 作為基分類器,通過Gradient Boosting 實現(xiàn)多棵CART 樹組合的集成學(xué)習(xí)算法[11-12],XGBoost 的模型定義為:
式中,fK(xi)表示第K棵決策樹。
XGBoost 的目標函數(shù)定義為:
式中,L(y i)為損失函數(shù);Ω(fk)為正則項;γ,λ為超參數(shù)、控制懲罰程度;T為葉節(jié)點個數(shù);ω為每個葉子節(jié)點的權(quán)重分數(shù)。
為了降低評價模型的復(fù)雜度,避免引入冗余特征,故進行特征選擇,挑選出與設(shè)備運行狀態(tài)更具相關(guān)性的特征,構(gòu)建合理的特征向量作為評價指標。首先選用ReliefF 算法計算每個特征對設(shè)備運行狀態(tài)的重要度,保留貢獻度大的特征,為了避免強相關(guān)性特征對模型準確率的影響,利用Pearson 算法計算每個特征之間的相關(guān)性,針對具有強相關(guān)性的2 個參量,只保留重要度較大的參量,去除冗余特征。
高斯混合模型[13-15]是一種無監(jiān)督學(xué)習(xí)算法,其原理是通過多個高斯概率密度函數(shù)的線性組合表示數(shù)據(jù)的空間分布,可以實現(xiàn)任意類型分布數(shù)據(jù)的有效擬合。
現(xiàn)假設(shè)數(shù)據(jù)樣本集合D中包含m維樣本特征,n個樣本數(shù)據(jù),第i個樣本Xi={x1,x2,…,xm},各樣本均符合高斯分布,某一時刻樣本觀測值Xi的概率表示為:
式中,P(x)為高斯混合模型的概率密度函數(shù);ωk,μk,σk分別為第k個樣本的權(quán)重、均值、協(xié)方差,且為高斯概率密度函數(shù)。
利用公開數(shù)據(jù)集中某一工況下正常運行階段的數(shù)據(jù)進行訓(xùn)練,得到三維基準高斯混合模型如圖1 所示。

圖1 基準高斯混合模型的三維Fig.13 d graph of the datum Gaussian mixture model
將經(jīng)特征選擇后的設(shè)備實時監(jiān)測數(shù)據(jù)作為一個特征向量,基于馬氏距離來度量當前特征向量偏離基準高斯混合模型的距離,當前特征向量與第個高斯模型馬氏距離表示為:
則特征向量與高斯混合模型的偏離程度表示為:
為更直觀地了解當前設(shè)備的運行可靠性程度,將馬氏距離映射到[0,1]之間作為設(shè)備運行可靠性評價指數(shù)(Operational Reliability Index,ORI),其中,可靠性指數(shù)越接近于1 表示設(shè)備運行越可靠。
式中,α為調(diào)整系數(shù),取α=0.015。
為了驗證上述所提方法的有效性,以礦用離心機設(shè)備為實例進行分析,離心機是運用高速旋轉(zhuǎn)離心原理實現(xiàn)固液分離的裝置[16]。針對離心機載荷變化明顯,存在多種運行工況的問題,本文分工況實現(xiàn)對離心機設(shè)備的運行可靠性評價[17]。
本文以北京某礦用離心機設(shè)備生產(chǎn)廠商所生產(chǎn)的WL1200 型臥式振動離心機作為研究對象,利用離心機遠程監(jiān)控平臺采集設(shè)備實際運行數(shù)據(jù)進行驗證,其中包括正常運行狀態(tài)下的數(shù)據(jù)和故障數(shù)據(jù),部分監(jiān)測特征參量見表2。

表2 監(jiān)測參量Tab.2 monitoring parameters
本文對歷史數(shù)據(jù)集采用DPC 算法進行聚類分析,分別得到圖2 的決策和圖3 的二維可視圖,可以看出離心機歷史數(shù)據(jù)集被劃分為5 種典型工況。

圖2 離心機數(shù)據(jù)集上得到的決策Fig.2 Decision diagram obtained from centrifuge dataset

圖3 離心機數(shù)據(jù)集上得到的二維聚類效果Fig.3 Two-dimensional clustering effect graph on centrifuge dataset
將聚類后的數(shù)據(jù)點還原到原來的數(shù)據(jù)空間,分別得到工況1~5 的工況情況見表3~7。

表3 礦用離心機工況1 模型Tab.3 Working condition 1 model of mining centrifuge

表4 礦用離心機工況2 模型Tab.4 Working condition 2 model of mining centrifuge

表5 礦用離心機工況3 模型Tab.5 Working condition 3 model of mining centrifuge

表6 礦用離心機工況4 模型Tab.6 Working condition 4 model of mining centrifuge

表7 礦用離心機工況5 模型Tab.7 Working condition 5 model of mining centrifuge
為了驗證XGBoost 算法在離心機工況識別上的準確率,隨機提取歷史運行數(shù)據(jù)作為測試集并帶入到訓(xùn)練好的模型中進行測試,測試結(jié)果如圖4 所示。

圖4 工況預(yù)測結(jié)果分析Fig.4 Analysis of condition forecasting results
由圖中可以看出,使用該算法進行工況識別具有較高的準確率。
使用ReliefF 算法計算每個特征對離心機運行狀態(tài)的重要度,得到24 個參量的平均重要度見表8。

表8 監(jiān)測參量的平均重要度Tab.8 Average importance of monitoring parameters
由于ReliefF 算法無法有效去除冗余特征,本文選擇保留重要度大于0.5 的特征參量,然后使用Pearson 算法去除冗余參量,將Pearson 相關(guān)系數(shù)的閾值設(shè)定為0.9,若相關(guān)性超過0.9,則只保留重要度較高的參量。經(jīng)過上述特征選擇,最終選擇主電機A 相電流、振動電機1A 相電流、振動電機2A 相電流、主電機繞組溫度,振動電機1 溫度、振動電機2 溫度、油泵電機溫度、主振彈簧溫度、篩籃位移、潤滑油溫度、主軸轉(zhuǎn)速、主軸溫度、前后軸承溫度共14 個參量作為評價指標。
在設(shè)備正常運行數(shù)據(jù)集中分別提取5 種不同運行工況下的歷史運行數(shù)據(jù),利用上述14 個狀態(tài)參量分別構(gòu)建5 種不同工況下的運行可靠性基準模型。為實現(xiàn)運行可靠性評價,將實時在線采集的14 個狀態(tài)參量作為一個特征向量,對該特征向量進行工況識別后再將此特征輸入到對應(yīng)工況下的基準高斯混合模型中,測量該特征與基準模型的馬氏距離,再將馬氏距離映射到[0,1]之間得到運行可靠性指數(shù)(ORI)。
為了驗證本文所提算法能夠有效反應(yīng)設(shè)備的劣化過程,取3 臺設(shè)備從投入運行至第一次維修之前的運行數(shù)據(jù)。由于數(shù)據(jù)量太大,每間隔10 h 提取一條運行數(shù)據(jù),構(gòu)成測試數(shù)據(jù)集進行驗證。計算得到設(shè)備運行期間的運行可靠性指數(shù)變化趨勢如圖5 所示。

圖5 設(shè)備全壽命周期的運行可靠性指數(shù)Fig.5 ORI of equipment life cycle
隨著設(shè)備運行時間的增加,運行可靠性指數(shù)不斷下降,且設(shè)備故障點越多,運行可靠性指數(shù)越低,符合實際。
為了進一步驗證故障點個數(shù)與運行可靠性的關(guān)系,分別提取工況1,2,4 下的正常運行數(shù)據(jù)、含有1 種故障、含有2 種故障和含有3 種及以上故障的設(shè)備運行數(shù)據(jù),得到對應(yīng)的運行可靠性指數(shù)ORI。對應(yīng)工況1,得到各運行條件下的ORI分布,如圖6 所示。

圖6 工況1 不同運行條件下的ORIFig.6 ORI in different operating conditions of condition 1
對應(yīng)工況2,得到各運行條件的ORI,如圖7所示。

圖7 工況2 不同運行條件下的ORIFig.7 ORI in different operating conditions of condition 2
對應(yīng)工況4,得到各運行條件的ORI,如圖8所示。
圖6~8 分別示出了工況1、工況2、工況4 下,故障點個數(shù)與運行可靠性指數(shù)的關(guān)系,可以看出隨著設(shè)備故障點數(shù)的增多,設(shè)備運行可靠性不斷降低。對5 種工況不同運行條件下的運行可靠性指數(shù)分布情況進行統(tǒng)計,得到不同工況不同運行條件下的ORI分布見表9。

表9 不同工況運行條件下的ORI 分布Tab.9 ORI distribution under different operating conditions
為了建立統(tǒng)一的評價標準,對表9 作進一步分析,按正常運行狀態(tài)、含1 種故障狀態(tài)、含2 種故障狀態(tài)、含3 種及以上故障狀態(tài)劃分評價等級,依次為高可靠性階段、低可靠性階段、警告和危險階段。以工況內(nèi)取中值和工況間取均值的方法建立表10 所示的整機運行可靠性評價標準。
根據(jù)表10 可知,當整機設(shè)備運行可靠性指數(shù)小于0.857 時,可以認為設(shè)備開始出現(xiàn)故障特征,離心機開始進入劣化狀態(tài),工作人員可以對離心機進行適當維修。

表10 離心機設(shè)備整機運行可靠性評價標準Tab.10 Standard for reliability evaluation of centrifuge equipment
為了驗證評價準確率,取正常狀態(tài)下的運行數(shù)據(jù)并計算運行可靠性指數(shù),得到ORI分布如圖9 所示??梢园l(fā)現(xiàn),設(shè)備在正常運行狀態(tài)下僅有少數(shù)樣本點的ORI指數(shù)低于0.857,通過統(tǒng)計發(fā)現(xiàn)評價準確率達到98%以上。

圖9 正常樣本點的ORI 分布Fig.9 ORI distribution of normal samples
有學(xué)者針對礦井通風機的運行可靠性提出了基于PCA-MSET 的運行可靠性評價方法,對13個監(jiān)測變量降維后建立可靠性評價模型,利用歐式距離計算殘差得到可靠性指標[18]。但是該方法僅考慮了單工況運行情況,若將該方法用于多工況運行的設(shè)備,則會導(dǎo)致評價不準確。基于上述方法,不再考慮多工況問題,使用離心機處于健康狀態(tài)下的運行數(shù)據(jù)建立評價模型并進行可靠性評價,得到圖10 示出的設(shè)備ORI分布。

圖10 僅考慮單工況下的ORI 分布Fig.10 ORI distribution under single working condition
由圖中可以看出,基于PCA-MSET 的單工況運行可靠性評價模型,采用本文所用的離心機處于健康狀態(tài)下的運行數(shù)據(jù)進行仿真,評價結(jié)果不準確且存在明顯分層現(xiàn)象,也驗證了工況類別對設(shè)備運行可靠性評價存在較大影響。因此本文所提方法在處理多工況運行的設(shè)備上效果更好。
本文依托北京某公司離心機設(shè)備遠程監(jiān)控與運行可靠性評價項目,驗證本文所提方法的有效性,將其集成到遠程監(jiān)控系統(tǒng)中并應(yīng)用到選煤廠的離心機設(shè)備上。
首先采集離心機設(shè)備運行數(shù)據(jù)并傳輸?shù)竭h程監(jiān)控系統(tǒng)中,現(xiàn)場設(shè)備PLC 通過傳感器采集得到設(shè)備運行狀態(tài)參數(shù),通過DTU 將數(shù)據(jù)上傳至遠程監(jiān)控系統(tǒng)中。大型選煤廠一般將所有信號接回集控中心,小型選煤廠為節(jié)省布線成本,一般會在現(xiàn)場進行數(shù)據(jù)采集,現(xiàn)選用1 臺WL1200 型臥式振動離心機和現(xiàn)場電氣控制柜,完成設(shè)備控制、數(shù)據(jù)采集和數(shù)據(jù)遠程傳輸。
離心機遠程監(jiān)控系統(tǒng)包括多個功能模塊,離心機的部分重要運行數(shù)據(jù)可以直觀得到。
使用Python 語言對運行可靠性評價相關(guān)算法完成編寫后,將其嵌入到遠程監(jiān)控系統(tǒng)后臺,通過程序調(diào)用實現(xiàn)對離心機設(shè)備的運行可靠性評價,選擇界面左側(cè)“設(shè)備信息管理”下的“運行可靠性評價”選項,選擇對應(yīng)的項目便可以查看該項目下所有設(shè)備的運行可靠性指數(shù),同時運行狀態(tài)異常的特征數(shù)據(jù)點也會顯示在對應(yīng)的設(shè)備上。
本文選取1 臺由于主電機溫度過高發(fā)出預(yù)警的設(shè)備進行驗證。該設(shè)備在2020 年10 月12 日17 時發(fā)出主電機溫度報警,圖11 示出了故障前、后主電機溫度的變化曲線。

圖11 主電機繞組溫度變化曲線Fig.11 Temperature change curve of main motor winding
得到故障發(fā)生前、后的設(shè)備ORI的變化曲線,如圖12 所示。

圖12 ORI 變化曲線Fig.12 ORI curve
由圖12 可以看出,大概在17:00 左右溫度超出閾值范圍,觸發(fā)報警,由圖13 可以發(fā)現(xiàn),隨著繞組溫度偏離正常溫度區(qū)間,設(shè)備ORI逐漸減小,大約在13:30 左右,ORI已經(jīng)低于正常運行狀態(tài)。由此可以看出,本文所提方法可以有效地實現(xiàn)設(shè)備運行可靠性的評價,可以早于閾值報警發(fā)出故障預(yù)警,更早的識別出設(shè)備性能力惡化狀況,起到提早發(fā)現(xiàn)故障的作用。
(1)針對流體旋轉(zhuǎn)機械運行可靠性的問題,提出了一種基于GMM 的運行可靠性的評價方法。
(2)以離心機設(shè)備為例進行實例分析,考慮到離心機運行過程中存在多種工況,為了提高評價模型的適用性和評價準確率,進行分工況處理,共得到5 種典型工況;為了降低模型的復(fù)雜度,提高效率,進行特征選擇,從24 個監(jiān)測參量中選擇14 個特征參量作為評價指標參與高斯混合模型構(gòu)建。最后基于馬氏距離得到ORI,結(jié)果表明,當ORI低于0.857 時,便可認為離心機設(shè)備進入低可靠性運行階段,且評價準確率達到98%以上。
(3)在實際應(yīng)用中,本文所提方法可以提前預(yù)測設(shè)備的劣化狀態(tài),有效地幫助設(shè)備管理人員實時掌握當前設(shè)備的運行情況,及時做出維修決策。