許紅義
(北京十三陵蓄能電廠,北京市 102200)
常規的水電機組故障診斷與推理系統需要足夠的故障知識來支撐,而水電機組系統復雜、電站參數各異、機組型式也各不相同,有些故障機理目前也尚不清楚。因此現階段要建立全面的水電機組故障診斷知識庫非常困難。而故障樣本的缺失,導致基于知識的水電機組故障診斷和專家系統很難在實際應用中起到應有的作用,也嚴重制約了診斷理論方法在水電工程中的應用與發展。
針對現階段水電機組故障樣本少,但電站已經安裝了大量機組狀態監測設備的實際情況,如何利用其長期的監測數據,預測和避免故障的發生,并指導機組檢修,是水電行業狀態監測與故障診斷技術研究與應用面臨的一個重大挑戰。而基于統計學的新異類檢測(Novelty Detection)方法,可以充分利用機組監測數據,通過檢驗新的數據對已知樣本的偏離程度,來判斷機組是否發生了異常,從而使得小故障樣本的水電機組故障診斷與壽命預估成為可能。
水電機組“故障”表現可能多種多樣,但其“正常”狀態卻是有限的,健康樣本也易于采集收集和健全。這一診斷理念側重于設備運行狀態的實時健康診斷,重點在于監測異常和預測異常,而不是過多的去查找和分析發生故障的原因,與現有的故障診斷方法有很大的差異。根據機組狀態監測信息,判定機組運行狀態是否正常,一旦出現異常,可啟動系統智能診斷,對于系統無法診斷的故障,可采用人工輔助診斷、專家協同會診,甚至停機檢查、拆卸檢查、專項試驗等手段來完成故障分析。鑒于水電機組實際運行中,出現的故障概率較小,基于該診斷理念開發的診斷系統工程實用性很強,且系統具備實時健康診斷和量化的性能退化趨勢預測功能,既能實時監測異常,又能預測異常,可滿足現階段的工程應用需求。
因此,本文通過新異類檢測方法中的健康樣本模型與機組狀態監測系統的結合,提出一套健全的基于水電機組健康模型的監測診斷方法來實現機組的健康診斷。該診斷方法側重于設備運行狀態的實時評估,而不過多的關注故障原因和機理等因素,通過監測設備狀態是否存在異常及其嚴重程度,再結合故障推理或其他輔助手段來完成故障分析。
高斯閾值法屬于密度估計方法的一種,其基本原理是估計出樣本集的概率分布函數P(x),并設定一個密度閾值,當測試樣本的所在區域的密度高于該閾值時,判定其為正常,否則判定為異常。設x為水輪機狀態監測系統的某振動信號(上機架Y向振動)的統計特征,顯然他是隨機變量,故樣本x的特征值x服從高斯分布,x的均值為μ,標準差為δ,根據切比雪夫不等式,對于任意實數e>0,有式(1)成立:

定義其帶寬系數k>0,并令e=kδ,則式(1)可以表示為:


圖1 高斯分布對應不同的標準差的范圍

對狀態監測系統而言,其狀態數據一直處于實時更新中,而根據系統相關性,近期的狀態數據更能反映機組真實的健康狀態,因此,為了保證健康樣本的有效性和自學習能力,這里采用滑動計算的自適應高斯閾值法。
對于特征序列xi,訓練樣本集將在xi中滑動,假設訓練樣本集時間長度定為T,在t-1時刻,訓練樣本集xi為當前的xi-1到前推T時間長度的樣本xt-T,即訓練樣本集為:{xi,i=t-T,…,t-1}。這時高斯分布的均值μ、標準差δ和高斯密度閾值C分別為[1]:

而在t時刻,原訓練樣本中的xt-T刪除,同時加入當前時刻t的樣本xt,更新樣本集為{xi,i=t-T+1,…,t},其高斯分布的均值μ、標準差δ和高斯密度閾值C分別為:

在水電站安裝實施的水電機組狀態監測系統中,實時保存了機組運行的大量監測數據,而在機組安裝初期,或過去一段機組運行狀態正常的區間內(可以在機組檢修或歷史數據分析中得到驗證),可以認為這些歷史數據,能夠表征機組的健康狀態,換言之,可以認為這些數據是機組健康運行時的狀態信息。那么通過設定不同的閾值和統計限值,則可以對機組發生狀態突變或超出預設限值時進行預警,起到異常檢測的效果。
在水電機組運行狀態中,有功功率和工作水頭是非常重要的兩個工況信息,因此本文將綜合機組工況參數的變化(這里的有功功率也可換成轉速、導葉開度等工況參數),建立機組運行狀態的全工況網格,每一網格中對應該特定工況下采集的某測量信號的大量歷史數據,采用高斯閾值法得到其高斯密度閾值,作為特征參數,從而建立水電機組健康狀態樣本模型。而自適應高斯閾值法的引入,則使得該健康樣本模型具有自學習能力,能夠隨著時間的發展而不偏離真實的健康樣本特征。其具體步驟如下:
(1)確定機組運行健康狀態,選取健康運行區間的數據。制定選取機組運行狀態歷史數據的依據,選取機組無信號報警和數據超限的運行時間段,提取某信號的歷史特征值,以及對應的水頭、工況值,作為機組健康狀態的特征序列。
這里采用某大型混流式水電機組(額度功率70萬kW)正常運行一年的實際監測數據(按每10分鐘取均值,每測點約5.2萬特征值),選用在穩態工況下其上機架X向垂直振動峰峰值,建立健康樣本模型,并驗證機組的異常檢測有效性。圖2為機組振動、有功數據趨勢圖。
(2)劃分機組工況網格。根據有功功率的范圍,結合數據采集和落在相應工況點的密度,確定樣本模型的最小工況網格。如果最小工況網格劃分過密,機組在部分過渡過程工況下運行時間較短,則有可能該工況網格內測點的樣本值較少,無法計算有效的高斯密度閾值;如果最小工況網格劃分過大,則無法準確反映機組該某工況下的運行健康特征。圖3為機組360天有功值分布直方圖。
(3)計算每個網格內的測量信號特征值的高斯密度,建立機組健康樣本模型。對落在網格內部的大量特征序列值,進行高斯密度閾值計算,得到閾值范圍通過對大量網格的統計計算,得到機組健康樣本模型Ct[包括上下閾值

圖2 機組振動、有功數據趨勢圖(360天5萬數據點)

圖3 360天有功值分布直方圖

圖4 概率分布檢驗圖
通過選取穩態工況網格內[696.89,702.21]MW的數據,進行直方圖檢驗,并通過matlab jbtest函數得到分布概率檢驗圖,且得到測點均值18.2um,上下閾值采用3δ即99.87%置信度區間值為[15.4,21.0]。圖4為概率分布檢驗圖。
(4)引入自適應高斯閾值法,使樣本模型具備自學習能力。在同一工況網格中,如果有新的實時監測數據出現,則采用滑動訓練該網格內樣本集的方法,實現樣本模型Ct隨數據的更新,從而更接近機組真實的運行狀態。
本文對某電站機組進行了長期的監測數據統計分析,確認了其振動特征值存在的正態分布規律,并利用自適應高斯閾值法進行滑動更新,能夠實現報警限值之外的異常判斷與分析。由于采用了99.87%的置信度區間報警閾值,可以保證絕對大部分情況下的異常識別和報警。另外,由于采用了網格劃分,能夠以網格形式進行報警統計閾值劃分,能夠為機組狀態監測和故障診斷提供數據依據和有效的保障。
[1] 胡雷. 面向飛行器健康管理的新異類檢測方法研究[D].國防科技大學.2010:56-57.
[2] 劉曉亭,馮輔周.水電機組運行設備監測診斷技術及應用[M].北京:中國水利水電出版社.2010.
[3] 陸春月,王俊元.機械故障診斷的現狀與發展趨勢[J].機械管理開發,2004.12(6).
[4] 馬宏忠. 電機狀態監測與故障診斷[M].北京:機械工業出版社.2008.