李東風,張紅芳
(南瑞集團(國網電力科學研究院)有限公司,南京 211106)
大數據已經成為一種新的自然資源,需要人們對其加以更加合理、高效、充分的應用,使之能夠給人類的生活工作帶來更大的效益和價值。大數據具有數據體量大、種類多、流動速度快、價值密度低等特點[1-3]。當前,水電站各專業自動化系統繁多,包括計算機監控系統、勵磁調節器、調速器、機組狀態監測系統等等,這些系統采集的數據類型很多、數據量很大,采集的數據包括設備實時運行參數和設備狀態參數,除了各自動化系統根據功能設計實現各自的功能,還有大量的采集數據并沒有得到充分應用。與此同時,水電站設備長期穩定、經濟、高效運行的需求要求我們防患于未然,必須從日常的設備運行數據中發現蛛絲馬跡,分析設備可能出現的狀況,找到問題所在,及時消除設備隱患[4]。
近年來,中國水電行業在設備數據分析與應用方面做了不少嘗試[5-8],不少水電站管理單位建立了所屬水電站的生產數據平臺,部分企業開展了針對性數據挖掘工作,智能化水電廠嘗試建立水電廠一體化平臺并開展廠內設備狀態分析工作。
水電站生產數據平臺是指基于現有的自動化系統建設的用于進一步數據分析的全廠性數據平臺。基于此數據平臺,我們可以深入地開展水電設備的狀態分析,達到防患于未然的目標。
建設水電站生產數據平臺,實現水電站各分區自動化系統之間的信息資源共享。水電站生產數據平臺應保證平臺數據是唯一的、準確的、實時的、全面的,確保數據質量[7];最終為實現設備狀態分析和高級決策提供基礎數據支持。水電站生產數據平臺應在全廠信息模型的基礎上,建立跨系統的生產數據交換平臺,滿足進行進一步數據分析的需要。
作為設備狀態分析的數據源,數據質量是關鍵,水電站生產數據平臺的數據應進行一系列處理才能保證數據質量。
水電站的生產數據平臺并不直接采集來自于設備的信息,而是在全廠自動化系統之上,構建一個橫跨多個安全分區的數據平臺。通過與水電站各個自動化系統通信獲得設備的信息。水電站生產數據平臺必須采用合理的網絡架構和實時的通信模式才能獲得水電站全面的、實時的數據。設計時:① 要保證數據的唯一性和全面性,設備數據分析需要的所有數據不僅要齊全,而且要唯一,尤其是機組功率、定子電流等重要數據只能有一個數據源;② 生產數據平臺在獲取數據測值的同時,必須同時獲取數據的品質,品質為壞的數據直接剔除,同時,測值明顯異常的數據(例如測值超過變送器測量范圍的數據)直接剔除,避免影響設備狀態分析的結果。
生產數據存儲于歷史數據庫之后,需要進一步對該歷史數據進行樣本篩選。由于歷史數據庫中的歷史數據是經過采集和處理后得到的,存在由于儀器不穩定等造成的誤差或錯誤數據。因此在進行存儲和篩選時要進行壞數據的剔除。誤差大體可分為系統誤差、隨機誤差和粗大誤差3類。這3類誤差中,粗大誤差對測量結果的影響最大[9]。
粗大誤差的判別與剔除有4種比較常用的準則,依次是拉伊達準則、格拉布斯準則、肖維勒準則和狄克遜準則,每種判別準則有其處理的方法。最常用的是拉伊達準則。
機組狀態監測數據是分析機組性能的關鍵數據,包括有效值、平均值、峰-峰值等,其中機組振擺峰-峰值反映了機組振擺幅度大小,直觀體現了機組的實時穩定性狀態。由于機組振擺信號頻率豐富、存在系統誤差、外部干擾,機組振擺峰-峰值處理是機組狀態監測特征數據的關鍵,這里僅討論機組振擺峰-峰值的處理方法。目前振擺峰-峰值的計算方法主要有4種:“置信度(Conf)”、“單周峰-峰值平均法”、“平均時段法”和“RMS等效峰-峰值(RMPpp)”。這里采用的是置信度(conf97)融合平均時段法[10]。
置信度(conf97)融合平均時段法的具體算法是:選擇包含主頻成分的多個轉頻周期內的數據作為一個分區,以97%置信度(conf97)計算該分區的峰-峰值,并對待分析數據的所有分區計算平均值,作為峰-峰值。
在進行振擺峰-峰值計算時,置信度法可以有效消除系統誤差和外部干擾,但該方法沒有考慮數據分區,峰-峰值的計算值與實際值存在較大偏差;單周峰-峰值平均法沒有考慮小于轉頻的成分,導致計算結果偏小;平均時段法也存在無法消除系統誤差和外部干擾的問題;RMPpp法在進行計算時只包含一種頻率成分,峰-峰值計算值往往偏小。而置信度融合平均時段法很好地避免了以上各種算法存在的缺陷,能夠很好的得以應用。
水電站試驗數據、巡檢數據、缺陷數據等常常無法實現在線監測,為滿足設備狀態分析的數據正確性、完整性要求,應支持這些離線數據的錄入功能。
某些已記錄的數據不正確或者通信故障可能造成生產數據平臺的數據錯誤和數據不完整,因此應支持歷史數據的補錄、重錄功能。
一段時間的通信故障導致的數據缺失,除了通過補錄的方式進行數據補全外,還應支持數據補召功能,當通信恢復后,自動向對端補召通信故障期間的數據。
目前,數據存儲能力無法滿足水電站龐大的數據存儲的需要,如何設計一個合理的分層存儲架構成為生產數據平臺可用和實用的關鍵[1]。水電站生產數據平臺大量的數據如何進行梳理和存儲是設備狀態分析系統的難點。這個難題需要結合水電站的技術特點來解決。
水電站分析機組數據至少是在相同的運行工況,這樣的數據對比和分析才有價值。例如,設計工況下測得的振動幅值和渦帶工況測得的振動幅值是不存在可比性的。因此,我們應進行區分工況的水電設備狀態分析。
根據機組工況的特征參數,準確判斷機組所處工況及起止時間。同時,記錄工況及相關參數信息,為后續分析機組在不同工況下參數變化或同一工況下參數的變化提供有效的數據支撐。
根據機組的運行特性,將水電機組的整個運行范圍分成若干個合適的區間,可認為處于一個區間內的工況是同一工況,將這些工況用不同的標號表示,同一工況下的參數可進行互相比較。生產數據平臺采集到的每一組數據都附帶機組工況的標號,并根據機組工況標號進行后續處理。
數據入庫保存通常采用2種方式。一是按照給定時間間隔保存數據;另一種方式是分段間隔的數據庫入庫方案。考慮到狀態分析數據量大的特點, 直接采用定時間間隔入庫或者分段間隔入庫,入庫的數據量較大,硬件上難以支持,而且可能丟失有用數據。因此這里采用入庫頻度自適應方法,主要有以下原則[11]:
(1) 如果工況和相關參數基本不變,入庫頻度降低;
(2) 工況變化過程中的參數自動入庫;
(3) 雖然工況未變,但被測參數發生變化,則數據入庫頻度增加;
(4) 機組運行在特殊工況下,則入庫頻度增加。
多維度監測預警是一套關于系統的報警監測、統計學習以及歷史數據存儲的綜合概念。
2.3.1 分工況高、低報閾值
水電機組的工況經常變動,不同工況下機組的特征是不同的。例如在渦帶工況下,會伴隨著強烈的低頻振動,而在設計工況或最優工況下,機組的運行比較平穩。因此對于不同運行工況應該設定不同報警閾值。
2.3.2 報警令牌限制誤報
為避免信號采集或者傳輸發生異常而導致誤報警,系統采取在一段時間內,同一報警至少連續出現若干次數才觸發報警,這里引入報警令牌來限制誤報。
2.3.3 關聯通道報警
考慮到報警發生時,有時關聯的通道也會同時出現報警。因此可采取組合報警策略進行關聯,必須所關聯的通道同時報警才觸發報警。
在水電機組運行過程中,溫度、油位、油壓、頂蓋水位等可能影響機組正常運行的參量屬于漸變量,一般不會發生突變。其實很多設備事故或故障發生之前都是有征兆的。只要我們對歷史數據進行分析,進而阻止設備事故的發生。對于漸變量來說,分析的一個重要方法是趨勢預測法。趨勢預測的方法有多種[12],包括水平趨勢預測法、逐步回歸預測法、灰色理論預測法。在趨勢預測前,數學模擬模塊將根據時間序列數據擬合精度和是否有時間函數關系式來決定采用哪一種預測方法進行預測。預測結果可以用正向預測和反向預測2種形式來展現。
通過統計油壓裝置、液壓啟閉機油泵、技術供水水泵、檢修排水水泵等設備的啟停次數及運行時間,并進行直觀的展示,或者在數據庫中設置閾值(例如,技術供水水泵1 h內運行時間太長是不正常的)進行報警,用戶能清楚地了解這些設備的運行情況是否正常,是否存在設備頻繁運轉的情況,及時發現設備存在的問題。
實際測量中得到的狀態監測信號一般都是時域信號,時域分析可以比較直觀地表現信號波形隨時間的變化情況,物理意義比較明確。采用時域分析方法主要可以對與幅值相關的一些統計量進行分析計算。可以通過以下數據進行水電機組設備狀態的分析:最小值、最大值、峰-峰值、平均值、有效峰-峰值、中間值等。
經過本文介紹的數據處理后,水電站生產數據平臺的數據都是可信的,不存在毛刺、非正常跳變問題。設備的部分運行參數具有不能突變的特點。因此,針對設備運行的關鍵參數,例如油壓裝置的油壓、機組三部軸承溫度。通過本文介紹的趨勢分析和預測的方法,進行關鍵參數的趨勢分析,在信號異常時,及早地發現異常,并迅速預警,為水電站運維人員贏得處理缺陷的寶貴時間,避免機組事故停機的發生。
對比分析有多種方式,包括不同機組之間的設備狀態對比分析。例如,對2臺機組相同工況下的上導軸承的穩定性(振動、擺度)進行對比分析;同機組的同類型的設備進行對比分析,例如對某臺機組的上導軸承和下導軸承的穩定性進行對比分析。另外,還可以通過統計關鍵參數的最大值、最小值、平均值來分析設備狀態。
根據設備運行規律,進行設備狀態相關性挖掘分析。例如,機組的穩定性與機組出力、水頭、開度等密切相關,機組的油溫、瓦溫與機組出力、水頭相關,挖掘分析可以分析相同出力或同一水頭下各臺機組油溫和瓦溫的趨勢,可以分析相同出力時各臺機組的振動、擺度的趨勢。
為了保證水電站生產數據平臺的數據唯一性、準確性、實時性、完整性。首先,必須對水電站自動化系統的大量數據進行充分的整合,并進行粗大誤差的剔除,針對機組狀態監測的特征數據,建議用置信度(conf97)融合平均時段法進行計算處理。其次,考慮到水電站設備狀態和機組工況的緊密相關性,設備的狀態分析應區分機組工況進行,狀態分析的方法包括多維度監測預警以及趨勢預測法等。
中國水電開發和管理企業對設備管理的要求越來越高,隨著大數據時代的到來,可以預見,在未來很長一段時間,基于水電站生產數據平臺的數據挖掘和設備狀態分析將成為水電站技術發展的一大趨勢,這一技術也將為設備狀態評估和狀態檢修奠定基礎,全面的、深入的、廣泛的設備狀態分析將對水電站經濟、高效的運行產生巨大的作用。