金陽
(浙江省新能源投資集團股份有限公司,浙江 杭州 310020)
在電力市場化改革和生態流量等環保要求趨嚴等因素的影響下,部分水電站生產成本控制要求逐步提高。根據設備狀態適當延長發電機組等主設備的計劃檢修周期,成為水電站降本增效的重要措施。因短期內以硬件冗余提高設備可靠性的空間有限,以軟件解析冗余加強設備異常分析,即成為指導設備運行和開展檢修的較優選項。
對于大多數水電站模擬量測點,包括溫度、轉速和壓強等,計算機監控系統一般僅以輸入值是否超過整定值作為判定條件將單個測點轉化為布爾量,在與其他相關布爾量做邏輯運算后觸發告警信號或停機等控制流程,而不進一步分析并表達不同測點之間的數值相關性。經過多年運行,一些水電站各類廠級信息系統已積累大量生產運行歷史數據,為針對性開展測點相關性與設備狀態分析奠定了一定的數據基礎。
在針對設備狀態分析的數學方法中,基于數據驅動的方法相較于基于解析模型和基于定性經驗知識的方法,計算復雜度較低,更易于在實踐中得到應用[1]。基于多變量統計的分析方法是基于數據驅動的方法的分支,能夠在盡量避免根據基本原理建立復雜數學模型的前提下,提取對象的主要特征數據,以相對較少的信息維數反映系統主要信息。目前,基于多變量統計的分析方法在水電機組狀態分析中的應用較少,主要原因是與化工等行業中許多以保持穩態為目標的生產運行過程相比,水電站主設備的運行受外部電網波動和內部環境變化等因素影響,過程難以保持相對單一的穩態。
本文采用基于多變量統計的分析方法中的主成分分析法,利用MATLAB對某水電站廠級信息系統中一臺機組部分測點的運行歷史數據進行離線分析,以此探討主成分分析法在水電機組運行監測分析中的適用性。
主成分分析法是一種經典的基于多變量統計的分析方法,能夠在將變量組偏差進行降維處理的同時,保留系統主要變化特征[2]。以主成分分析法為基礎建立系統異常監測模型的主要思路,是以由正常觀測偏差組成的訓練集來確定變量之間的相關性,依此構建一組能夠代表不同正交方向上系統最大正常偏差的向量組,并由其中變異性較大的若干向量組成新的空間。在設置適當的置信區間等參數的前提下,根據測試集中的觀測偏差在新空間中的投影是否超限來判斷系統有無異常。
(1)標準化觀測值
選取有關測點組成變量組。因不同測點量綱不同,觀測值可能存在數量級上的較大差異。為賦予每個測點變化量以等量權重,將各觀測值減去平均值后除以標準差。平均值與標準差可由預先排除野值點后的初始訓練集估定。
將初始訓練集經過標準化后的數據矩陣記作
其中ynm表示第m個測點的第n個觀測值的標準化結果。
(2)相關矩陣計算
測點相關矩陣為
因R為對稱矩陣,可將其作特征分解為
其中Λ為對角矩陣,其對角元素為遞減的正數特征值λ1≥λ2≥…≥λm≥0,V為相應的單位正交矩陣。在實際計算中亦可將Y作奇異值分解。
(3)確定主成分保留個數
為在保留系統主要變異信息的同時,一定程度上減少隨機噪聲對監測模型的干擾,需要統一權衡確定保留的主成分個數。方差累計貢獻率法是實際中常用的一種方法。將Λ中的特征值按照從大到小排序,則相應計算式為
CPV即方差累計貢獻率(cumulative percent variance)。當CPVl達到一定的較高百分比時,一般可以認為l個主成分已經可以充分表達系統狀態變化[3]。該百分比可以根據有關監測需求及經驗設置。
由V中的前l個向量組成m×l負荷矩陣P,并將原始測試集經過標準化后的數據矩陣記作Z,則表達Z在降維后的空間中的投影信息的得分矩陣T、系統返回重構估計值矩陣和系統殘差矩陣E分別為
其中I為單位矩陣。通常情況下,與較大特征值對應的得分空間描述了系統的主要狀態信息,與較小特征值對應的殘差空間描述了隨機噪聲[4]。兩個空間在方向上的變化可以同時分別監測。
(4)計算過程統計量
計算Z的各行向量z在得分空間中的T2統計量
和殘差空間中的Q統計量
T2統計量即Hotelling'sT2統計量。Q統計量亦稱SPE,意為平方預測誤差(squared prediction error)。
(5)訓練集野值點排除
當原始訓練集采用大規模樣本時,可以先對其自身標準化后的樣本集合進行T2統計,并相對欠保守地確定閾值并排除野值點[5]:
或仍以單個測點觀測值是否不在整定值上下限范圍內作為判定觀測值組是否為野值點的條件。兩種方法容錯率存在一定差異。本文采用第二種方法。
(6)異常檢測
由訓練集確定的T2統計量閾值為
其中α為給定的顯著性水平,Fα(l,n?l)為自由度為l和n?l的F分布的上α臨界點[6]。實際中,α的選擇本質上是任意的,但又嚴重受限于習慣,通常取較小的數值[7]。
SPE閾值為
當T2≤Tl2或Q≤Qα時可判定系統正常,反之,則可判斷系統存在異常因素。因T2統計量和SPE的閾值計算方法不同,二者對同一空間不同長度投影發生異常的敏感度不同,不能籠統比較優劣[9]。
(7)異常因素識別
貢獻率圖法是一種常用的用于識別導致T2統計量異常因素的方法[10],其主要步驟如下:
將滿足式(13)的ti算作造成異常的得分:
其中z'為Z中已被判定為異常的行向量,pi為負荷矩陣P中第i個負荷向量,λi是相應的特征值,1≤i≤l。
z'的第j列元素z'j即測試集中第j個測點在相應時刻觀測值的標準化結果,其對于異常得分ti的貢獻率為
其中pj,i是pi的第j行元素。當計算結果為負數時,將貢獻率conti,j計為0。
z'j對于該時刻所有異常得分的總貢獻率為
根據總貢獻率CONTj從高到低對各測點進行排序,溯源總貢獻率較高的測點的原始觀測值,結合經驗推斷系統在該時刻異常的具體原因。
盡管總貢獻率CONTj對較小特征值的誤差較為敏感,但在異常觀測值組較少,利用方差分析實際可能不易識別殘差空間中的異常因素的情況下,貢獻率圖法也可以應用于SPE的異常因素識別。
本文為簡化判辨過程,將單個測點在不同時刻的總貢獻率進行了累加分析。
(1)對象機組簡介
本文選取某水電站一臺4MW發電機組作為監測分析對象。該機組采用自并勵靜止勵磁系統,水輪機為混流臥式,出線經一臺主變接入電網。其計算機監控系統采集的各傳感器數據已實時上傳至該水電站廠級信息系統。
(2)測點選取
主成分分析法以多變量統計為基礎,在選取監測變量時,為避免將全范圍內的大量甚至所有變量數據混雜地通過監測模型得出可能錯誤的結論,需要剔除與分析目標無關的變量,以及雖然和分析目標有關、但為冗余或者存在大量噪聲的變量。同時,因在低維情況為正態而在高維情況為非正態的數據集通常是少見的[11],由此,可以通過擬合單個變量的觀測值來判斷其是否接近正態分布及是否宜納入監測模型。
對于主要的電氣量,雖然機組在一般正常情況下主要以額定功率等為目標長時間運行,但受一次調頻、AGC、AVC及電網其他波動因素影響,其過程觀測值實際仍然是非平穩動態的。機端相電壓等測點觀測值僅在特定的統計周期內近似正態分布,如果與其他非電氣量共同作為監測變量,將對閾值確定等產生不利影響。對數、差分等變換往往難以直接改善最終分析結果,降低數據精度則將增加主觀因素。
水電機組的主要非電氣量包括溫度、壓強和轉速等。正常情況下,軸瓦或其相應油槽等位置的溫度測點精度相近,到達穩定值后的變化率差異較小。而機組空冷器的冷、熱風等位置的溫度測點更易受外部環境溫度影響,不同時節差異相對較大。同時,多數油、水、氣系統壓強往往以一定區間而非恒值作為運行目標。水輪機轉速與電氣量中的機端頻率均是機組最穩定的運行參數之一,兩者信號源不同但高度相關,在特定條件下可只選其一。
本文主要選取非電氣量作為監測變量,有功功率等電氣量僅作為機組工況的外部判斷條件。具體選取的變量測點順序如表1所示。

表1 初始變量測點表
在實際數據量較大、各測點采樣頻率不盡相同的情況下,本文統一將有關測點的采樣周期設定為1分鐘。對于采樣時刻無數據的情況,以其前后觀測值的平均值插入。統一設置分析過程涉及的參數,包括CPVl≥95%,α=0.01。由于機組開機運行后各溫度測點到達穩定值的時間不同,為避免將較低溫度誤判為異常,采樣起始時刻設定為機組有功功率到達額定值附近1小時后。
在MATLAB中建立監測模型,將水電站廠級信息系統中該機組數次以額定功率為目標,功率因數為0.96~0.98的運行過程歷史數據以矩陣形式導入。
(1)機組A修前后的數據分析
以該機組A修前的一次運行數據構建訓練集,A修后的一次運行數據構建測試集。具體可視化分析結果如圖1―圖4所示。根據訓練集測算,前3個主成分的方差累計貢獻率約95.14%。

圖1 機組A修后T2統計量與A修前閾值的比較
在圖1和圖2中,測試集所有數據組的T2統計量和SPE均超過閾值,特別是在采樣起始時間段。一方面表明機組在A修后相應的統計中心發生明顯變化,另一方面表明盡管測試集采樣起始時刻較晚,但仍有測點是在機組繼續運行一段時間后才到達穩定值。

圖2 機組A修后SPE與A修前閾值的比較
圖3和圖4顯示,對異常的T2統計量和SPE的累計貢獻率最大的分別是第4變量測點后導軸瓦溫度和第3變量測點前導軸瓦溫度。回溯原始觀測值,發現后導軸瓦溫度平均值經A修由約36.1℃降低至34.5℃,前導軸瓦溫度則由約32.3℃降低至29.6℃,表明此次A修在降低有關部件運行溫度方面取得一定效果。

圖3 測點對A修后異常T2統計量累計貢獻率

圖4 測點對A修后異常SPE累計貢獻率
(2)機組同一可用周期內的數據分析
以該機組在此次A修后的一次正常運行數據構建訓練集,經過一段備用時間后的一次運行數據構建測試集。在進一步延遲測試集的采樣起始時刻后,可視化分析結果如圖5―圖8所示。根據訓練集測算,前3個主成分的方差累計貢獻率約95.71%。

圖5 同一周期內T2統計量與閾值比較
在圖5和圖6中,測試集數據組的T2統計量和SPE總體低于閾值,但在某一時刻突變以至遠高于閾值。

圖6 同一周期內SPE與閾值比較
圖7和圖8顯示第4變量測點后導軸瓦溫度對異常的T2統計量和SPE的累計貢獻率顯著高于其他變量測點。回溯原始觀測值,后導軸瓦溫度在這一時刻由約34.5℃突降至31.7℃。導致測量結果存在粗大誤差的可能原因,包括對應的PT100接線端子之間存在污染、變送器電信號受到干擾等。此時在計算機監控系統內,測點輸入值未超過整定值,沒有相應告警信號。

圖7 同一周期內測點對異常T2統計量累計貢獻率

圖8 同一周期內測點對異常SPE累計貢獻率
離線數據分析表明,在工況和測點分類的前提下,主成分分析法可以有限地應用于水電機組運行狀態監測分析。盡管將觀測值數據進行了壓縮處理,但在基本保留測點之間的相關性的情況下,監測模型對于異常的敏感性一般高于單側點的整定值。數據解析得出的異常結果往往是一種趨勢變化的注意值,可以作為判斷設備運行狀態改善或惡化的參考條件。為使閾值盡可能控制在相對合理區間內,應在機組檢修后重新設定訓練集,同時需要剔除機組同一可用周期內較為早期的運行歷史數據。
本文受限于該水電站各主要監視控制系統之間的通訊限制,未對水輪機導軸承的振動、擺度等測點開展分析。相較于溫度,振動、擺度等測點能夠更快到達穩定值且相對更少地受到環境因素影響。在具備有關條件后,可以在基本保留測點原始采樣頻率的情況下將其作為監測變量,同時將主成分分析法穿插于聚類分析等方法中以開展數據解析。