莊 勇,張照彥
(1.國能思達科技有限公司,北京 100000;2.河北大學電子信息工程學院,河北 保定 071002)
風能作為一種可再生能源,近些年處于蓬勃發展階段[1-3]。根據世界風能協會初步統計,2018 年全球新增53.9 GW 的風電裝機,中國以新增25.9 GW 繼續大幅度領跑[4-5]。風電機組長期運行在惡劣的自然環境中,各部件的故障率顯著增加[6],采用合理高效的監測手段和準確的故障診斷方法對提高風電機組可靠性具有重要意義[7]。
風電機組運行數據來源豐富,其中機組本身所配備的數據采集與監視控制系統每天會產生大量的運行數據,合理利用這些信息豐富的SCADA 數據可以實現對風電機組故障的預警,提高機組可靠性和電能質量[8-9]。基于SCADA 大數據的風電機組預警系統容易實現且可靠性高,它具有以下優點:不需要額外的投資,風電機組本身配備有實時監測系統,可得到準確可靠的SCADA 數據,方便采取大量的實驗數據,實驗數據越豐富,對于實驗的科學性就更有保障,避免了偶然性,更有利于進行風電機組運行狀態的分析與預測;歷史儲存的數據量很大,可以利用大量的健康數據進行試驗,建立健康模型,由于故障發生之前的數據保留得較為完整,也就可以利用健康模型以及異常工作之前的各項參數進行分析比較,確定正常工作狀態與異常工作狀態之間的關系;現場實施方便,無需另配備專門運維人員,無后續維護費用,大大減少了工作量以及維修維護成本,對于風電場的運營有極大的好處,既減少了投入成本又提高了安全保障,所以風電機組故障預警策略有很大的應用空間。
風電機組故障預警是基于采集機組狀態數據,通過嘗試使用多種算法或算法的組合,在風電機組設備衰退出現“缺陷”的時候,盡早檢測到潛在故障,為機組維修決策提供充裕時間與決策信息。本文依托現場的真實風電機組數據,經數據預處理,建立了NSET模型,并通過固定預警閾值驗證了模型的可行性與預警策略的可實施性。
使用機組正常工況下采集到的SCADA 數據建立NSET 模型,將該模型用于風機參數預測,依據殘差實現對風電機組故障的預警。建模涉及的參數主要如下:總體觀測矩陣Pnхb、記憶矩陣D、觀測矩陣Xоbs和估計矩陣Xеst。
總體觀測矩陣Pnхb如式(1)所示:
式(1)中:n為每個時間的觀測變量數;b為時間標簽。
從總體觀測矩陣Pnхb中選取一段時間的參數記為訓練矩陣K,代表各個觀測參數的健康狀態, 設訓練矩陣中共k個觀測向量,訓練矩陣K如式(2)所示:
從訓練矩陣K中抽取部分數據組成記憶矩陣D,被選取出的數據能覆蓋系統正常工況,記憶矩陣D如式(3)所示:
將觀測向量Xоbs輸入NEST 模型,得到狀態估計矩陣Xеst,對任意一個觀測向量Xоbs,NSET 模型都將產生一個與Xоbs同維的權值向量W,使:
式(4)中:W=[w1,w2,…,wm]。
設殘差為ε,對它做最小化處理:
若使ε最小,則需要求ε2的極小值,令,則:
由式(5)可看出,DTD可逆是權值向量W存在的先決條件,為增強NSET 模型可用性,將點乘運算代替為非線性運算符,本文選擇DT和D間的Euсlidеn(歐氏)距離,即:
權值向量W可改為:
則系統的當前狀態估計矩陣可寫為:
基于上述推導,NSET 模型完成建立,由此模型可預測出輸入數據,最終得到潛在的故障預警信息。
以某風場A12 號風電機組現場獲取的大量SCADA 數據為基礎,開展基于非線性狀態評估的風電機組故障預警分析和研究。數據源的時間跨度為2021-09-26—2022-01-26。
SCADA 系統故障記錄顯示,2021-12-26T06:00,A12 號機組發出類型為“主軸止推軸承溫度高”的故障報警。溫度屬于漸變信號,在故障產生和發展的過程中是逐漸上升的,與振動等沖擊型信號相比,溫度信號中蘊含著更為豐富的潛在故障信息,對潛在信息進行充分挖掘對于風電機組故障預警的分析和研究具有極高的工程應用價值。本文使用的數據源中,共包含70 類17 713 條采樣頻率為10 min 的風電機組相關參數,其中齒輪箱相關參數共5 個、主軸相關參數共2個。主軸相關參數趨勢如圖1 所示。

圖1 主軸相關溫度變量趨勢圖
圖1 中在菱形標識時刻故障報警,但溫度卻繼續上升;繼續勻速采樣,風機并未停止。由此推斷,可能存在2 種情況:發出故障報警后風電機組立刻停機,在設備溫度下降之后再次啟動并網;故障發生后風電機組并未立刻停機檢修,而是帶故障持續運行。
從圖1 可知,情況2 更符合實際情況,為此,分別畫出故障預警時刻后的風速與風功率趨勢圖,如圖2所示。從圖中可以看出,故障報警后,風電機組繼續運行25.5 h 后才停機,停機時長達到51 h。

圖2 風速與功率對照趨勢圖
將SCADA 數據導入MATLAB 中,以相關系數r有針對性分析主軸相關2 個變量與其他變量之間的關聯關系,以期發現對建模過程有建設性貢獻的變量。需要說明的是,相關系數r只是眾多變量關聯關系分析指標的一種,并不具備直接決定全部建模相關變量的能力;最終的變量需要結合相關系數r與工程經驗,決定具體的建模變量。
相關系數是最早由統計學家卡爾·皮爾遜設計的統計指標,是研究變量之間線性相關程度的量,一般用字母r表示。由于研究對象不同,相關系數有多種定義方式,較為常用的是皮爾遜相關系數。
為研究2 個主軸相關變量與其他參數之間的線性相關程度,以確定非線性狀態評估模型的建模變量,本文以相關系數為相關程度統計指標。相關系數r的計算方法如下所示:
相關系數是研究變量間關聯程度的統計指標,以2個參數和各自平均值的離差為基礎,通過2 個離差相乘來表示2 參數間的密切程度。r的絕對值越接近1,2 個變量關聯程度越大;r的絕對值越接近0,2 個變量關聯程度越小。針對本例中的“主軸止推軸承溫度高”,可首先確定主軸直接關聯的變量“主軸齒輪箱側溫度”“主軸風輪側溫度”,兩者是所提供數據中直接與故障相關的數據。并且將兩者的上一時刻數值作為2 個新變量。以這2 個變量為基礎,進行相關系數r分析,可得到如圖3 所示的相關數幅值圖。

圖3 相關系數幅值圖
從圖3 中可分析出,2 個變量的相關系數分布與數值十分相似;2 個變量無強負相關變量,正相關強變量較多。通過導出的數據分析可知,在圖3①號線以上(幅值0.6)的變量有:主軸齒輪箱側溫度、主軸葉輪側側溫度、機艙空氣溫度、機艙Y軸振動值、發電機轉速、變槳軸1 軸箱溫度、變槳軸2 軸箱溫度、變槳軸3 軸箱溫度、變槳軸1 電容溫度、變槳軸2 電容溫度、變槳軸3 電容電壓、變槳軸2 伺服溫度、變槳軸3 充電電流、變槳軸1 輪轂溫度、變槳軸2 輪轂溫度。
實際上,上述變量不需要全部使用,因為很明顯可以看出絕大部分都是溫度信號。而溫度信號一般是輸出類型的變量,如果全部變量都選擇輸出類信號,模型擬合固然很好,但實際應用效果會不理想。從變量物理空間與機械結構構造角度考量,選擇主軸齒箱側溫度、主軸葉輪側溫度、機艙空氣溫度、機艙Y軸振動值、發電機轉速、風輪轉速、風速作為NSET 建模變量。
由上述分析可知,有建模意義的數據共13 142 條,時間區間為2021-09-26T00:10—2021-12-26T06:00,將它分為訓練集、驗證集和試驗集3 份。訓練集的時間跨度為2021-09-26T00:10—2021-11-19T18:00;用于訓練模型,以得到預警故障的NSET 模型。訓練數據的風速與功率趨勢對照圖如圖4 所示,從圖中可知,訓練數據有3 127 個數據條目異常。

圖4 訓練數據的風速與功率趨勢對照圖
驗證集的時間跨度為2021-11-19T18:10—2021-11-28T21:00,數據條目1 315 個,用于驗證所生成的故障模型。此區間的數據如果包含全部工況,則更能說明所建立模型的全工況動態驗證下的魯棒性。驗證數據的風速與功率趨勢對照圖如圖5 所示。

圖5 驗證數據的風速與功率趨勢對照圖
試驗集的時間跨度為2021-11-28T21:10—2021-12-26T06:00,數據條目3 944 個;用于生成預測序列,將所形成的時間序列殘差用于預警策略。試驗數據的風速與功率趨勢對照圖如圖6 所示。

圖6 試驗數據的風速與功率趨勢對照圖
利用等步長選擇策略,共得到3 026 條NSET 建模有效數據條目,過程記憶矩陣三維圖如圖7 所示。

圖7 記憶矩陣三維圖
利用建立的NSET 模型,預測試驗集主軸齒輪箱側溫度,試驗集預測結果如圖8 所示。
從圖8 可看出,主軸齒輪箱側溫度的實際值與其預測值產生較大偏離,在試驗集的第1 000 點之后預測偏差尤為明顯。這是由設備狀態衰退所引起的原始NSET 模型與當前設備運行狀態失配,進而導致實際值與預測值偏差較大,依此可檢測出設備的潛在故障。
為清楚示意預警流程,此處使用固定閾值作為范例,將圖8 中的原始數據與預測數據兩者相減形成殘差統計圖,計算驗證集殘差的均值與均方根誤差,可得到圖9,圖中2 條橫線為預警線,是以均值為中心,上下3 倍均方根誤差而得。

圖8 試驗集數據預測圖

圖9 驗證集數據殘差圖
圖9 中超出2 條預警線的點十分稀少,殘差數據集中且殘差的波動有一定規律,說明所建模型能夠對驗證集時間范圍的機組狀態進行較好的描述。通過逐點分析,發現超出預警線的時刻最多連續了2 次,說明此警戒線具有統計意義。
使用試驗集參數形成上述殘差圖,使用驗證集的2條預警線可得試驗集的預警圖,具體如圖10 所示。

圖10 試驗集預警圖
從圖10 可明顯看出,試驗集齒輪箱側溫度殘差在1 000 點左側首次超出閾值,經逐點分析,900~1 000點之間共有17 個溫度殘差數據越過閾值下限。之后頻繁超出閾值,并在2 500 點以后反向越過閾值上限。綜上分析,在試驗集第1 000 點(2021-12-05)應對風電機組登艙檢查,此時距離SCADA 系統報警(2021-12-26)、停機(2021-12-27)尚有充裕檢修時間,并且期間也有多次預警。
本文依托現場的真實風電機組數據,經數據預處理,建立了NSET 模型,并通過固定預警閾值驗證了模型的可行性與預警策略的可實施性。由于數據樣本較少,殘差序列整體幅值較大,后續可通過增大數據訓練樣本的方法降低殘差幅值。同時,由于數據覆蓋范圍僅有4 個月,風電機組運行參數中的長周期特性并未得到體現,且風力資源并不充沛,高風速數據缺失嚴重,此問題依然可以通過提高數據采樣頻率、數據覆蓋時間范圍等措施加以克服。這些問題的存在也正是數據驅動建模的弱點,只有經大量數據訓練,才能得到泛化效果好、預警準確率高的故障預警模型。