馬賀賀,李 輝,張小虎
?
基于核偏最小二乘回歸方法的發電機關鍵運行參數預測分析
馬賀賀1,李 輝1,張小虎2
(1.上海電氣集團股份有限公司中央研究院,上海200070;2.上海電氣電站設備有限公司上海發電機廠,上海200240)
通過對發電機關鍵運行參數的實時預測能夠輔助實現發電機運行狀態的有效監控。傳統偏最小二乘方法(Partial Least Squares,PLS)在應用過程中沒有考慮變量間的非線性關系,為提高發電機關鍵運行參數的預測精度,引入核函數進行變量空間的非線性映射變化,實現非線性回歸分析,并將核偏最小二乘回歸方法(Kernel Partial Least Squares Regression,KPLSR)應用于發電機定子線圈出水溫度預測,實際運行數據的對比分析驗證了方法的有效性。
發電機;偏最小二乘方法;核函數;參數預測
為了保證發電機的長期穩定運行,發電機組的關鍵部件往往安裝一些測量裝置,采集發電機的實際運行數據,供運行人員監視發電機的運行狀態是否健康。實際運行過程中,水內冷的發電機定子,易發生定子內冷水對線棒產生腐蝕而使腐蝕產物沉積堵塞線圈出水,導致線圈冷卻條件變差,定子繞組局部溫升過高而損壞絕緣,并帶來嚴重后果[1-3]。對于這一類逐漸劣化的問題,利用歷史數據建立正常狀態下的關鍵參數預測模型,進一步對實際運行過程展開實時預測,通過預測結果與實際采樣數據的對比來判斷當前變量是否存在不良趨勢,可實現比閾值報警更為及時、有效的故障發現與預防。
其中,正常數據的模型預測精度是給操作人員提供可信依據的保證。應用中,一般可采用兩類方法進行預測分析建模。一種是采用單變量時序建模的方式,通過對該變量自身的變化情況進行分析,利用其歷史時刻的實際數據來預測變量變化趨勢[4-6]。由于這一類方法基于過去多個時刻的實際數據進行建模預測,不利于對該物理量的當前健康狀況進行評估。另一種是采用多變量建模的方式,如回歸分析、神經網絡、支持向量機等方法[7-9]。通過對多個變量潛在的耦合關系進行綜合分析與建模,達到預測某一關鍵變量的目的。其中偏最小二乘方法集成了回歸分析與成分分析的優勢,并在工業過程建模中得到了廣泛的應用[10]。但在對發電機關鍵參數進行預測分析的過程中,發電機本身較為復雜,各變量之間存在較為復雜的非線性耦合關系,而傳統的PLS難以有效表征變量間的非線性關系[11,12]。本文通過引入核函數對與發電機定子線圈出水溫度有關的多個變量進行高維空間變換后運用回歸分析,通過實際數據驗證了核函數的引入提高了PLS回歸分析預測精度,KPLSR方法能夠基于正常數據建立更為準確的基準預測模型,實現對該變量的狀態實時預測評估。
(1)對初始數據進行標準化之后,設和的主元向量為和,則可以表示出輸入輸出矩陣在第一主元所對應的主成分和。

(2)為建立輸入矩陣與輸出矩陣的回歸關系,根據主成分分析的思路,可以把輸入輸出矩陣進行回歸建模:

(3)將當前主元不能解釋的殘差部分,進行迭代分解回歸,直到獲取的主元個數達到最大(即輸入矩陣的秩)。則最終的回歸預測模型為:

對于新樣本,直接利用回歸系數矩陣即可求解獲得輸出預測值。
從偏最小二乘方法的計算原理中可以看出,PLS進行回歸分析屬于多元線性回歸的方式。而在實際應用過程中,物理對象機理的復雜性決定了表征其狀態的各個變量彼此之間存在較強的非線性關系。因此,通過引入核函數方法,通過非線性映射將原始變量空間投影至高維核空間,即進一步在高維空間中進行回歸分析,能夠增強模型的非線性數據處理能力[12,15]。
常用的核函數包括高斯核函數、Sigmoid核函數以及Polynomial核函數等。其中高斯核函數表示為:

式中表示核函數寬度。在進行發電機關鍵參數預測的過程中,本文采用學習能力較強的高斯核函數對原始數據進行高維空間映射。主要步驟如下:
(1)對發電機正常運行狀態下的過程數據進行標準化處理;
(2)利用高斯核函數對輸入矩陣進行高維空間映射得到高維核矩陣K;
(3)利用下式對高維數據空間進行中心化處理

(4)在高維空間中進行偏最小二乘回歸,計算回歸系數;
(5)利用訓練集變量均值、標準差對新樣本進行標準化,并進行高維空間投影;
(6)高維空間進行中心化之后,利用回歸系數矩陣獲取新樣本的輸出預測值;
(7)對輸出結果進行逆標準化運算后得到最終的發電機定子線圈出水溫度預測結果。
采集某電廠發電機實際運行數據進行分析,以發電機定子線圈出水溫度作為輸出變量,結合專家經驗知識選取8個輸入變量建立預測模型。輸入變量分別為:有功功率、發電機定子線圈進水溫度、發電機定子線圈冷卻水流量、發電機勵端空側密封油回油溫度、定子邊端鐵心及端部結構件溫度、發電機鐵心中部齒和軛部溫度、汽端冷氫溫度、勵端冷氫溫度。選取2016年4月期間數據作為正常運行狀態的訓練集進行建模,數據間隔為10min,訓練集樣本個數為4319個,選取2016年5月期間的數據作為測試數據集,共計4449個樣本。
分別對上述數據進行PLS方法以及KPLS方法建模,并在測試集上測試兩種方法的預測效果。按照交叉驗證方法選擇兩種方法的主元個數,PLS方法主元個數為3,KPLS方法主元個數為10。改變核函數參數的值,并對訓練集數據的預測結果進行對比分析,可以看出,在值較小時,其對模型的擬合精度有較大影響。隨著核函數寬度的增加,訓練模型的預測精度趨于平穩,因此本文選擇100作為最終模型的核函數參數。
采用模型均方根誤差(MSE)、絕對誤差平均(MAE)、平均絕對百分誤差(MAPE)以及希爾不等系數(TIC)對兩種模型的預測性能進行綜合評估。具體模型訓練結果與測試集預測結果對比見表1。從表1中數據可以看出,在模型訓練階段,KPLSR方法在模型訓練階段各項精度指標均小于PLS,更加有效地表征了發電機定子線圈出水溫度與其他變量之間的潛在關系,更好地擬合了輸出變量。測試集樣本的預測也驗證了KPLSR模型的有效性,提供了精度更好的預測結果。圖2和圖3給出了測試集中兩天的定子線圈出水溫度實際值與預測值之間的對比,從圖中可以看出,在發電機正常運行情況下,基于歷史數據建立的預測模型能夠較為精確地輸出預測結果,驗證了KPLSR算法的有效性。預測模型輸出的預測值代表了當前輸入條件下正常運行狀態該有的輸出結果,在實際數據出現劣化趨勢時,通過二者對比將能夠在異常的初期階段進行及早發現,保證發電機的正常安全運行。

表1 預測結果對比

圖1 核函數參數影響分析

圖2 2016年5月13日數據預測結果對比

圖3 2016年5月20日數據預測結果對比
本文通過分析傳統PLS方法在解決變量間非線性問題時的局限性,結合發電機數據的實際情況,引入核函數變換來提高PLS的預測分析能力。通過在高維核空間中進行回歸建模,更為有效的捕捉了變量間的非線性關系,KPLSR方法能夠輸出更為準確的發電機定子線圈出水溫度預測結果,實際的發電機運行數據驗證了KPLSR方法的有效性。通過利用歷史數據建立正常運行狀態下的關鍵參數預測模型,能夠輔助實現發電機異常的及早發現,進而提高發電機的運行安全性。
[1] 錢鋒. 發電機水冷定子線圈局部溫度異常的故障診斷分析[J]. 大電機技術, 2004(5).
[2] 徐俊紅. 水輪發電機定子線圈腐蝕原因分析[J]. 大電機技術, 2010(4):20-21.
[3] 張修波, 姚德全, 韓德才. 發電機水冷定子繞組溫度的監測與保護[J]. 電力建設, 2002, 23(7): 50-52.
[4] 李輝, 郭雙全, 張夢航. 基于時間序列的發電機溫升趨勢分析方法[J]. 上海電氣技術, 2016, 9(1).
[5] 梁平, 范立莉, 龍新峰. 非線性模型在汽輪發電機組振動故障預測中的應用[J]. 華南理工大學學報 (自然科學版), 2006, 34(6): 122-126.
[6] 趙化時, 趙旋宇, 史迪, 等. 基于PMU數據和時間序列模型的發電機參數識別(英文)[J]. 南方電網技術, 2015, 9(7): 68-75.
[7] 鄧建國, 羅隆福. 基于BP神經網絡的大型水輪發電機定子鐵心的溫度預測[J]. 湖南大學學報(自科版), 2000, 27(1): 72-75.
[8] 鄒敏, 周建中, 劉忠,等. 基于支持向量機的水電機組狀態趨勢預測研究[J]. 水力發電, 2007, 33(2): 63-65.
[9] 李銳華, 孟國香, 謝恒堃, 等. 基于偏最小二乘神經網絡的大電機定子絕緣擊穿電壓混合預測方法[J]. 中國電機工程學報, 2007, 27(3): 100-105.
[10] S. de Jong. SIMPLS: An Alternative Approach to Partial Least Squares Regression. Chemometrics and Intelligent Laboratory Systems, 18: 251–263, 1993.
[11] Kim K, Lee J M, Lee I B. A Novel Multivariate Regression Approach Based on Kernel Partial Least Squares with Orthogonal Signal Correction[J]. Chemometrics & Intelligent Laboratory Systems, 2005, 79(1-2): 22-30.
[12] Bennett K P, Embrechts M J. An Optimization Perspective on Kernel Partial Least Squares Regression[J]. Advances in Learning Theory Methods Models & Applications, 2003, 3(10): 227-250.
[13] 鄧念武, 徐暉. 單因變量的偏最小二乘回歸模型及其應用[J]. 武漢大學學報(工學版), 2001, 34(2): 14-16.
[14] 尹力, 劉強, 王惠文. 偏最小二乘相關算法在系統建模中的兩類典型應用[J]. 系統仿真學報, 2003, 15(1): 135-137.
[15] Rosipal R, Trejo L J. Kernel Partial Least Squares Regression in Reproducing Kernel Hilbert Space[J]. Journal of Machine Learning Research, 2001, 2(2): 97-123.
Prediction Analysis of Key Generator Operation Parameters Based on Kernel Partial Least Squares Regression Method
MA Hehe1, LI Hui1, ZHANG Xiaohu2
(1.Shanghai Electric Group Co., Ltd., Central Academe, Shanghai 200070, China; 2. Shanghai Electric Power Generation Equipment Co., Ltd., Generator Plant, Shanghai 200240, China)
Real-time prediction of key operation parameters can assist to achieve effective status monitoring of the generator. Traditional partial least squares method is used without considering the nonlinear relationship between variables. In order to improve the prediction accuracy of generator operation parameters, Kernel function for nonlinear mapping of the variable space is applied in this paper. The kernel partial least squares regression method is used to predict generator stator coil outlet temperature. The validity of KPLSR is verified by contrastive analysis of the real operation data.
generator; partial least squares; kernel function; parameter prediction
TM301.3
A
1000-3983(2017)04-0007-03
上海市科委企業合作專項項目 (15dz1180400)
2017-02-15
馬賀賀(1985-),2013年4月畢業于華東理工大學控制科學與工程專業,獲得博士學位,現從事工業數據分析工作,工程師。