鮑克勤 楊蒙姣
(上海電力大學自動化工程學院 上海 200090)
在燃氣輪機發電機組啟動操作過程中,以往的憑經驗以及操作票內容和步驟繁多,很容易導致各種人為故障的發生,也會帶來巨大的經濟損失。基于電廠歷史運行數據建立燃氣輪機的啟動過程模型可以對啟動過程中關鍵屬性的歷史數據進行集中管理,并實時監測其變化情況,甚至可以對燃氣輪機的狀態趨勢進行有效預測,指導運行人員進行優化操作,幫助運行人員全面并及時地掌握機組最新的啟動情況并不斷優化。建立燃氣輪機啟動過程的模型有利于綜合研究各因素對啟動性能的影響,優化啟動時間,對提高發電機組的運行可靠性以及經濟性具有重要意義。關于燃氣輪機的啟動過程模型的建立,國內外眾多學者已經進行了大量的研究工作。文獻[1]基于燃氣輪機的結構機理進行模塊化建模,進而通過對燃氣輪機穩態及動態數學模型的研究來對機組運行進行優化。文獻[2-3]從熱力學理論出發,并結合運行數據的方法建立燃氣-蒸汽聯合循環發電機組的模型。文獻[4]圍繞F級燃氣-蒸汽聯合循環機組的APS設計與實現對機組的啟停過程進行優化。文獻[5]從機器學習算法的角度出發建立燃氣輪機的啟動過程模型,采用支持向量機以及某型燃氣輪機的啟動數據為基礎,避免了復雜的熱力學推導過程,但模型預測過程中容易出現過擬合現象,并且運行速度較慢。
由以上可知,國內外現有研究很少涉及對多因素長時間的燃氣輪機啟動過程數據變化的量化分析,基本停留在基于熱力學理論的機理建模的研究上。針對以上不足,結合燃氣輪機實際的啟動過程將其看作一個典型的非線性時序模型[5],將擅長處理高維變量的回歸算法Lasso與能有效處理過度擬合的機器學習模型RF相結合建立Lasso-RF預測模型[6]。運用Lasso進行特征選擇來研究影響燃氣輪機啟動的因素。在Lasso特征選擇的基礎上,采用RF模型,使用某熱電公司燃氣輪機的歷史運行數據對燃氣輪機啟動過程中的重要參數進行預測。結果表明,與Lasso-SVM預測模型相比,Lasso-RF預測模型的準確性、實時性更高,并且有效地避免了過擬合的問題,在降低模型復雜度的同時也提高了模型的泛化能力,更有利于處理海量的工業數據,為燃氣輪機啟動過程的優化提供了一定的依據。
燃氣輪機的啟動過程是指轉子從靜止零轉速狀態加速至全速空載的過程。主要包括啟動機啟動、帶動燃機轉子轉動、燃機點火、轉子加速直至達到額定轉速幾個階段。在燃機啟動之前,輔助設備需提前啟動[7],此時燃機處于低速盤車狀態,轉速為3 r/min,一般規定盤車系統必須至少連續運行1 h。之后啟動機啟動,即靜態頻率轉換器(static frequency converter,SFC),SFC裝置主要由諧波濾波器、隔離變、整流器、電抗器、逆變器、位置傳感器以及控制系統等組成。SFC控制的具體開關過程為:選擇SFC后,發電機中性點閘刀、勵磁變低壓側開關自動分閘,SFC隔離變6 kV開關、啟動勵磁變6 kV開關及其低壓開關、SFC切換開關盤開關、發電機SFC閘刀自動合閘,SFC諧波濾波器6 kV開關延時10 s自動合閘投入運行,各諧波濾波器柜冷風機自動投入運行,SFC系統整流柜、逆變柜及直流電抗器風扇自動投入運行。SFC電源取自6 kV廠用電,經過隔離變、整流器、逆變器變為頻率可變的交流電,輸入到發電機定子繞組中,同時在發電機轉子中加入直流勵磁,將發電機轉換為同步電動機方式轉動,發電機轉速隨SFC輸出的頻率上升而上升,帶動燃氣輪機加速到清吹轉速,之后開始清吹過程。吹掃結束后,燃機惰走至約580 r/min時進行點火,隨后進行暖機、加速。轉速達到2 000 r/min時,燃氣透平所產生的機械功足以抵消壓氣機的耗功,SFC啟動裝置退出,并向汽輪機通入一定量的輔助蒸汽對低壓缸進行冷卻。機組繼續升速,直至達到燃機的額定轉速,其轉速略高于電網頻率。
由上述分析可知,在燃氣輪機啟動過程中,需要將燃機的主軸轉速提高至額定轉速,所以燃機主軸轉速的變化趨勢是要實時監測的重要參數,透平排氣溫度是評估燃燒室健康狀態的重要參數。因此在本文中主要通過對透平排氣溫度以及燃機主軸轉速的預測,建立燃氣輪機的啟動過程模型。由于透平排氣溫度與燃機主軸轉速是隨時間變化的數據序列,因此燃氣輪機的啟動過程是一個典型的非線性時序模型。為了能夠較為準確地描述燃氣輪機的啟動模型,在選取輸入輸出參數時要能夠盡可能包含啟動過程的全部物理量,并且各物理量之間的相關性要盡可能小[5],同時為了簡化模型,提高模型的預測準確度,減少機器學習的運行時間,本文選擇環境溫度T0、大氣濕度H0、大氣壓力P0、燃機的燃料流量F0、壓氣機的進口可調導葉開度IGV以及啟動電機電流I0等作為模型的輸入參數,選擇透平排氣溫度T1、燃機主軸轉速R1作為模型輸出參數,f、g為非線性函數,則燃氣輪機的輸入輸出模型可簡化為如圖1所示。

圖1 燃氣輪機輸入輸出簡化模型
基于以上模型,再加上時間因素的影響,燃氣輪機啟動模型的離散形式可描述為:
R1(t+1)=f(t,T0(t),H0(t),P0(t),…,
F0(t),IGV(t),I0(t))
(1)
T1(t+1)=g(t,T0(t),H0(t),P0(t),…,
F0(t),IGV(t),I0(t))
(2)
Lasso是由1996年Robert Tibshirani首次提出,屬于正則化方法的一種,是壓縮估計。它通過構造一個懲罰函數得到一個較為精煉的模型,使得它壓縮一些系數,同時設定一些系數為零,保留了子集收縮的優點,是一種處理具有復共線性數據的有偏估計。Lasso參數估計定義如下:
(3)

Lasso回歸算法可以彌補最小二乘法和逐步回歸局部最優估計的不足,可以有效地對存在多重共線性的特征進行篩選,即對數據進行降維處理,用盡可能少的數據解決問題。從理論上說,Lasso對數據類型沒有太多的限制,可以接收任何類型的數據,而且不需要對特征進行標準化處理。因此選用Lasso回歸算法進行數據處理是恰當的。
RF是一種靈活且易于使用的機器學習模型,以CART決策樹為基學習器,所構建的“森林”是決策樹的集成,利用多個弱學習器集合成一個強學習器以獲得更準確和穩定的預測。采用的集成方法是Bagging,基本原理是隨機有放回的選擇數據進行訓練得到多個決策樹,最后采取投票機制決定最優的預測結果[10],RF的結構如圖2所示。
隨機森林通過構造不同的訓練集來增加基模型間的差異,從而提高組合模型的預測能力,通過k輪訓練得到k個分類器{h1(x),h2(x),…,hk(x)},再用其構造一個采用投票法決定的預測模型系統,其決策函數為:
(4)
式中:hi(x)為決策樹模型;Y為目標變量;I為示性函數。
隨機森林構建預測模型的基本步驟是:
(1) 假設一個原始訓練數據集D,由M個特征變量和一個目標變量Y組成,而且D里面有n個不同的實例[8]。
(2) 獲取多個訓練數據集,使用Bagging對原始訓練數據集D進行K次有放回的隨機抽樣,得到K個新的訓練子集{D1,D2,…,DK}[9],這K個訓練子集每一個都包含有n個實例。
(3) 從M個特征變量中隨機選取m(m (4) 把所有生成的決策樹組合到一起生成一個RF模型,將測試樣本帶入模型,采用眾數投票法,輸出得到最優的預測結果。 為提高預測的準確性及精準化分析相關因素,將建模過程分為2個階段:第1階段采用Lasso回歸算法對燃氣輪機的啟動數據進行特征選擇,有效地選取出與透平排氣溫度以及燃機主軸轉速相關的自變量;第2階段將篩選出的變量作為RF的訓練樣本建立燃氣輪機啟動過程的預測模型。本文采用Python語言進行全部實驗,Lasso-RF建模流程如圖3所示。 圖3 Lasso-RF建模流程 為了得到泛化性能較好的模型,數據樣本的選取至關重要。本文的數據來自國內某市熱電公司三菱M701F4型燃氣輪機2019年的實際運行數據,規模龐大,覆蓋了全年不同溫度、不同濕度以及機組200個測點的參數,數據冗余、重復雜亂的問題顯著。在數據預處理過程中,需要丟棄缺失值過多的特征和奇異數據,初步篩選出30個特征變量,分別為環境溫度,大氣壓力,…,壓氣機進口溫度,并依次定義為x1,x2,…,x30,定義透平排氣溫度為y1,燃機主軸轉速為y2。 特征選擇對預測模型的建立起著關鍵作用。在燃機啟動過程中眾多特征之間存在嚴重的多重共線性,若將30個特征全部用于預測模型的自變量,不僅運行時間長,而且存在不相關或相關性較小的變量,同時由于不同特征值相差很大,量綱不同,會對預測結果產生干擾。因此,對初步篩選的30個特征變量進行歸一化處理,剔除冗余特征,這樣不僅可以簡化模型,提高模型的預測準確度,還可以減少機器學習的運行時間。本文使用Lasso回歸算法分別對透平排氣溫度、燃機主軸轉速進行特征選擇,得到與y1相關性系數較高的8個屬性,依次為壓氣機出口溫度x13、壓氣機的進口可調導葉開度x3、燃料流量x10、燃料壓力x11、燃料溫度x16、天然氣成分x14、環境溫度x1、大氣濕度x19。與y2相關性系數較高的6個屬性,依次為啟動電機電流x28、啟動電機功率x4、燃料壓力x11、壓氣機出口溫度x13、天然氣成分x14、燃機負荷x23。通過繪制相關性條形圖以更加直觀地展現出各屬性的影響程度,結果如圖5所示。 圖4 透平排氣溫度相關性條形圖 圖5 燃機主軸轉速相關性條形圖 將x13,x3,…,x19作為預測y1的特征變量,將x28,x4,…,x23作為預測y2的特征變量。我國燃機發電主要用于兩班制運行調峰,早啟晚停,啟停次數多,因此本文選取某周前六天燃氣輪機的啟動過程數據作為隨機森林的訓練集,建立一個燃氣輪機的啟動過程模型,將最后一天的啟動過程數據作為測試集代入訓練好的模型中對透平排氣溫度以及燃機主軸轉速進行預測,并與實際啟動過程數據進行對比。為展示Lasso-RF預測模型的優越性,將采用同樣回歸算法預處理的數據代入SVM模型中進行預測,并將預測結果進行比較。透平排氣溫度預測結果對比如圖6所示,其中圖6(a)為整個啟動過程的預測結果,圖6(b)為部分預測結果。燃機主軸轉速預測結果對比如圖7所示,其中圖7(a)為整個啟動過程的預測結果,圖7(b)為選取的點火過程的預測結果。 (a) 整個啟動過程的預測結果 (b) 部分預測結果圖6 透平排氣溫度預測結果對比 (a) 整個啟動過程的預測結果 (b) 選取的點火過程的預測結果圖7 燃機主軸轉速預測結果對比 由圖6和圖7可知,Lasso-RF模型和Lasso-SVM模型都能對燃氣輪機啟動過程中透平排氣溫度和燃機主軸轉速進行有效預測,但SVM誤差較大,預測結果有一定的滯后性。以燃機點火過程的預測結果為例,Lasso-RF模型的準確性、實時性更高,為運行人員調整和優化啟動過程提供參考。從算法理論上分析,這是因為在創建隨機森林的時候使用的是無偏估計,決策樹之間是相互獨立的,對于不平衡的數據集來說,它可以平衡誤差,因此隨機森林模型有較高的準確度。而SVM理論上主要是針對低維數的數據樣本將其從原始空間映射到一個更高維的空間,使得樣本在這個空間中線性可分,并借助核函數解決問題,因此在處理多變量高維度的模型預測問題中誤差較大,實時性較差。無論是對透平排氣溫度還是燃機主軸轉速的預測,RF的預測效果都明顯優于SVM,說明RF具有良好的泛化能力,可以應用于不同的數據集。由于數據來自熱電公司的實際運行數據,不免含有噪聲成分以及信號采集誤差,預測結果說明Lasso-RF模型具有更強的抗干擾性。 為更加直觀地比較Lasso-RF、Lasso-SVM預測模型的準確率以及兩種模型的運行時間,選用平均絕對誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Squared Error,RMSE)作為評價指標。RMSE代表了預測值的離散程度,也叫標準誤差,最佳擬合情況為RMSE等于0。模型誤差指標如表1和表2所示。 表1 透平排氣溫度誤差指標 表2 燃機主軸轉速誤差指標 由表1和表2可知,Lasso-RF模型即使對不同類型的輸出參數其評價指標誤差都小于Lasso-SVM模型。更重要的是,Lasso-RF模型對透平排氣溫度的預測時間比Lasso-SVM模型減少了21.24%,對燃機主軸轉速的預測時間比Lasso-SVM模型減少了14.29%,因此為縮短啟動過程的時間提供了可能。以上共同證明了Lasso-RF構建的燃氣輪機啟動過程的預測模型具有更好的準確性與優越性。 本文以燃氣輪機實際啟動過程數據為依據,將回歸算法Lasso與機器學習模型RF相結合建立燃氣輪機啟動過程的Lasso-RF預測模型并對比了Lasso-SVM模型,得出以下結論: (1) 將Lasso算法用于燃氣輪機啟動過程中的特征選擇,能有效解決眾多屬性之間的多重共線性問題,對數據集起到降維作用,簡化模型。 (2) RF在有效的特征選擇基礎上使得預測模型表現出更好的準確性和泛化能力,其平均絕對誤差和均方根誤差值都明顯小于SVM,對透平排氣溫度的預測準確度比SVM高43.14%,對燃機主軸轉速的預測準確度比SVM高81.21%。 (3) Lasso-RF模型可以用于燃氣輪機的啟動過程建模分析,為優化啟動過程、縮短啟動時間提供了一種新的方法,對提高發電機組的經濟性具有重要意義。3 預測模型建立

3.1 數據預處理及特征選擇


3.2 模型預測結果




4 結果分析與驗證


5 結 語