鐘崴,林雪茹,林小杰,周懿
(1.浙江大學 浙江省清潔能源與碳中和重點實驗室,浙江 杭州 310027;2.浙江大學 能源工程學院,浙江 杭州 310027;3.浙江大學 嘉興研究院,浙江 嘉興 314024)
發展風力、光伏可再生能源發電是推動我國能源改革的必要手段[1-4].我國火電機組占主導地位[5],因此研究如何優化火電機組的運行操作具有必要性與迫切性.燃煤鍋爐是主要的耗能設備,如何優化其運行達到高效、低碳是核心問題.于晨龍等[6-9]對鍋爐汽機的最佳運行組合及負荷優化問題展開了研究.在實際的執行環節,電廠鍋爐的調控模式較粗獷,依賴人的經驗展開優化方案的執行,執行效果不佳或難以實施.系統復雜、工況多變,動態調整耗時大,易造成生產波動,降低經濟效益.有必要將操作經驗數字化,并基于模型進行決策,以輔助人員開展調控工作.
目前,學術界展開以聚類法、回歸模型法、在線監測法為代表的鍋爐操作數據模型化研究.Song等[10-12]通過聚類的方法實現燃燒效率的最大化,但聚類方法的計算效率較低.吳家標等[13-16]提出回歸模型法,解決了聚類法的計算效率難題,但難以適應工況變化和實際的操作模式.Nikula等[17-18]將在線監測法應用于鍋爐性能優化,可以監測工況是否屬于正常狀態或優化狀態,但未考慮參數的耦合性能,給出改進方法.隨著深度學習的發展,Zou等[19-21]將深度強化學習應用于鍋爐的燃燒過程,可以考慮工況的時變和參數的耦合,但深度強化學習模型的可解釋性和在連續過程的應用方面研究尚未成熟.
現有的鍋爐操作優化研究存在可執行性、工況適應性和計算效率不足的問題,需要進一步探索實時優化[22]場景下的方法.本文提出適用于多工況在線應用的代理模型模式匹配(pattern matching of agent model, PMAM)建??蚣?,以提升燃煤鍋爐的效率,優化鍋爐運行.主要貢獻如下.1) 提出新的模式匹配方法,解決鍋爐操作優化的可執行性問題.2) 提出基于模式匹配方法的優化操作庫構建方法,解決鍋爐操作優化的工況適應性問題.3) 提出基于神經網絡算法的在線應用代理模型,解決鍋爐操作優化的計算效率問題.
燃煤鍋爐轉化煤為蒸汽驅動發電,需要控制煤量、風量參數,保證安全并實現需要的蒸汽量.為了提高鍋爐效率,需要根據輸入的工況數據進行優化操作建議.采用反平衡方法[23]計算鍋爐效率,輸出給煤機、引風機、送風機的變頻數據,以達到效率最高的目標.如圖1所示為PMAM鍋爐實時操作優化建模方法.該方法基于改進的模式匹配算法及神經網絡算法,分為預建模、在線應用2個部分.預建模部分基于考慮滯后及時間窗的模式匹配優化模型,引入注意力機制參數、狀態參數區間頻率法、調控最小3層方案優化機制,得到各個工況的優化操作,構建工況參數與優化操作的最優代理模型.在線應用部分基于工況參數與優化操作參數的最優代理模型,實現在線優化計算.

圖1 基于代理模型模式匹配的鍋爐實時操作優化計算框架Fig.1 Boiler real-time operation optimization calculation framework based on pattern matching of agent model
1.1.1 滯后性計算 鍋爐操作中的滯后性主要體現在給煤機的頻率與鍋爐主蒸汽流量的關系.基于相關性分析,開展滯后性計算.
算法1:滯后性計算
輸入:樣本個數為n,樣本維度為1的樣本Y1、Y2,最大滯后時長為tdelayMax
輸出:滯后時長tdelay
1) 將樣本Y1、Y2歸一化,得到Y1n 、Y2n.
2) 構造數據集合dcorr ,第1列、第2列分別為Y1n、
Y2n.
3)foriinrange(-tdelayMax,tdelayMax):
4) 刪掉帶有空值的行,得到修改后的數據集合dcorr.
5) 計算dcorr的相關性系數,得到維度的相關性系數矩陣.
6) 取dcorr 第1列第3行開始的數據,表征Y1與經過時間平移處理的Y2之間的相關性.相關性系數絕對值最大的時間移動值為tdelay ,即Y1滯后于Y2的時間為tdelay.
設Y1、Y2均為時間長度為n的一維時間序列數據,研究Y1滯后于Y2的時間tdelay,則計算不同時間平移后Y2′與Y1之間的相關性,相關性越大,則認為平移的時間長度越優.
數據歸一化方法采用最大最小化方法,具體公式如下:
數據集合dcorr的構造方法如圖2所示.將Y2數據集進行時間軸平)移,得到圖2的框選部分,時間長度為(n-tdelayMax的數據集即為dcorr.

圖2 滯后性計算中的數據重構示意圖Fig.2 Schematic diagram of data reconstruction in hysteresis calculation
1.1.2 基于主成分分析及k-均值改進的模糊C均值聚類模型 設置數據集X={XM,XO,XR,XC}?R.其中XM為工況表征參數,包括主蒸汽溫度、壓力與煤質數據等;XO為目標表征參數;XR為關鍵的狀態表征參數;XC為可調控參數;X的總時間維度為n0.根據滯后時間,對數據集X進行時間軸對齊重構,得到新的數據集合為X′={X′M,X′O,X′R,X′C}?R,X′的總時間維度為n.
由于不同的參數數據范圍不同,對數據集進行最大最小化的歸一化處理.為了提高后續模式匹配優化的計算效率,處理后的數據使用主成分分析模型(principal component analysis, PCA)[24]降低維度.PCA降低數據維度的算法如下.
算法2:PCA降低數據維度
輸入:樣本個數為n,樣本特征數為q的樣本X,降維后數據特征占比為RlowV
輸出:低維樣本DlowX
1) 樣本的每一列去均值化,得到DmeanMoved.
2) 求協方差矩陣DcovMat.
3) 求協方差矩陣的特征值與特征向量.
4) 將特征值從大到小排序,并依次取出,直到取出的特征值加和大于RlowV,取得對應的特征向量DredE.
5) 計算降維后的數據DlowX=DmeanMoved×DredE.
6) 返回低維樣本DlowX、協方差矩陣DcovMat.
針對PCA降維后的數據,采用k-均值(kmeans)改進的模糊C均值聚類模型(fuzzy C-means, FCM)[25]進行工況聚類.記u=[uij]c×n為隸屬度矩陣,c為聚類數,聚類中心為v=[v1,v2,···,,其中1≤i≤c,2≤c≤n,q為數據特征數.FCM目標函數如下.
式中:m為模糊指數,控制每個距離平方誤差的占比,m≥1.
采用k-means方法改進FCM方法中的初始模糊矩陣生成步驟,可以降低聚類結果的隨機性,加快算法的收斂.改進FCM方法的計算步驟如下.
1)初始化聚類參數:c、m、更新迭代閾值ε、迭代次數l、最大迭代次數lmax.其中,更新迭代閾值為2次迭代的模糊矩陣偏差絕對值容忍度.
2)利用k-means聚類法生成初始的模糊矩陣U.
算法3:k-means聚類生成初始的模糊矩陣
輸入:樣本X、類別數目c
輸出:模糊矩陣U
1) 初始化,令l= 0,隨機選擇c個樣本點作為初始的聚類中心ml=[m1l,···,mcl].
2) 對樣本進行聚類,計算每個樣本到類中心的距離.將每個樣本分配到與其最近的中心的所屬類,生成聚類結果cl.
3) 計算聚類結果cl中每個類的樣本均值,作為新的聚類中心
4) 若符合停止條件(劃分結果不再改變或得到迭代次數上限),則終止,輸出c*=cl;否則,l=l+1,返回步驟2).
5) 根據c*,計算U.
6) 返回U.
3)計算聚類中心:
4)更新模糊矩陣:
5)若‖Ul+1-Ul‖<ε或l>lmax,則終止計算;否則l=l+1,跳轉至步驟3).
經過模型聚類后,得到分類后的數據集:
為了避免測量誤差和異常操作的影響,考慮時間維度的因素,將鍋爐操作參數模式匹配優化視為帶時間序列屬性的問題,選取一段時間窗口的數據進行模式匹配優化計算.
對于類別i第z個時間點,設時間窗長度為tdeta.步驟1)~5)為工況注意力機制參數層,考慮工況參數相對于目標參數的重要性,篩選相似工況.步驟6)、7)為狀態參數頻率區間層,利用狀態參數與鍋爐效率的高效區域進行優化.步驟8)為調控最小層,考慮實際的調控習慣,使得建議的操作參數與當前操作參數之間的偏離較小.
1)獲取匹配分數下限值cthresholdLow、匹配分數上限值cthresholdUp、關鍵參數的優先級順序corderR.
2)根據工況表征參數X′Mi,對目標表征參數X′Oi計 算相關性系數,取絕對值得到注意力參數cak,i.
3)篩選工況表征參數中變動偏差符合匹配分數上、下限的數據,得到更新后的X′Minew.
式中:Q為X′Mi的總時間維度,G為X′Mi的總變量維度.
4)計算[z-tdeta+1,z]時間段的工況表征參數與X′Minew相似度得分,Q′為X′Minew的總時間維度,q為其中的一個時間點,1≤q≤Q′:
5)按相似度得分排序更新X′Minew,得到對應時間的關鍵狀態表征參數X′Rinew、目標表征參數X′Oinew 、操作參數X′Cinew.
6)對于r∈len(corderR),令r= 1: 取出第r個關鍵狀態參數的數據條X′Rinew,:,r,計算最大值cmax與最小值cmin.根據區間單元長度cfreq,將X′Rinew,:,r劃分為多個區間,統計每個區間的頻率.將連續的區間合并為長度為clend的長區間,ceil為向上取整函數,round 為四舍五入取整函數.
統計連續長區間的頻率,按高到低排序,即為篩選后的關鍵狀態參數的區間.
根據目標參數的優化方向,取在該長區間的50%數據,得到篩選后的數據,令X′Rinew等于篩選后的數據;r=r+1.
7)根據輸出的關鍵狀態表征參數X′Rinew,更新得到對應時間的工況表征參數X′Minew、目標表征參數X′Oinew 、操作參數X′Cinew.
8)計算z時間點的操作參數X′Ci,z與X′Cinew相似度得分,并按從高到低排序,輸出得分最高的X′Ci,z為工況i第z個時間點的優化操作X*Ci,z.
利用3層方案模式匹配機制,分別對歷史生產數據進行優化,生成優化操作庫.為了解決直接搜索優化操作庫數據量過大、搜索效率過低的問題,構建基于神經網絡算法的最優代理模型.該代理模型以工況參數為輸入,以優化后的操作、效率和關鍵參數為輸出.
式中:f為最優代理函數,為類別i第z個時間點的工況數據,X*Ci,z、X*Oi,z、X*Ri,z分別為類別i第z個時間點的優化可操作參數、目標參數、關鍵狀態參數.
在線應用時,采用孤立森林[26](isolation forest)法進行偏離檢測.若當前工況非偏離點,則調用式(13)計算優化的操作參數;否則更新預建模的聚類中心與最優代理模型,輸出當前的操作參數為優化方案.
以浙江省某熱電公司為案例進行研究.該公司的機組規模為4臺蒸汽質量流量為220 t/h的高溫超高壓循環流化床鍋爐.選取1#鍋爐數據展開計算實驗,并以2#鍋爐數據開展驗證.選擇的工況參數、目標參數、關鍵狀態參數、操作參數如表1所示.

表1 鍋爐操作優化計算的相關參數表Tab.1 Table of parameters related to boiler operation optimization calculation
選擇歷史數據時間段為2022-02-16 22:41—2022-04-29 21:29,時間間隔為1 min,共103 586條數據構成原始數據集.如圖3所示,該鍋爐正常運行時的鍋爐效率為[86.70%, 93.15%].

圖3 某熱電公司1#鍋爐效率的正常運行數據Fig.3 Normal operation data of 1 # boiler efficiency of thermal power plant
如圖4所示為主蒸汽質量流量與給煤機頻率之間的關系圖.如圖4(b)所示為圖4(a)的局部放大圖.從圖4可知,主蒸汽質量流量的變化較給煤機頻率的變化存在滯后.設置最大滯后時長為30 min,計算主蒸汽質量流量與給煤機頻率之間的滯后性.如圖5所示,當主蒸汽質量流量相對給煤機頻率滯后5 min時,它們之間的相關性系數ccorr最大.

圖4 主蒸汽質量流量與給煤機頻率的曲線Fig.4 Curve between main steam mass flow rate and frequency of coal feeder

圖5 主蒸汽質量流量相對給煤機頻率的滯后性Fig.5 Hysteresis of main steam mass flow rate relative to coal feeder frequency
根據滯后性的計算結果,對原始數據集合進行時間軸對齊,得到的數據長度為102 063條.
如表2所示為不同的模糊指數對迭代次數與偏差的影響.當c= 3且ε= 10時,隨著m的增加,實際迭代次數lr和最終誤差L都呈上升趨勢.由此,設置m= 2.

表2 模糊指數對聚類目標誤差及迭代次數的影響Tab.2 Influence of fuzzy index on error value and iteration number of clustering objective
如表3、圖6所示為不同的聚類數對聚類效果的影響.當模糊指數和更新迭代閾值固定時,聚類數越大,最終誤差越大.當聚類數為5和6時,聚類的邊界不能被清晰地表示.設置聚類數為3.

表3 聚類數對最終誤差及迭代次數的影響Tab.3 Influence of clustering numbers on final error value and iteration times

圖6 不同聚類數的聚類效果Fig.6 Clustering effect of different cluster number
測試不同的更新迭代閾值對迭代次數與偏差的影響,結果如表4所示.

表4 更新迭代閾值對最終誤差及迭代次數的影響Tab.4 Influence of update iteration thresholds on final error and iteration times
由表4可知,當固定聚類數為3,模糊指數為2時,更新迭代閾值越小,最終誤差越小,而迭代次數在可接受范圍內,因此設置更新迭代閾值為0.01.
綜上所述,設置聚類數為3,模糊指數為2,更新迭代閾值為0.01,得到3類工況的數據集.
設置工況的匹配分數下限值為95,關鍵參數的優先級按爐膛溫度、煙氣含氧體積分數、一二次風比例、一次風量、二次風量依次下降.
如表5所示為1#爐多工況模式匹配優化的結果.表中,Sxm為工況相似度,Sxo為操作相似度,EdeBoiler為 效率提升值,ftotalGM為總給煤變頻,ftotalSF為總送風變頻,ftotalYF為總引風變頻.

表5 多工況模式匹配的優化結果-1#爐Tab.5 Optimization results of pattern matching under multiple working conditions-1# boiler
與傳統方法相比,本文方法考慮了關鍵狀態參數的優化調整區域,通過頻率區間擇優,本文方法的優化結果較原始鍋爐效率提升了1.92%.與僅考慮工況與操作相似的方法相比,鍋爐效率提高了1.86%.此外,各個優化方案的工況相似度均大于設置的95%.通過對比工況1與工況6~9可知,負荷較高時的鍋爐效率通常更高,更具有提升的空間.
選取1萬條歷史數據進行模式匹配批量計算,得到的鍋爐效率計算結果如圖7所示.利用本文方法,鍋爐效率平均提高了0.68%,最多提高了4.54%.

圖7 模式匹配方法的批量優化結果Fig.7 Batch optimization results of pattern-matching method
如圖8所示為構建代理模型采用的神經網絡結構.該結構包含3層隱藏層,分別含有20、20、10個神經元.激活函數設置為“relu”,學習率為0.01,迭代次數為100,設置訓練集數據占比為0.7,分別訓練表1列出的目標參數、關鍵狀態參數、操作參數與工況參數之間的最優代理模型.

圖8 PMAM代理模型采用的神經網絡結構圖Fig.8 Neural network structure diagram adopted by PMAM agent model
如圖9所示為模型的訓練結果.各參數的均方誤差(MSE)均不大于0.35%,滿足工業預測精度的要求.

圖9 最優代理模型的誤差結果Fig.9 Error results of optimal agent model
如表6所示為交叉試驗結果.圖中,e為誤差百分比.在10次重復試驗中,測試集上的誤差較穩定,每次預測的最大誤差為0.34%~0.38%,說明本文的代理模型具有泛化能力.

表6 交叉試驗-測試集誤差百分比Tab.6 Cross validation-error percentage of test set
采用構建的最優代理模型進行在線計算驗證,詳見表7.表中,tc為計算耗時.代理模型的應用顯著降低了計算耗時,在負荷為190 t/h的基礎工況下,鍋爐效率可以提高1.49%.

表7 在線應用結果示例Tab.7 Examples of online application results
如圖10所示,提出的PMAM法的計算耗時穩定在1 s,計算效率優勢隨著數據量的增大而顯著增大.圖中,ND為數據量.

圖10 不同方法的計算耗時Fig.10 Calculation time of different methods
如圖11所示為不同負荷的優化結果,效率提升了0~1.49%,平均效率改進了0.57%.圖中,f為頻率.

圖11 不同負荷下PMAM的在線應用結果Fig.11 Online application results of PMAM method under different loads
如圖12所示為PMAM與回歸模型法的優化對比結果.結果表明,在不同操作參數可調節范圍(20%、10%、5%)下,利用傳統方法得到的鍋爐效率均偏高,且存在失去置信度的風險.其中,操作參數可調節范圍是指操作參數相對于其當前實際值的可接受變化范圍.

圖12 PMAM與回歸模型法的結果對比Fig.12 Comparison between PMAM and regression model
以該公司2#鍋爐為驗證對象,結果如表8所示.本文的PMAM法能夠應用于其余鍋爐的操作優化,以提升鍋爐效率.

表8 多工況模式匹配優化結果-2#爐Tab.8 Optimization results of pattern matching under multiple working conditions-2#boiler
本文提出基于代理模型模式匹配的電廠燃煤鍋爐實時操作優化框架.該框架具有以下3個顯著特點.1) 高可執行性的模式匹配方法.基于相關性分析展開滯后性計算,引入工況注意力機制、狀態參數的頻率區間優化和調控最小3層優化機制.2) 優化操作庫構建方法.基于模式匹配方法對歷史的生產數據進行尋優處理,將操作經驗數字化.3) 高效在線應用方法.構建工況和優化操作參數的代理模型,提高在線應用效率.工程案例表明,該方法避免了優化求解中的泛化誤差,較傳統方法具有更高的可靠性和實時性.未來的研究將關注于優化模型的在線更新策略,提高模型的適應性.