賈雪楓,李存斌,周 穎
(華北電力大學經濟與管理學院,北京 102206)
“碳達峰、碳中和”目標促進了我國新能源發電技術的發展[1]。但是,大量未到退役年限的煤電機組仍是我國能源需求的重要保障。據統計, 2020年我國火電占比為68.87%,500 MW及以上的煤電機組有629臺,其中586臺服役短于15年。日本和美國同類型機組服役可達30~40年[2]。這些機組的運行會增加碳排量,卻不能因低碳減排而強制退出,否則會成為擱淺資產[3]。煤電機組靈活性改造是延長煤電機組壽命、早日實現“雙碳”目標的有效手段。增加燃料靈活性的燃煤生物質摻燒技術可在鍋爐熱效率不明顯降低的情況下,減少煤電機組的碳排放量[4]。有研究表明,木本生物質是較為理想的摻燒物質[5],但會在煙道中積累灰渣,增加風機負荷,影響煙風系統的穩定運行[6-7]。
煙風系統中一次風機、二次風機和引風機涉及諸多設備和控制回路,是機組運行過程中故障率較高的環節[8],其風險狀態很可能影響摻燒機組的安全運行[9]。為降低生物質摻燒對煙風系統的不利影響,保證摻燒技術的順利應用,摻燒機組亟需能夠實時辨識影響程度,及時預警風險狀態的煙風系統風險態勢感知模型[10]。目前,研究偏重于將機組整體風險視為調度考慮的因素之一,并未深入研究摻燒機組或某個系統的風險。如將風電不確定性作為考慮因素的經濟調度模型[11],或借助條件期望值,構建多機組聯合調度模型,以多能互補的方式規 避風險[12]。此外,超超臨界機組輔機故障減負荷 時的運行參數也被重點討論,以確保機組的平穩運行[13]。故現有文獻少有對摻燒機組煙風系統的風險態勢感知進行研究。
在對發電機組及其子系統的風險研究中,解析法與數據分析法最為常見。解析法的優勢在于可確定風險及其影響因素的關系。萬書亭[14]確定了定子電流的頻率分布與故障發生的關系,明確了風速時空分布對風機葉輪故障的影響。黃圣鑫等[15]構建了自洽先導事發模型,衡量了雷電流幅值和機組形狀等因素對雷擊截收區域面積的影響,確定了機組容量與雷擊的量化關系。數據分析法則是借助機器學習模型,依靠風險因素的歷史數據,計算風險發生可能性。數據分析法可充分考慮縱向的時間維度信息和橫向的數據相關性信息,具有準確、快速的優勢。特征提取[16]、神經網絡[17]、支持向量機[18]與小波分析[19]等均屬于數據分析法,可用于柴油機組、風電機組或艦船水輪發電機組的故障預測。
目前,尚無借助機器學習與大數據的方法,研究燃煤生物質摻燒機組煙風系統風險態勢感知的先例。因此,本文借助機器學習方法與風機表象數據,提出了數據密度下基于Transformer與信息融合的風險態勢感知模型(density-based risk state awareness model using transformerand information fusionknearest neighbors,DRTIK)。本文提出了借助海量運行數據密度的典型狀態的識別方法;提出了應用Transformer機制的未來特征預測模型,降低了摻燒機組煙風系統未來特征預測的誤差;實現了融合歷史數據信息的風險判別預警方法,提升了摻燒機組煙風系統風險狀態判別的準確率,縮短了預警時間。
風險態勢感知應包括典型狀態識別、未來特征預測和風險態勢判別3個步驟[6]。借助數據密度抽樣(density based sample,DBS)有效降低歷史數據量后,DRTIK運用密度峰值聚類(density peak cluster,DPC)識別了摻燒機組煙風系統的典型運行狀態,結合歷史時間序列數據運用Transformer模型預測了煙風系統的未來運行特征,融合了近鄰點信息后運用k近鄰(information-fusionknearest neighbor,IkNN)算法判別并預警了煙風系統的運行是否處于風險態勢。摻燒機組煙風系統風險態勢感知流程如圖1所示。
DRTIK借助自適應網格動態密度抽樣方法(adaptive-grid DBS,DBSA)進行歷史數據抽樣。DBSA的抽樣與分布密度成反比,可減少數據集中程度。摻燒機組煙風系統的歷史數據分布不均,在海量數據下,某個較少數據的運行狀態會被視為異常狀態,從而造成典型運行狀態缺失。DBSA可稀釋密度過大的數據點,提高狀態挖掘效率。DBSA的4個步驟如下。
1)等深劃分
設數據集D包含M行N列數據。對D的每列進行升序排序,形成(xam,n)M×N,并根據數據量,將第n列等深劃分為kn個區間,則每個區間段內包含了M/kn個數據。同時,第n個維度形成了kn個數據區間,其第n維度的第k個數據區間Ink可表示為
2)相似性計算ε
根據文獻[20],可由區間段的長度|Ink|計算相鄰區間的相似性ε:
3)區間合并
若維度n的2個相鄰數據區間Ink和In,(k+1)的相似性ε大于閾值T(0 4)計算網格g的抽樣概率pg 經上述動態區間劃分,數據集D被分為個網格。每個網格的樣本點個數稱為網格密度,直接影響網格樣本數據的抽樣概率。設第g個網格的樣本個數為Deng,網格密度也為Deng,抽樣概率為pg。抽樣概率與網格密度相關,故可將pg表示為Deng的函數pg=f(Deng)。根據文獻的推導過程,抽取樣本數為S的情況下,pg為[21]: 式中:e為抽樣指數,e∈(0,1)。 DRTIK借助DPC識別典型運行狀態。DPC可以根據數據分布的密度進行數據聚類,解決了基于距離的聚類方法中無法處理非球面數據的問題。 DPC基于2個假設:1)數據集中,類簇中心點擁有較高的局部密度,且被密度較低的數據點包圍;2)類簇的中心點與大于該中心點密度的點之間會有較大的相對距離。 根據這2個假設,DPC引出了3個特定概念:截斷距離(cut-off distance,dc)、局部密度ρ和相對距離δ。dc為事先指定的一個固定的常數。ρ為某個點周圍的密集程度,如點xm的局部密度可表示為ρm,表示到xm小于dc的點的個數。δ為2個特殊點之間的距離,如δm表示局部密度大于xm的點到xm的最短距離;若xm的局部密度最大,則δm為xm到其他點的最大距離。 DPC主要包含了如下5個步驟。 1)計算局部密度 DRTIK采用文獻[22]中提出的高斯核函數計算ρ。在計算ρ之前,需要設定dc為所有樣本距離的下四分位點。ρm為點xm的密度,其計算方式為: 2)計算相對距離 相對距離的計算需要劃分為2種情況,非局部密度最大點和局部密度最大點。 對于非局部密度最大點,相對距離是該點到局部密度比該點大的所有點的距離的最小值,計算方式為: 對于局部密度最大點,相對距離是該點到其他所有點的距離的最大值,計算方式為: 式中:S為總體數據量,即1.1的抽樣結果。 3)確定聚類中心 聚類中心需要借助局部密度和相對距離確定。局部距離和相對密度都大的點可以當成聚類中心。 4)指派數據類簇 確定類簇中心后,其余點按就近原則進行類簇劃分。即當前點的類標簽(屬于哪個類)和局部密度大于當前點的最近點的標簽一致。 5)確定類簇邊界 首先,定義每個類簇的邊界區域,即分配到該類簇但與其他類簇的點的距離小于dc的點的集合。然后,找到這個集合中局部密度最大的點,以此點的密度作為閾值篩選類簇。 根據歷史運行數據,摻燒機組煙風系統可以借助機器學習中時間序列方法預測未來運行特征。故本文提出了基于Transformer時間序列預測模型。 Transformer模型為雙層結構,分為編碼層和解碼層,其結構示意如圖2所示。 1)編碼層 時間序列數據經過輸入層和位置編碼層后會增加成sized維的數據,在執行注意力過程時,需要將sized維的數據分成h個組,每組稱為1個頭[23]。在考慮時間順序信息的同時,多頭機制將時序數據放入多個子空間中,可增加預測的準確性。該過程稱為多頭注意力機制(圖3)。 首先,將輸入層與位置編碼結果相加形成初始輸入X。將X分別與3個可優化的權重矩陣WQ、WK和WV相乘,形成了3個與X同維度的矩陣Q、K和V;然后,將Q、K和V劃分為h個頭,按照公式(6)計算注意力機制的結果;最后,將所有的Zh橫向拼接形成多頭注意力計算結果Z。多頭注意力機制如圖3所示。 2)解碼層 相比編碼層,解碼層多了編碼-解碼注意力子層。故本小結重點講述編碼-解碼注意力子層的計算過程。 編碼-解碼注意力子層借助編碼層中最后1個K矩陣和V矩陣實現注意力機制,其過程如圖4所示。首先,將第一個注意力子層的結果做殘差連接和歸一化,得到X,將X與權重矩陣WQ相乘,形成了該子層的Q,并接收由編碼層中傳入的矩陣K和V;然后,將Q、K和V進行多頭注意力機制運算,并按照式(6)計算結果;最后,將所有的Zh橫向拼接形成多頭注意力計算結果Z。 設xt為某個預測得到的未來時刻未經態勢感知的數據,即待判別數據;xm為典型狀態庫中的任一數據,即典型狀態數據。本節將展示利用信息融合k近鄰(information-fusionknearest neighbor,IkNN)算法識別xt的風險態勢的詳細過程。 DRTIK模型需構建成典型狀態集合Ω={sc|c=1, 2, …,C}(1.2聚類所得的C個類簇),以隸屬度mt({sc})來表征數據點xt屬于sc的可能性。若某運行狀態的數據不屬于Ω,本文規定該運行狀態屬未知狀態,用mt(Ω)表示未知狀態的隸屬度。mt(Ω)越大,風險發生的可能性越大。 1)k近鄰搜索 DRTIK模型借助信息融合k近鄰算法判別設備的運行狀態,故DRTIK的首要任務是確定近鄰點個數k。通常,xt與近鄰點的距離應小于與2個相似樣本點之間的最大極限值dmax。該值的計算方法為: 式中:dmax為最大極限值;N為運行點的維度;θn為第n個維度上允許的最大偏差,θn取第n個維度的最小值與下四分位點的差值。 然后,對典型狀態庫中所有的數據xm,找出與xm的距離小于dmax的樣本點個數ηm。近鄰個數k的取值為ηm的平均值。 于是,這項深空探測競賽就有了來自兩個不同大陸的研究小組的加入。吉茲博士的工作設備是坐落于莫納克亞火山(該火山位于夏威夷最大的島嶼上)的10米凱克望遠鏡。根策爾博士的團隊則受益于歐南臺在智利建造的全新VLT望遠鏡。 式中:M同樣為典型狀態庫的樣本容量。 2)折現因子計算 借助文獻[24]提出的方法,DRTIK實現了根據訓練樣本密度自適應調整的折現因子計算方法。 首先,用Φt表示xt的k近鄰集合,同時,DRTIK假設xt與Φt中元素的距離約等于Φt中元素到各自k個近鄰點的距離。基于此,每個典型狀態數據xm都能產生1個能反映樣本在典型狀態中所處位置局部密度的折現因子γm: 式中:Dm為典型狀態樣本xm與其k個近鄰數據點之間的距離集合;函數quantile表示從Dm中找尋分位數的值;ε=0.8是分位數,配合quantile函數使用。 所有xm產生的折現因子γm構成了折現因子集合γ={γ1,γ2,…,γM}。借助折現因子集合確定xt折現因子γt,的計算方法為: 3)狀態隸屬度計算 Φt中數據點的狀態可為xt提供狀態隸屬度信息。xt的狀態隸屬度信息m(·|xm)的表達為: 為了對xt進行運行狀態識別,需要將xm提供的隸屬度信息按式(13)和式(14)信息融合法則進行融合,以便綜合體現xt的狀態隸屬度。 上述計算過程得到的m函數之和可能不為1,需要歸一化: 式中:K1為歸一化因子。 上述過程可以計算設備某一時刻運行數據xt的典型狀態隸屬度mt(A)和未知狀態隸屬度mt(Ω)。借助此過程,可以掌握摻燒機組煙風系統可能產生的異常狀態,并對其提前預警。 本文的算例分析選取了摻燒機組煙風系統中一次風機、引風機和送風機的8個軸承在X和Y兩個方向的振動數據,共3 546條。數據跨度為2020/09/01至2020/12/31,每條數據間隔約50 min。部分數據見表1。 表1 基礎數據 單位:mm Tab.1 Basic data DBS抽樣需要確定3個參數,分別是kn=20,e=0.5,T=0.7。DPC聚類可以根據決策圖設置聚類中心局部密度ρ的上限和相對距離δ的上限2個參數。 在未來運行特征預測過程中,本文借助PyTorch實現了Transformer的未來運行特征預測。算法設定:輸入變量的維度為16,嵌入維度為12,頭的個數為3,時間跨度為29。同時,Transformer 神經網絡采用Adam優化算法,迭代500次,批處理的數量為720。在IkNN風險態勢感知過程中,需要確定的參數有1個,是未知狀態閾值mt(Ω)=0.2。 圖5展示了降成2維的抽樣前數據,共有3 546條。左側數據有3 142條,占比為88.61%。右側數據有404條,占比為11.39%。圖6為抽樣后數據,共1 968條。左側數據抽取了1 684條,占比85.57%。右側數據抽取了284條,占比14.43%。由圖5、 圖6可知,經DBS抽樣后,減少了數據總量,增加了右側數據占比,也稀釋了密度過大的數據點。 圖7是1號軸承所有時刻振動幅度的散點圖,每個時刻即是圖7中的1個點。圖7的x軸和y軸分別表示了1號軸承X和Y方向的振動幅度。由圖7可知,典型狀態可分為高負荷狀態s1和低負 荷狀態s22類。其中,該機組大部分時刻處于高負荷狀態,只有少部分時刻處于低負荷狀態(如2020/10/21至2020/10/25等時間段)。 圖8為DPC決策圖,展示了1號軸承所有運行時刻局部密度ρ和相對距離δ。根據1.2節3),圖8上部具有較大ρ和δ的2個點可被確定為該數據集的2個聚類中心。由圖8可見:點A是高負荷狀態s1的聚類中心,其局部密度為105.72,相對距離為145.18;點B是低負荷狀態s2的聚類中心,其局部密度為235.56,相對距離為148.18。 為了驗證Transformer模型在預測摻燒機組煙風系統未來特征的有效性,本文將其與長短時記憶(long-short term memory,LSTM)和BP神經網絡進行對比。LSTM神經網絡的主要參數為:輸入變量維度為1,隱藏層數量為2,隱藏層神經元個數為32,時間跨度為29。BP神經網絡的主要參數為:輸入變量維度為16,隱藏層數量為6,隱藏層神經元個數為32。本文只展示1號軸承X方向的振動結果。 圖9為3種方法對1號軸承X方向振動數據的預測結果。由圖9可見:綠色的LSTM神經網絡預測結果比真實值大,而藍色的BP神經網絡要比真實值小;相比于LSTM神經網絡和BP神經網絡,Transformer的預測結果更加貼近于真實值。這表明Transformer的預測結果更加準確。 圖10展示了3種方法預測結果的誤差對比。由圖10可知,LSTM神經網絡和BP神經網絡在異常值點的預測誤差比較大,而Transformer模型 的誤差甚微。這個現象也印證了Transformer的預 測準確性。 此外,本文采取了平均絕對百分比誤差δMAPE和均方根誤差δRMSE檢驗所提Transformer特征數據預測的準確性,其計算方法為: 式中:ym為預測值;my′為真實值;M為樣本容量。 表2展示了3種預測方法的δMAPE、δRMSE和預測耗時。單純預測時間耗時較短且差異不大,故耗時計及了網絡的訓練時間。 表2 預測結果評價指標 Tab.2 Evaluation indexes of the prediction results 由表2數據可知:Transformer的δMAPE與LSTM無太大差異,比BP神經網絡小了44.24%;Transformer的δRMSE比LSTM小了67.27%,比BP神經網絡小了35.59%;Transformer的耗時比LSTM減少了67.14%,比BP神經網絡多了33.33%。可見,Transformer的預測精度大于LSTM和BP神經網絡,且未花費過多時間。 Transformer的網絡結構最為復雜,卻不是最耗時的。這證明了Transformer結構的合理性,可使預測精度更高,且相比LSTM,Transformer將時間序列的順序性以矩陣的形式代替,而非循環數值計算,這令Transformer計算更加簡潔。此外,Transformer在周期性因素之上,考慮了各維度的數據信息,因此,Transformer可以借助注意力機制增加預測結果的準確性。 圖11展示了1號和2號軸承在2021/01/01至2021/01/10間的290條運行數據。從圖11中可看出:2021/01/01前9個時間點為低負荷運行狀態,振動幅度比較??;而在4日午后到5日凌晨的一段時間內,振動幅度異常高,各軸承不同方向的振動也不成比例。因此,4日午后到5日凌晨這段時間應該進行風險態勢判別,機組處于未知狀態。其他時間點則均處于高負荷運行狀態。 圖12展示了DRTIK與證據融合k近鄰方法(evidence k-nearest neighbor,EKNN)[24]和實時動態電力系統可靠性評估方法(electric system dynamic and real-time reliability evaluation,ESDRE)[25]的風險態勢判別結果對比。由圖12 a)可知:DRTIK認為該機組在1日上午處于低負荷狀態s1,午后切換到高負荷運行狀態s2,在切換過程中,m(Ω)出現了瞬時增加,但未達到早期閾值,故未預警風險態勢,該機組在s2保持了一段穩定的運行時期;在4日12:16,m(Ω)持續增大到0.8以上,DRTIK將摻燒機組煙風系統判定為風險態勢并預警;經過維修后,于5日凌晨4:00回歸高負荷運行狀態。DRTIK在對該段數據的預測檢測過程中未出現誤報。由 圖12b)可見,EKNN無法完成狀態的判別與預警,只能實現低負荷狀態s1的判別,其他2種狀態的判別結果較差。由圖12c)可見,ESDRE無法實現低負荷狀態1s的判別,雖然ESDRE的感知結果在1日出現波動,但并未正確判別此狀態。 為進一步驗證本文所提DRTIK模型的效率,利用上述3種模型對3類運行態勢繪制受試者工作特征(receiver operating characteristic,ROC)曲線。表3以狀態s1為例,展示了計算該狀態ROC曲線的所需數據。橫軸表示非s1狀態卻劃分到s1狀態的概率,即由fs1除以S1;同理,縱軸表示,s1狀態點劃分正確的概率,即由ts1除以T。 表3 計算狀態s1的ROC曲線所需數據 Tab.3 The data required for ROC curve of state s1 ROC曲線(0,1)的實際意義為,狀態判別沒有錯誤,且狀態判別全部正確,曲線越接近(0,1)點,狀態判別效率越好。圖13為3種模型判別3種狀態的ROC曲線。由圖13a)和圖13b)可見,DRITK在狀態s1和狀態s2的判別中明顯強于其他2種方法。圖13c)也表明了DRITK在風險狀態Ω的判別中不弱于其他2種方法。因此,上述ROC曲線表明了DRTIK模型正確性和可靠性。 此外,ROC曲線下方面積(area under curve,AUC)接近于1,同樣可印證DRTIK風險感知效率。由圖13可知,DRTIK對于狀態s1、s2和Ω的AUC分別為0.937 9、0.902 6和0.916 3,均接近 于1,且強于ESDRE和EKNN的AUC。因此,AUC指標也證明了DRTIK模型對于風險態勢判別的準確性和可靠性。 1)隨著“碳達峰、碳中和”目標的推進,經過靈活性改造后的煤電機組在具有更加精準快速的調峰性能和更低的二氧化碳排放量的同時,也加重了機組和煙風系統負擔,令其運行更具復雜性。為提高靈活性改造后的煤電機組,尤其是煤炭生物質摻燒機組煙風系統的運行可靠性,本文提出了數據密度下基于Transformer與信息融合的煙風系統風險態勢感知模型。首先,借助海量運行數據的密度,識別了正常與風險的運行狀態;然后,應用Transformer機制預測了煙風系統未來時刻的運行特征;最后,融合了歷史數據信息,感知并預警了煙風系統是否屬于風險狀態。 2)借助所提的自適應網格的密度偏差抽樣和密度峰值聚類,實現了摻燒機組煙風系統的典型運行狀態識別—低負荷狀態s1和高負荷狀態s2。Transformer時間序列預測模型在未來運行特征預測的問題上具有準確性、快速性和魯棒性等優勢,且能夠綜合考量歷史數據的時序性和多源數據的相關性。本文融合了歷史信息,實現了未來運行特征下的摻燒機組煙風系統風險感知與預警。同時,經相關指標對比,證明了所提的DRTIK風險態勢感知模型的準確性。 3)對于摻燒機組或煙風系統運維監控,運檢單位應實現數據驅動的典型狀態識別。煙風系統或機組的穩定運行由多設備多元件組成,獨立個體的表象數據不能表征典型狀態。此外,單憑特征的取值范圍判別典型狀態具有片面性,會導致狀態判別失誤,引發不必要的停機檢修損失。 4)機組風險狀態的判別應融合未來與歷史信息,綜合多設備多元件信息。煙風系統或機組的狀態判別應借助未來時刻的預測數據,以提高預警的前瞻性。1.2 密度峰值下的典型狀態識別
1.3 Transformer機制下未來特征預測
1.4 信息融合驅動的風險態勢判別
2 算例分析
2.1 基礎數據

2.2 典型運行狀態識別
2.3 未來運行特征預測

2.4 風險態勢判別

3 結論與建議