

關鍵詞:供熱負荷預測;BiLSTM-Adaboost神經網絡預測;貝葉斯優化算法;超參數尋優;預測精度中圖分類號:TM621.4 文獻標志碼:A 文章編號:2095-2945(2025)20-0001-06
Abstract:Inthispaper,aBiLSTM-AdaboostpredictionmodelbasedonBayesianoptimizationisproposedfortheheatload predictionproblemofthermalpowerplants.First,theefectsofprimarynetworkheatingparametersandmeteorologicalfactorson heatloadareconsideredcomprehensively,andthePearsoncorrelationcoeficientmethodisutilizedtoscrenthemodelinput variables.Secondly,usingthefeatureextractionabiltyofbidirectionallongshort-termmemorynetwork(BiLST)fortieeries data,AdaboostalgorithmisintroducedtointegratemultipleBiLSTMmodelstoimprovetheaccuracyandrobustnessofthe prediction;finaly,Bayesianoptimizationmethodisadoptedtooptimizethehyper-parametersofthemodeltosolvetheproblem ofreducedpredictionaccuracyduetotheperceivedimpropersetings.Simulationexperimentsarecarredoutwiththeactual operationdataofathermalpowerplant in China,andtheresultsshowthattheproposedBayesianoptimizationBiLSTMAdaboost modelhas high predictionaccuracyand stabilityin heatload predictioncomparedwith other network models.
Keywords: heating loadprediction; BiLSTM-Adaboostneural networkprediction;Bayesianoptimizationalgorithm; hyperparameter optimization;prediction accuracy
準確的供熱負荷預測對保障冬季供暖、增強調峰能力、節能減排、經濟運行具有重要意義
傳統供熱負荷預測對大量歷史數據進行擬合計算,然而數學方法無法應對非線性情況。近年來,機器學習模型在電力系統預測領域取得廣泛應用[3-5]。王雅然等利用BP算法預測供熱二次網熱負荷,但模型參數人為設置,可能無法達到最好的預測效果;張騰達等考慮風力因素影響,發揮長短期記憶神經網絡(LSTM)優勢建立供熱預測模型,但在確定模型輸入特征時忽略了供熱系統中一次網等參數對熱負荷預測的影響;謝文舉等8提出利用粒子群算法優化
CNN-LSTM的短期熱負荷預測模型;王耀輝等提出改進沙貓群算法優化CNN-BiLSTM進行熱負荷預測,驗證了多元模型比單一神經網絡具有更好的預測效果。但CNN通常更適用于在計算機視覺領域提取圖像中的空間特征。范斌等[結合SVM與AdaBoost機制的模型對風電功率進行預測,驗證了Adaboost集成強預測器的有效性。
本文綜合考慮自然氣候與供熱一次網等13個參數,利用皮爾遜法篩選模型輸入變量,建立BiLSTM-Adaboost預測模型,并采用貝葉斯算法尋找最佳超參數組合,實現對供熱負荷的準確預測
1系統特性與相關性分析
1.1供熱系統特性
熱電廠所屬的供熱系統由3部分組成,分別是熱源首站、換熱站、熱用戶,熱源與換熱站間由一次循環管網連接而成,換熱站與熱用戶間由二次循環管網連接而成,供回水管道裝有循環泵、電動調節閥等各類測量儀表。
供熱系統在實際運行中存在時變性、時滯性與非線性的系統特性。
1)時變性。季節變化導致用戶在冬季熱負荷需求高,夏季供熱負荷低或為零。且一天當中由于光照與晝夜溫差,熱負荷也呈現白天低、夜晚高的變化規律。
2)時滯性。系統中存在熱傳遞時滯性、控制系統時滯性、管網熱慣性,熱量經由一二次管網傳遞至用戶,以及根據需求調整供熱量時均需要一定的響應時間,且傳熱介質具有熱慣性,這些因素導致熱負荷存在一定程度的延遲。
3)非線性。熱負荷時刻受環境溫度、建筑特性及熱損失等影響,且在換熱站采用換熱器、調節器等非線性設備,是復雜的非線性系統。
1.2 數據預處理
本文獲取了國內某熱電廠一次網2023年9月一12月供暖季的供熱負荷相關數據,包括一次網供水母管溫度、一次網回水母管溫度、供水壓力、回水壓力和瞬時熱負荷值,采樣間隔為 1min 。熱用戶所處地區的氣候數據從羲和大數據能源公開網站獲得,包含氣溫、濕度、氣壓和地面風速等9項天氣數據,數據采樣間隔為 1h 。一次網參數是連續變化的,所以將1h內的60個數值取平均值作為每小時的數值與氣象數據一一對應,得到原始數據。
在熱電聯產機組實際運營的期間,可能會由于下列情況產生測量異常值,導致影響熱負荷與一次網參數的準確性: ① 因電廠設備如鍋爐、汽輪機等在啟停機或負荷快速變動時導致熱負荷大幅度波動。 ② 數據在傳輸過程中可能因信號衰減、干擾等問題造成誤差。 ③ 熱負荷的測量和控制是一個動態過程,系統的響應時間不一致可能導致數據記錄的波動。 ④ 測量誤差,由設備本身固有的系統誤差所導致的和人員操作不當導致的測量誤差。
38原則是數據分析中常用的離群點分析方法,將一組測定值中與平均值的偏差超過3倍標準差的值判定為異常值。本文首先刪除部分連續空缺值,然后采用38原則發現異常值,由于熱負荷是連續變化的且數據間隔為 1h ,所以利用前后各2個時間點數據的平均值作為該異常值的替代值。如圖1所示為異常值處理前后對比圖。

1.3皮爾遜相關系數法
為探究一次網各參數、氣候因素與熱負荷之間是否存在相關性及關系的強弱程度,本文采用皮爾遜相關系數法計算各因素與熱負荷的相關性系數,并進一步做出相關性分析。
皮爾遜相關系數 K 的取值范圍為[0,1],當絕對值越接近1時,表示該因素與熱負荷相關性越高;而當絕對值越接近0,表示其相關性越低;如果為0,表示該因素與熱負荷無相關性。一般將 |K|gt;0.8 判定為強相關性。
對異常值處理完畢后的數據進行 max-min 歸一化處理,公式為

式中: xmin??xmax 為輸入數據中的最小、最大值, x0…xn 為歸一化之前、之后的值。
皮爾遜相關系數 K 的計算公式如下

式中: n 為數據個數; X,Y 為需計算相關性的2組數據;
為 X,Y 的平均數。計算結果如圖2所示。
根據結果可知,一次網的4個供熱參數的相關性系數均在0.8以上,與熱負荷呈高度正相關。環境氣象因素中氣溫的相關性系數為-0.88,絕對值最高,與熱負荷呈高度負相關性,其次為空氣濕度和散射輻射變量,二者與熱負荷相關系數分別為 0.52,-0.19 ,而與氣溫的相關系數為-0.6、0.41,濕度和散射輻射是通過影響環境氣溫進而對熱負荷產生影響,由此可知,氣溫是主要影響熱負荷的環境氣象變量。所以,本文將供水母管溫度、回水母管溫度、供水壓力、回水壓力和氣溫5個參數作為輸入變量,熱負荷值作為輸出變量。

2 建立預測模型
2.1 BiLSTM算法原理
BiLSTM是在LSTM的基礎上發展起來的一種特殊的循環神經網絡,在序列數據處理時展現出顯著的優勢。與RNN相比,BiLSTM通過引入遺忘門機制,有效緩解并解決梯度爆炸和梯度消失的問題[]
供熱系統中的各部分間存在相互影響的耦合關系,在時間上具有較強的相關性,因此需要一個能夠捕捉這種時間依賴性的網絡。BiLSTM作為被改進的雙層特殊類型的循環神經網絡,在解決此類需要綜合前后信息進行決策的任務時具有明顯優勢。
標準LSTM單元示意圖如圖3所示,其核心為3個門:遺忘門、輸入門、輸出門。圖3中最上層經過遺忘門與輸入門后輸出LSTM單元的部分為聯通全部神經元的“主傳送帶”,負責主要信息的傳送。遺忘門作用是決定哪些信息從記憶單元中遺忘,它使用Sigmoid激活函數,可以輸出在0到1之間的值,可以理解為保留信息的比例。輸入門決定哪些新信息被存儲在記憶單元中。輸出門決定了下一個隱藏狀態,即生成當前時間步的輸出并傳遞到下一時間步。
圖3中, xt 為此單元的輸入, ht 為此單元的輸出,標準LSTM的更新計算公式為

BiLSTM是由前向和后向雙層LSTM組合而成,能夠同時處理過去和未來的信息,更有效地挖掘時間序列數據之間的隱含關系。網絡結構如圖4所示。

圖中, xt 為神經網絡的輸入層, yt 為輸出層, hfw?hbw 分別為前向和后向的LSTM層計算向量,可得最終隱藏狀態 ht 和輸出 y 為

式中: α 為取值在 (0,1) 之間的常數。
2.2 Adaboost原理
Adaboost作為一種集成學習方法,通過迭代過程構建多個弱回歸器,并最終將其組合成一個強回歸器AdaBoost的核心思想是在每次迭代中調整訓練數據的權重,使得先前回歸誤差較大的樣本在后續的學習過程中具有更高的權重,用更新后的權值對新數據進行處理后,輸入到弱回歸器中進行下一輪訓練,最終將所有弱回歸器組合起來[12]。Adaboost訓練方法如下。
1)初始訓練數據樣本的權重分布,即為每個訓練樣本分配一個初始權重

2)對于 t=1,2,3,…,T. ,按照以下步驟進行權重調整。
第一,在訓練第 χt 個弱預測器時,對包含權重分布Dt 的訓練集進行訓練并得到弱預測器 Gt(x) 。
第二,計算每個弱預測器的預測總誤差 et 為

式中: Gt(xi) 是預測輸出; yi 是期望輸出; φ 是設定的1個閾值。
第三,根據計算的誤差和計算當前弱分類器的權重系數 αt

第四,更新訓練集的權重分布

式中: Zt 為歸一化因子
3)最終構建 T 個弱預測器的線性組合,組成強預 測器為

2.3 貝葉斯優化算法
調整超參數有助于避免過擬合和欠擬合的問題,貝葉斯優化算法是一種有效的全局優化算法,可以避免耗時長及易陷入局部最優的問題[13]。
葉斯優化是一個迭代過程。在開始優化之前,貝葉斯優化使用先驗分布來表示對目標函數的認知,在每次迭代中,通過觀察目標函數在之前采樣點處的取值,更新高斯過程模型的參數,得到新的后驗分布,并選擇下一個采樣點。這樣不斷地迭代,直到達到預先設定的停止條件為止。高斯過程用來建模待優化的目標函數,對于已觀測集合 D/={(x1,y1),(x2,y2),…,(xn,yn)},f 為未知目標函數,則其后驗概率公式為

觀測值為
yn=f(xn)+εn,
式中: Γp(D1:n) 為邊際似然分布; p(D1:n|f) 為 y 的似然分布; p(f) 為先驗概率; 1n 為決策向量; εn 為觀測誤差。
在選取下一個采樣點 xn+1 時,使用概率改進的PI函數作為采集函數 an ,并對其最大化,函數表達式為
an(x;D1n)=p(f(x)?f(x+)-θ)

xn+1=argmaxan(x;D1n),
式中: f(x) 為高斯過程所得目標值; f(x+) 為當下最佳目標值; ?x 為高斯分布累計密度函數; θ 是平衡全局與局部搜索關系的參數 ;μ(x),σ(x) 為目標函數的均值和方差。
3 算例分析
3.1熱負荷預測模型
BiLSTM能夠捕捉時間序列數據中的長期依賴關系,同時考慮到數據的前向和后向信息,這對于提高預測的準確性至關重要。BiLSTM的這種特性使其在處理復雜的時序問題時具有顯著優勢。通過Adaboost算法集成多個BiLSTM弱預測器,自動調整各個模型的權重,構成精度更高的強預測器。BiLSTM-Adaboost模型中存在3個重要的超參數,分別為學習率、隱藏層大小、正則化參數,貝葉斯優化基于已有數據的高效探索,確保了模型在有限的迭代次數內快速收斂至最優或近似最優的超參數配置。通過貝葉斯優化方法智能地調整BiLSTM網絡中的超參數,迭代尋優最佳取值組合,從而避免了因手動調參的盲目性導致的準確度下降問題。本文構建貝葉斯優化BiLSTM-Ad-aboost的熱負荷預測模型,模型結構圖如圖5所示。

3.2模型參數設置
為驗證本文構建的預測模型的優越性,分別采用BP神經網絡、CNN神經網絡、標準LSTM神經網絡和BiLSTM神經網絡,在采用相同電廠歷史數據前提下對熱電聯產機組的熱負荷進行預測。各模型參數設置如下。
① BP神經網絡采用單層BP層,隱藏神經元個數設為64個。 ②CNN 神經網絡設置3層卷積層,卷積核分別設為8、16、32個。 ③ LSTM神經網絡采用單層LSTM層,隱藏神經元個數設為64個。 ④ BiLSTM神經網絡采用雙層LSTM層,隱藏神經元個數設為64個。⑤ 貝葉斯優化算法迭代次數50次,超參數的取值范圍設置為學習率[0.001,0.01]、正則化參數取值范圍[0.0001,0.001]、神經元個數在[10,100]之間取整。 ⑥ Adaboost中弱預測器總數T設為10個。
上述模型批量大小設置為16,最大進化次數設為150次,采用學習率自適應的Adam優化算法,設置延時步長為6,預測步長為1,即用6個歷史數據對未來1h的熱負荷值進行單步預測作為輸出。初始學習率均設為0.001,正則化參數均設為0.001。激活函數均為Relu函數。
3.3 模型評價指標
選用均方誤差(MSE)平均絕對誤差(MAE)、平均相對百分比誤差(MAPE)用作衡量模型準確度指標,擬合系數 (R2) 作衡量模型擬合程度指標,取值范
圍在[0,1],越接近1表示模型擬合數據的程度越好。




式中: n 為樣本測試集的總數, yi 為樣本的真實值,
為模型預測值。
3.4 預測結果對比分析
按8:2比例將數據集劃分訓練集與測試集,采用不同模型進行訓練,利用測試集數據對模型的預測效果進行驗證。截取測試樣本中某2天內的熱負荷預測結果繪圖,預測結果與評價指標如圖6與表1所示。

結果表明,BiLSTM網絡模型能夠更好地跟蹤實際值的變化,相較BP、CNN、標準LSTM網絡具有更好的預測精度。
為驗證本文使用貝葉斯優化算法及引人Adaboost算法的優越性,分別采用貝葉斯優化BiLSTM、貝葉斯優化BiLSTM-Adaboost模型預測,預測結果與評價指標如圖7與表2所示。



超參數經過貝葉斯算法優化后的取值:學習率為0.0046,隱藏層神經元數為29,正則化參數為0.000245。經貝葉斯優化超參數的BiLSTM模型比BiLSTM的MSE,MAE,MAPE 分別減少 23.51%,13.86%,22.46% R2 提高了 3.194% 。
添加Adaboost算法對10個貝葉斯-BiLSTM弱預 測器加權組合構成貝葉斯-BiLSTM-Adaboost強預測 器,比貝葉斯-BiLSTM算法的 MSE,MAE,MAPE 分別 減少 11.13%.11.52%.17.31% ,擬合系數達到 90.18% , 進一步提升了預測模型的準確性。
4結論
本文建立了基于貝葉斯優化BiLSTM-Adaboost網絡的預測模型,用于實現對熱電廠熱負荷的準確預測。首先,利用38原則對某電廠原始運行數據進行預處理,并綜合考慮供熱一次網參數及氣象因素,通過皮爾遜相關系數法篩選模型的輸入特征變量。然后,利用BiLSTM網絡能夠前向后向捕捉長時間依賴關系的優勢,與Adaboost集成算法相結合,并采用貝葉斯優化神經網絡的超參數,解決了由于人為設置不當導致精度缺失的問題。最后,通過仿真實驗驗證了本文所提貝葉斯優化BiLSTM-Adaboost模型相比其他神經網絡準確度較高,能夠實現對未來熱負荷值較為精準的預測。
參考文獻:
[1]周振起,王盛華.基于氣象因素的供熱機組熱負荷預測方法的改進[J].東北電力大學學報,2018,38(5):64-68.
[2]石兆玉.供熱系統運行調節與控制[M].北京:清華大學出版社,1994:172-174.
[3]陳簡,張驚雷.基于注意力機制的TCN-BiGRU模型短期風電功率預測[J].天津理工大學學報,2024,4(5):69-74.
[4]劉立巍,周建新,劉培棟,等.基于KNN-LSTM的區域熱負荷短期預測及在機組熱電可行域的應用研究[J]熱能動力工程,2023,38(3):91-97.
[5]SONGJC,ZHANGL Y,XUE GX,etal. Predictinghourlyheating load in a district heating system based on a hybrid CNN-LSTM model[J].Energy and Buildings,2021(243):110998.
[6]王雅然,宋子旭,由世俊,等.集成奇異譜分析與神經網絡的熱負荷預測算法[J].天津大學學報(自然科學與工程技版),2023,56(6):573-578.
[7]張騰達,李琦,陳波.基于LSTM的熱力站短期熱負荷預測研究[J].計算機仿真,2022,39(9):507-512.
[8]謝文舉,薛貴軍,白宇.基于PSO-CNN-LSTM的短期熱負荷預測模型[J].計算機仿真,2024,41(4):102-107,278.
[9]王耀輝,薛貴軍,趙廣昊.基于改進沙貓群算法優化CNN-BiLSTM的熱負荷預測[J].現代電子技術,2024,47(14):20-29.
[10]范斌,李豫明,郭強強,等.基于PSO-SVM-AdaBoost 的超短期風電功率預測J內蒙古農業大學學報(自然科學版),2025,46(3):54-61.
[11]王晨,李又軒,王淑俠,等.基于ICEEMDAN分解重構的BiLSTM-KELM短期電力負荷預測J科學技術與工程,2024,24(32) :13836-13843.
[12]杜董生,連賀,任一鳴,等.基于改進VMD與Adaboost-NGO-KELM的PEMFC故障診斷[J/OL].控制工程,1-12[2025-06-30].https://doi.org/10.14107/j.cnki.kzgc.20240573.
[13]呂游,吳創,翁明楷,等.基于貝葉斯優化的LSTM火電機組一次調頻能力辨識方法[J].熱能動力工程,2024,39(3):57-64.