薛普寧, 周志剛, 蔣 毅, 陳 昕, 方修睦, 劉 京
(1.哈爾濱工業(yè)大學(xué) 建筑學(xué)院, 黑龍江 哈爾濱 150006; 2.哈爾濱工業(yè)大學(xué),寒地城鄉(xiāng)人居環(huán)境科學(xué)與技術(shù)工業(yè)和信息化部重點(diǎn)實(shí)驗(yàn)室, 黑龍江 哈爾濱 150006;.黑龍江省計(jì)算中心, 黑龍江 哈爾濱 150026)
集中供熱是保障人民生產(chǎn)生活的重要基礎(chǔ)能源設(shè)施。近年來(lái),在我國(guó)能源戰(zhàn)略轉(zhuǎn)型的大背景下,隨著智慧城市、“互聯(lián)網(wǎng)+”智慧能源等概念的提出,供熱行業(yè)也興起了智慧供熱的研究浪潮[1]。智慧供熱是以數(shù)字化、網(wǎng)絡(luò)化、智能化的信息技術(shù)設(shè)施為基礎(chǔ),以用戶為目標(biāo),以低碳、舒適、高效為主要特征,以透徹感知、廣泛互聯(lián)、深度智能為技術(shù)特點(diǎn)的現(xiàn)代供熱方式[2]。其內(nèi)涵是利用傳感器透徹感知供熱系統(tǒng)信息,網(wǎng)絡(luò)傳輸信息全面互聯(lián)互通,以及系統(tǒng)實(shí)現(xiàn)智能決策和智能控制。
熱負(fù)荷的準(zhǔn)確預(yù)測(cè)是實(shí)現(xiàn)供熱系統(tǒng)運(yùn)行控制、決策優(yōu)化,提高供熱效率,降低運(yùn)行維護(hù)成本的重要前提。由于供熱系統(tǒng)具有規(guī)模龐大、結(jié)構(gòu)復(fù)雜、熱惰性高等特點(diǎn),難以通過(guò)數(shù)學(xué)建模方法建立有效的熱負(fù)荷預(yù)測(cè)模型。機(jī)器學(xué)習(xí)通過(guò)從數(shù)據(jù)中學(xué)習(xí)模型從而賦予計(jì)算機(jī)在特定任務(wù)上的預(yù)測(cè)或決策能力。隨著數(shù)據(jù)存儲(chǔ)與計(jì)算機(jī)技術(shù)的飛速發(fā)展,機(jī)器學(xué)習(xí)在科研和商業(yè)領(lǐng)域得到廣泛的應(yīng)用,也為熱負(fù)荷預(yù)測(cè)提供了新的思路。供熱企業(yè)在供熱系統(tǒng)的運(yùn)行管理過(guò)程中,儲(chǔ)存了大量的歷史運(yùn)行數(shù)據(jù),這些數(shù)據(jù)反映了供熱系統(tǒng)潛在的運(yùn)行特性,使得采用機(jī)器學(xué)習(xí)算法建立熱負(fù)荷預(yù)測(cè)模型成為可能。
國(guó)內(nèi)外已有許多學(xué)者開展了機(jī)器學(xué)習(xí)算法在熱負(fù)荷預(yù)測(cè)領(lǐng)域的應(yīng)用研究,常用算法包括多元線性回歸[3]、自回歸積分移動(dòng)平均[4]、支持向量回歸[5]、極限學(xué)習(xí)機(jī)[6]、回歸樹[7]、梯度提升[8]、神經(jīng)網(wǎng)絡(luò)[9]等。然而,目前的研究多集中于熱負(fù)荷的單步預(yù)測(cè),模型輸出結(jié)果為未來(lái)某一時(shí)刻的熱負(fù)荷預(yù)測(cè)值。實(shí)現(xiàn)供熱系統(tǒng)的決策控制,需要提前掌握未來(lái)一段時(shí)期內(nèi)的熱負(fù)荷的動(dòng)態(tài)概況,即對(duì)熱負(fù)荷進(jìn)行多步預(yù)測(cè)。
為了實(shí)現(xiàn)供熱系統(tǒng)熱負(fù)荷的多步預(yù)測(cè),本文提出了一種基于機(jī)器學(xué)習(xí)的供熱負(fù)荷多步遞歸預(yù)測(cè)策略,利用支持向量回歸(support vector regression,SVR)、極限梯度提升(extreme gradient boosting,XGBoost)分別建立了熱負(fù)荷單步預(yù)測(cè)模型,并根據(jù)實(shí)際供熱系統(tǒng)案例對(duì)所提出的多步遞歸預(yù)測(cè)策略的預(yù)測(cè)性能進(jìn)行了評(píng)估。本文中所有模型均通過(guò)R語(yǔ)言予以實(shí)現(xiàn)。
熱負(fù)荷預(yù)測(cè)屬于機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)的任務(wù)是訓(xùn)練一個(gè)模型,使得模型能夠?qū)o定的輸入變量,對(duì)其相應(yīng)的輸出變量做出一個(gè)好的預(yù)測(cè)。這里的輸入變量指熱負(fù)荷的影響因子,輸出變量是要預(yù)測(cè)的目標(biāo)時(shí)刻的熱負(fù)荷。在機(jī)器學(xué)習(xí)中,模型的每一個(gè)輸入變量被稱為一個(gè)特征或?qū)傩裕P鸵A(yù)測(cè)的目標(biāo)變量則被稱為標(biāo)簽。一個(gè)由特征和標(biāo)簽所組成的向量,被稱為一個(gè)樣本或示例。一組樣本構(gòu)成的集合稱為數(shù)據(jù)集[10]2-3。
一般地,我們用x=(x1,x2,…,xd)T表示一個(gè)樣本的所有特征組成的向量,稱為特征向量,d稱為樣本的維數(shù);用y表示樣本的標(biāo)簽;用D={(x1,y1),(x2,y2),…,(xn,yn)}表示包含n個(gè)樣本的數(shù)據(jù)集[10]2-3。
熱負(fù)荷的影響因子可分為4類:時(shí)間變量、氣象參數(shù)、系統(tǒng)運(yùn)行數(shù)據(jù)和社會(huì)因素(用戶行為)[4, 11]。時(shí)間變量即年、月、日、小時(shí)等參數(shù);氣象參數(shù)包括室外空氣溫濕度、太陽(yáng)輻射、風(fēng)速等,是熱負(fù)荷最顯著的影響因子;系統(tǒng)運(yùn)行數(shù)據(jù)是反映供熱系統(tǒng)運(yùn)行狀態(tài)的供回水溫度、流量、供熱量、控制信號(hào)等變量;社會(huì)因素指熱用戶的用熱模式、社會(huì)活動(dòng)、自主調(diào)節(jié)等行為。雖然熱負(fù)荷的影響因子很多,相關(guān)研究表明,只需選擇少數(shù)關(guān)鍵的影響因子如時(shí)間、室外空氣溫度、歷史供熱量(熱負(fù)荷)作為熱負(fù)荷預(yù)測(cè)的數(shù)據(jù)集的特征,就可以得到較準(zhǔn)確的熱負(fù)荷預(yù)測(cè)結(jié)果[12]。
考慮到目前我國(guó)供熱系統(tǒng)缺少對(duì)用戶行為的連續(xù)監(jiān)測(cè)記錄,而且氣象參數(shù)中也一般只記錄室外空氣溫度,本文只選擇時(shí)間變量、室外空氣溫度和歷史熱負(fù)荷這3種類型的熱負(fù)荷影響因子作為熱負(fù)荷預(yù)測(cè)中特征向量的特征。
本文提出的熱負(fù)荷多步遞歸預(yù)測(cè)策略是對(duì)熱負(fù)荷單步預(yù)測(cè)模型的拓展,因此首先給出熱負(fù)荷單步預(yù)測(cè)模型的介紹。
熱負(fù)荷單步預(yù)測(cè)模型是利用特征向量預(yù)測(cè)樣本的標(biāo)簽,即預(yù)測(cè)未來(lái)目標(biāo)時(shí)刻的熱負(fù)荷值。該模型可用式(1)表示[13]:
(1)

f——熱負(fù)荷單步預(yù)測(cè)模型
t——時(shí)刻
Tt+1——t+1時(shí)刻室外空氣溫度的預(yù)報(bào)值
Φt——t時(shí)刻熱負(fù)荷的真實(shí)值
Φt-1——t-1時(shí)刻熱負(fù)荷的真實(shí)值
Φt-(m-1)——t-(m-1)時(shí)刻熱負(fù)荷的真實(shí)值
m——特征向量中歷史熱負(fù)荷的總數(shù)目

圖2為熱負(fù)荷多步遞歸預(yù)測(cè)的流程。該流程可分為4個(gè)步驟:數(shù)據(jù)預(yù)處理、數(shù)據(jù)集劃分、模型訓(xùn)練和模型評(píng)估。
2.4.1 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理可細(xì)分為3個(gè)子步驟:特征選擇、特征工程和特征變換。通過(guò)數(shù)據(jù)預(yù)處理將用于熱負(fù)荷預(yù)測(cè)的數(shù)據(jù)集變換為SVR模型和XGBoost模型所要求的格式。

圖1 熱負(fù)荷多步遞歸預(yù)測(cè)策略

圖2 熱負(fù)荷多步遞歸預(yù)測(cè)的流程
特征選擇旨在確定數(shù)據(jù)集的特征向量中歷史熱負(fù)荷的總數(shù)目m。本文采用偏自相關(guān)函數(shù)(partial autocorrelation function,符號(hào)為P)對(duì)熱負(fù)荷時(shí)間序列進(jìn)行分析以確定最優(yōu)的m值。對(duì)于一個(gè)熱負(fù)荷時(shí)間序列,偏自相關(guān)函數(shù)移除當(dāng)前值Φt與歷史值Φt-i之間的所有變量Φt-1,Φt-2,…,Φt-i+1帶來(lái)的影響后,度量Φt和Φt-i的相關(guān)性[14]。若P絕對(duì)值超過(guò)顯著性水平,表明歷史值與當(dāng)前值具有很強(qiáng)的相關(guān)性,則可將該歷史值用作樣本的一個(gè)特征。在本文的特征選擇中,當(dāng)熱負(fù)荷時(shí)間序列的P絕對(duì)值不再大于顯著性水平時(shí),對(duì)應(yīng)的m值的最大值作為最終的m值。
特征工程旨在將類別特征變換為數(shù)值特征。SVR和XGBoost均要求輸入變量為數(shù)值特征。本文在特征工程中采用one-hot編碼(one-hot encoding)方法。對(duì)于一個(gè)有k個(gè)類別取值的類別特征,one-hot編碼用長(zhǎng)度為k的二元向量對(duì)k個(gè)類進(jìn)行編碼,二元向量的每個(gè)元素與每個(gè)類一一對(duì)應(yīng),當(dāng)類別取值為i時(shí),相應(yīng)的二元變量的第i個(gè)元素為1,其余元素均為0[15]。

(2)
式中x′——經(jīng)特征變換后,一個(gè)特征的特征值的新值
x——一個(gè)特征的特征值的原值
xmin——一個(gè)特征的原取值區(qū)間的下限
xmax——一個(gè)特征的原取值區(qū)間的上限


2.4.2 數(shù)據(jù)集劃分
經(jīng)數(shù)據(jù)預(yù)處理后的數(shù)據(jù)集,本文采用留出法(hold-out)直接將其劃分為兩個(gè)互斥的子集,其中一個(gè)子集用作訓(xùn)練集,另一個(gè)作為測(cè)試集。我們?cè)谟?xùn)練集上建立熱負(fù)荷單步預(yù)測(cè)模型,然后在測(cè)試集上,利用所提出的多步遞歸預(yù)測(cè)策略預(yù)測(cè)熱負(fù)荷,然后對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)估。
2.4.3 模型訓(xùn)練
本文分別采用SVR模型和XGBoost模型建立熱負(fù)荷單步預(yù)測(cè)模型。SVR模型在之前有很多成功的應(yīng)用,因此本文選擇SVR作為基準(zhǔn)模型以評(píng)估后續(xù)熱負(fù)荷預(yù)測(cè)的結(jié)果。
① SVR模型
SVR是用于回歸任務(wù)的支持向量機(jī)模型[10]121-145。學(xué)習(xí)目標(biāo)是基于訓(xùn)練集在輸入空間中得到一個(gè)超平面,使得預(yù)測(cè)變量的真實(shí)值與超平面對(duì)應(yīng)的預(yù)測(cè)值的偏差盡可能小。對(duì)于熱負(fù)荷預(yù)測(cè)這種在輸入空間中的非線性可分問(wèn)題,SVR通過(guò)引入核函數(shù),將樣本的特征向量由輸入空間映射到更高維度的特征空間中,使得非線性可分問(wèn)題轉(zhuǎn)換為在高維特征空間中的線性可分問(wèn)題。SVR模型可表示為:
(3)
式中fsvr——SVR模型
ws——SVR的超平面的法向量
φ——將特征向量由原輸入空間映射到高維特征空間的核函數(shù)
b——SVR的超平面的位移項(xiàng)
本文中,核函數(shù)φ采用高斯核函數(shù),其計(jì)算公式為:
(4)
式中κ——高斯核函數(shù)
σ——高斯核函數(shù)的帶寬參數(shù)
SVR模型的訓(xùn)練可以形式化為一個(gè)凸二次規(guī)劃問(wèn)題,優(yōu)化目標(biāo)是結(jié)構(gòu)風(fēng)險(xiǎn)最小化,優(yōu)化變量是ws和b[10]121-145。如果ws和b的某一取值使得式(5)取得最小值,那么此時(shí)ws和b的取值稱為該優(yōu)化問(wèn)題的最優(yōu)解,該最優(yōu)解對(duì)應(yīng)的超平面即為最終的SVR模型。
(5)
(6)
式中 C——正則化常數(shù)
lε——不敏感損失函數(shù)
ε——不敏感損失參數(shù)
②XGBsoot模型
XGBoost是一種提升樹模型,屬于集成學(xué)習(xí)技術(shù),通過(guò)構(gòu)建并結(jié)合多個(gè)基學(xué)習(xí)器來(lái)完成學(xué)習(xí)任務(wù)。XGBoost模型采用的基學(xué)習(xí)器為回歸樹,即XGBoost模型是多個(gè)回歸樹組成的集合[16],可用式(7)表示:
(7)

fcart——回歸樹
K——回歸樹的總數(shù)目
對(duì)于一棵具有N個(gè)葉結(jié)點(diǎn)的回歸樹,設(shè)w=(w1,w2,…,wN)T為葉結(jié)點(diǎn)的權(quán)重向量,可以用函數(shù)q:x→{1,2,…,N}描述回歸樹的內(nèi)部結(jié)構(gòu),函數(shù)值q(x)表示樣本被劃歸到的葉結(jié)點(diǎn)的索引值。如式(8)所示,函數(shù)q和葉結(jié)點(diǎn)權(quán)重向量w描述了一棵回歸樹的所有預(yù)測(cè)信息。回歸樹的復(fù)雜度函數(shù)Ω可用式(9)表示。
fcart(x)=wq(x)
(8)
(9)
式中w——權(quán)重向量w中的一個(gè)元素,表示回歸樹中一個(gè)葉結(jié)點(diǎn)的權(quán)重值
Ω——描述回歸樹的復(fù)雜度的函數(shù)
γ——損失函數(shù)值減少的最小閾值,為常數(shù)
λ——葉結(jié)點(diǎn)的權(quán)重向量的L2正則化項(xiàng)
XGBoost模型訓(xùn)練的優(yōu)化目標(biāo)函數(shù)為[16]:
(10)
式中J——目標(biāo)函數(shù)值
l——損失函數(shù)
XGBoost模型的訓(xùn)練采用基于加性模型的訓(xùn)練策略,依次訓(xùn)練每一棵回歸樹。第z輪模型訓(xùn)練時(shí),保持已訓(xùn)練的回歸樹fcart,1,fcart,2,...,fcart,z-1不變,然后訓(xùn)練新的回歸樹fcart,z,如果回歸樹fcart,z可以優(yōu)化目標(biāo)函數(shù)J,則將fcart,z加到XGBoost模型中。該過(guò)程循環(huán)進(jìn)行,直到XGBoost模型包含K個(gè)回歸樹。對(duì)于熱負(fù)荷預(yù)測(cè)任務(wù),損失函數(shù)l一般為均方誤差,因此,優(yōu)化目標(biāo)函數(shù)式可改寫為[16]:
(11)
(12)
(13)
Ij={i|q(xi)=j,j=1,2,…,N}
(14)
式中J(z)——第z輪模型訓(xùn)練時(shí)的目標(biāo)函數(shù)值
Ij——?jiǎng)澐值交貧w樹中第j個(gè)葉結(jié)點(diǎn)的所有樣本的索引值的集合
g——損失函數(shù)l的一階導(dǎo)數(shù)
h——損失函數(shù)l的二階導(dǎo)數(shù)

2.4.4 模型評(píng)估
當(dāng)模型訓(xùn)練結(jié)束后,利用建立的基于SVR的熱負(fù)荷單步預(yù)測(cè)模型和基于XGBoost的熱負(fù)荷單步預(yù)測(cè)模型,采取圖1所示的熱負(fù)荷多步遞歸預(yù)測(cè)策略,分別對(duì)測(cè)試集中的樣本,預(yù)測(cè)其熱負(fù)荷,并對(duì)熱負(fù)荷的預(yù)測(cè)結(jié)果進(jìn)行評(píng)估。
本文采用平均絕對(duì)誤差(mean absolute error,MAE)和平均絕對(duì)百分誤差(mean absolute percentage error,MAPE)對(duì)熱負(fù)荷預(yù)測(cè)的結(jié)果進(jìn)行評(píng)價(jià)。兩個(gè)指標(biāo)的計(jì)算公式為:
(15)
(16)
式中IMAE——平均絕對(duì)誤差
IMAPE——平均絕對(duì)百分誤差
IMAE和IMAPE值越小,表明熱負(fù)荷的預(yù)測(cè)結(jié)果越精確;反之,則表明熱負(fù)荷的預(yù)測(cè)結(jié)果越差。
本文收集了長(zhǎng)春市某集中供熱系統(tǒng)熱源首站2017年12月22日至2018年3月7日的運(yùn)行數(shù)據(jù),數(shù)據(jù)采集的時(shí)間步長(zhǎng)為1 h。用于熱負(fù)荷預(yù)測(cè)的數(shù)據(jù)集包含2個(gè)時(shí)間變量(月份和小時(shí))、室外空氣溫度以及逐時(shí)熱負(fù)荷。表1為逐時(shí)熱負(fù)荷和室外空氣溫度的統(tǒng)計(jì)概況。我們采用熱負(fù)荷多步遞歸預(yù)測(cè)策略,按照?qǐng)D2的流程,對(duì)該供熱系統(tǒng)未來(lái)24 h的逐時(shí)熱負(fù)荷進(jìn)行預(yù)測(cè),即預(yù)測(cè)范圍H=24。

表1 逐時(shí)熱負(fù)荷和室外空氣溫度概況
首先通過(guò)特征選擇步驟確定用作模型輸入特征的歷史熱負(fù)荷的總數(shù)目m。圖3為逐時(shí)熱負(fù)荷時(shí)間序列的偏自相關(guān)分析結(jié)果。我們將顯著性水平設(shè)置為0.15。如圖3所示,當(dāng)時(shí)間超過(guò)24 h后,P絕對(duì)值不再大于0.15,也就是說(shuō)滯后時(shí)間超過(guò)24 h的歷史熱負(fù)荷與熱負(fù)荷當(dāng)前值的相關(guān)性很小。因此,我們?cè)O(shè)定用于模型輸入特征的歷史熱負(fù)荷數(shù)目m=24。

圖3 逐時(shí)熱負(fù)荷時(shí)間序列的偏自相關(guān)分析結(jié)果
然后通過(guò)特征工程對(duì)類別特征月份和小時(shí)進(jìn)行處理,采用one-hot編碼將月份和小時(shí)分別變換為數(shù)值特征。然后使用最小-最大規(guī)范化,把所有的數(shù)值特征映射到新的取值區(qū)間[0, 1]內(nèi)。最終,通過(guò)數(shù)據(jù)預(yù)處理,數(shù)據(jù)集共包含53個(gè)特征。
我們將預(yù)處理后的數(shù)據(jù)集進(jìn)行劃分,其中訓(xùn)練集包含61個(gè)供暖日的數(shù)據(jù),測(cè)試集包含14個(gè)供暖日的數(shù)據(jù)。
在訓(xùn)練SVR模型和XGBoost模型時(shí),需要設(shè)定一些參數(shù),參數(shù)配置不同,建立的模型的性能往往有顯著差別。這些參數(shù)的設(shè)定過(guò)程稱為超參數(shù)優(yōu)化。本文對(duì)SVR模型的3個(gè)超參數(shù)進(jìn)行優(yōu)化,包括正則化常數(shù)C、不敏感損失參數(shù)ε、高斯核函數(shù)的帶寬參數(shù)σ。對(duì)XGBoost模型的4個(gè)超參數(shù)進(jìn)行優(yōu)化,包括回歸樹的總數(shù)目K、回歸樹的深度dcart、訓(xùn)練過(guò)程中的樣本的子采樣率r以及學(xué)習(xí)率η。回歸樹的深度dcart控制回歸樹中根節(jié)點(diǎn)到葉結(jié)點(diǎn)的路徑的最大長(zhǎng)度;子采樣率r描述XGBoost模型的訓(xùn)練過(guò)程的隨機(jī)性;學(xué)習(xí)率η又被稱為收縮因子,其作用是在XGBoost模型的每一輪訓(xùn)練過(guò)程中,調(diào)節(jié)新添加的回歸樹的權(quán)重向量在XGBoost模型中所占的比例[16]。
我們采用10折交叉驗(yàn)證和網(wǎng)格搜索方法在訓(xùn)練集上確定最優(yōu)的超參數(shù)。SVR和XGBoost的超參數(shù)優(yōu)化結(jié)果見表2。根據(jù)超參數(shù)優(yōu)化結(jié)果,在訓(xùn)練集上學(xué)習(xí)得到最終的熱負(fù)荷單步預(yù)測(cè)模型。

表2 SVR和XGBoost的超參數(shù)設(shè)置
采用圖1所示的熱負(fù)荷多步遞歸預(yù)測(cè)策略,利用建立的基于SVR的熱負(fù)荷單步預(yù)測(cè)模型和基于XGBoost的熱負(fù)荷單步預(yù)測(cè)模型,依據(jù)測(cè)試集中14個(gè)供暖日的樣本,分別對(duì)該供熱系統(tǒng)在這14個(gè)供暖日的逐時(shí)熱負(fù)荷進(jìn)行預(yù)測(cè),并采用式(15)和式(16)對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)估。
表3給出了基于SVR的熱負(fù)荷多步遞歸預(yù)測(cè)策略和基于XGBoost的熱負(fù)荷多步遞歸預(yù)測(cè)策略在測(cè)試集上的總預(yù)測(cè)精度,圖4描繪了兩個(gè)模型在其中某一個(gè)測(cè)試供暖日的詳細(xì)預(yù)測(cè)結(jié)果。由圖4可知,基于SVR的熱負(fù)荷多步遞歸預(yù)測(cè)策略和基于XGBoost的熱負(fù)荷多步遞歸預(yù)測(cè)策略均可以對(duì)未來(lái)24 h的逐時(shí)熱負(fù)荷進(jìn)行準(zhǔn)確預(yù)測(cè),且基于XGBoost的熱負(fù)荷多步遞歸預(yù)測(cè)策略的預(yù)測(cè)精度要高于基于SVR的熱負(fù)荷多步遞歸預(yù)測(cè)策略的預(yù)測(cè)精度。

表3 SVR和XGBoost在測(cè)試集上的熱負(fù)荷多步遞歸預(yù)測(cè)精度的總預(yù)測(cè)精度

圖4 SVR和XGBoost在某測(cè)試日的逐時(shí)熱負(fù)荷多步遞歸預(yù)測(cè)結(jié)果
我們進(jìn)一步對(duì)基于SVR的熱負(fù)荷多步遞歸預(yù)測(cè)策略和基于XGBoost的熱負(fù)荷多步遞歸預(yù)測(cè)策略的預(yù)測(cè)穩(wěn)定性進(jìn)行評(píng)估。針對(duì)SVR和XGBoost在每個(gè)測(cè)試供暖日的預(yù)測(cè)結(jié)果,我們繪制其預(yù)測(cè)精度的箱線圖,見圖5。箱線圖可以度量預(yù)測(cè)精度的散布程度。由圖5可知,XGBoost在這14個(gè)測(cè)試供暖日的預(yù)測(cè)精度的分布更加集中,這表明基于XGBoost的熱負(fù)荷多步遞歸預(yù)測(cè)策略在預(yù)測(cè)穩(wěn)定性方面優(yōu)于基于SVR的熱負(fù)荷多步遞歸預(yù)測(cè)策略。

圖5 SVR和XGBoost的逐時(shí)熱負(fù)荷多步遞歸預(yù)測(cè)精度的箱線圖
XGBoost模型通過(guò)將多個(gè)學(xué)習(xí)器進(jìn)行結(jié)合,往往可以獲得比單一學(xué)習(xí)器更優(yōu)越的泛化性能。從預(yù)測(cè)精度和預(yù)測(cè)穩(wěn)定性角度看,XGBoost模型更適用于熱負(fù)荷多步遞歸預(yù)測(cè)任務(wù)。也就是說(shuō),通過(guò)將多個(gè)回歸樹的預(yù)測(cè)結(jié)果集成,XGBoost模型可以在熱負(fù)荷多步遞歸預(yù)測(cè)任務(wù)中取得比SVR模型更好的預(yù)測(cè)結(jié)果。
如2.3節(jié)所述,熱負(fù)荷遞歸預(yù)測(cè)策略是對(duì)熱負(fù)荷單步預(yù)測(cè)模型的拓展。在熱負(fù)荷預(yù)測(cè)過(guò)程中,遞歸地調(diào)用單步預(yù)測(cè)模型有可能會(huì)產(chǎn)生誤差累積,導(dǎo)致預(yù)測(cè)結(jié)果的精度隨著預(yù)測(cè)范圍H的增大而降低。為分析熱負(fù)荷多步遞歸預(yù)測(cè)的誤差累積程度,我們計(jì)算了基于SVR的熱負(fù)荷多步遞歸預(yù)測(cè)策略和基于XGBoost的熱負(fù)荷多步遞歸預(yù)測(cè)策略,在這14個(gè)測(cè)試采暖日中各時(shí)刻預(yù)測(cè)結(jié)果的IMAE的平均值,結(jié)果見圖6。通過(guò)圖6可以看出,對(duì)于本文中預(yù)測(cè)未來(lái)24 h的逐時(shí)熱負(fù)荷概況的案例,隨著時(shí)間的變化,預(yù)測(cè)結(jié)果的IMAE值的平均值始終在7.5 MW左右波動(dòng)。表明基于SVR的熱負(fù)荷多步遞歸預(yù)測(cè)策略和基于XGBoost的熱負(fù)荷多步遞歸預(yù)測(cè)策略均不會(huì)產(chǎn)生明顯的誤差累積,在預(yù)測(cè)范圍的各時(shí)刻均可以得到較為準(zhǔn)確的熱負(fù)荷預(yù)測(cè)值。

圖6 SVR和XGBoost在各時(shí)刻預(yù)測(cè)結(jié)果MAE的平均值
為實(shí)現(xiàn)集中供熱系統(tǒng)的運(yùn)行優(yōu)化和決策控制,有必要對(duì)熱負(fù)荷的動(dòng)態(tài)概況進(jìn)行預(yù)測(cè)。本文提出了一種基于機(jī)器學(xué)習(xí)的熱負(fù)荷多步遞歸預(yù)測(cè)策略,該策略是對(duì)熱負(fù)荷單步預(yù)測(cè)模型的拓展。詳細(xì)介紹了熱負(fù)荷多步遞歸預(yù)測(cè)的流程,該流程可分為數(shù)據(jù)預(yù)處理、數(shù)據(jù)集劃分、模型訓(xùn)練和模型評(píng)估4個(gè)步驟。為評(píng)估所提出的熱負(fù)荷多步遞歸預(yù)測(cè)策略的適用性,收集了某供熱系統(tǒng)熱源首站2017年12月22日至2018年3月7日的運(yùn)行數(shù)據(jù)。按照熱負(fù)荷多步遞歸預(yù)測(cè)的流程,分別使用SVR模型和XGBoost模型建立了熱負(fù)荷單步預(yù)測(cè)模型,利用所建立的單步預(yù)測(cè)模型,按照提出的熱負(fù)荷多步遞歸預(yù)測(cè)策略,對(duì)該供熱系統(tǒng)未來(lái)24 h的逐時(shí)熱負(fù)荷概況進(jìn)行了預(yù)測(cè),并從多方面評(píng)估了熱負(fù)荷多步遞歸預(yù)測(cè)策略的預(yù)測(cè)性能。主要結(jié)論如下:
① 在預(yù)測(cè)精度和預(yù)測(cè)穩(wěn)定性方面,基于XGBoost的熱負(fù)荷多步遞歸預(yù)測(cè)策略均優(yōu)于基于SVR的熱負(fù)荷多步遞歸預(yù)測(cè)策略。
② 基于SVR的熱負(fù)荷多步遞歸預(yù)測(cè)策略和基于XGBoost的熱負(fù)荷多步遞歸預(yù)測(cè)策略不會(huì)產(chǎn)生明顯的誤差累積,在預(yù)測(cè)范圍內(nèi),各時(shí)刻的預(yù)測(cè)結(jié)果均可以滿足工程精度要求。
③ 熱負(fù)荷多步遞歸預(yù)測(cè)策略可以實(shí)現(xiàn)對(duì)供熱系統(tǒng)短期熱負(fù)荷的動(dòng)態(tài)概況的準(zhǔn)確預(yù)測(cè),為供熱系統(tǒng)的運(yùn)行優(yōu)化和決策控制提供技術(shù)支撐。