吳 燁, 陳湘萍,蔡永翔
(1 貴州大學電氣工程學院, 貴陽 550025;2 貴州電網有限責任公司電力科學研究院, 貴陽 550007)
隨著社會的進步,經濟的發展,建筑能耗也在快速的增長,據統計全球的建筑能耗約占總能耗的40%[1],而中國建筑能耗約占中國能源消耗的21.7%[2]。確有效的建筑能耗預測是節能的基礎[3]。
國內外學者對能耗預測進行了大量的研究,目前常用神經網絡來進行能耗預測。 Kawashima 等[4]提出了基于神經網絡的每小時負荷預測進行預測控制,并與傳統機器學習方法進行對比,得出神經網絡有更好效果的結論;許馨尹等[5]基于EnergyPlus 軟件對辦公建筑在氣候變化的情況下進行能耗模擬,結果表明氣候對建筑能耗有影響;Amber 等[6]建立多元回歸模型對用電能耗進行模擬,結果表明環境溫度對于建筑能耗有著顯著影響。
在基于機器學習方法的能耗預測中,張卓淵[7]提出一種基于生成對抗網絡的建筑能耗預測方法,以LSTM(Long Short-Term Memory Network)神經網絡為生成器,卷積神經網絡(CNN)為判別器,對比其他模型有著更高的精度;井文強等[8]針對局部最優問題,提出改進灰狼優化BP(Back Propagation)神經網絡的預測模型,通過改變原始收斂因子使得該模型有較好的精度和泛化能力;曾國治等[9]基于CNN 的特征提取能力和循環神經網絡(RNN)的時序學習能力,提出了CNN-RNN 模型來預測建筑能耗,效率提高的同時還有不錯的精度;邵必林等[10]基于注意力機制和LSTM 神經網絡建立預測模型,更好的捕捉重要信息并反映變化趨勢。 總的來說,基于機器學習的能耗預測主要是用LSTM 神經網絡、BP 神經網絡,又或者用優化算法優化后神經網絡,例如基于粒子群優化算法(PSO)進行優化、基于灰狼算法(GWO)優化以及基于LM(Levenberg-Marquardt)算法優化等。
EnergyPlus 軟件是美國能源部和勞倫斯·伯克利國家實驗室基于BLAST 和DOE-2 基礎上開發的建筑能耗模擬軟件,能夠用于對建筑的采暖、制冷、照明以及其他能源消耗進行能耗模擬分析,也可以進行二次開發,增加新功能,滿足使用者多樣化的需求[11]。
綜上所述,目前針對能耗預測用的最多的就是神經網絡。 本文基于EnergyPlus 模擬獲得能耗數據,考慮到能耗數據是一個長時間序列數據,因此在神經網絡的選擇上選擇了處理長時間序列較其他神經網絡有優勢的長短期記憶網絡(LSTM)來建立能耗預測模型, 通過平均絕對誤差MAE,均方誤差MSE以及均方根誤差RMSE來判斷訓練網絡預測的精度,并與傳統BP 神經網絡預測模型進行對比,驗證預測結果的準確性。
LSTM 是循環神經網絡的一個變體,解決了傳統循環神經網絡在處理長時間序列時出現的梯度消失和梯度爆炸問題[12]。 LSTM 單元結構圖如圖1 所示。

圖1 LSTM 單元結構圖Fig. 1 LSTM unit structure diagram
LSTM 的門控結構如圖2 所示。 LSTM 通過遺忘門、輸入門和輸出門這3 個特殊的門控結構來實現信息的保護和控制[13]。

圖2 LSTM 的門控結構Fig. 2 Gating structure of LSTM
遺忘門如圖2(a)所示,遺忘門會讀取上一時刻的輸出ht-1和當前的輸入xt,ft輸出的值來確定Ct-1是否丟棄,其計算如式(1):
其中,σ代表的是Sigmoid 激活函數;bf代表偏置向量;Wf代表遺忘門權重系數矩陣。
輸入門如圖2(b)所示,實現信息更新需要兩個步驟,一是通過Sigmoid 層確定更新信息,再由tanh層確定備用更新內容;二是結合兩部分生成的信息對Ct進行一個更新。 其計算如式(2)~式(4):
其中,tanh 代表雙曲正切激活函數;Wi和WC分別代表由σ和tanh 確定的輸入門權重系數矩陣;bi和bC分別代表由σ和tanh 確定的偏置向量;Ct代表當前的狀態。
輸出門如圖2(c)所示,通過運行Sigmoid 激活函數得到ot值,將當前的狀態Ct經過tanh 函數處理后的值與ot值相乘得到ht,得到t時刻的輸出,并且也作為下一時刻的輸入,如式(5)、式(6):
其中,Wo代表輸出門權重系數矩陣;bo代表偏置向量;ot代表的是t時刻的輸出。
本文所用的建筑能耗數據是通過EnergyPlus 軟件模擬得到的,在EnergyPlus 軟件中添加空氣回路(Variable Air Volume,VAV)、冷卻水回路(制冷機以及冷卻塔)、載熱盤管以及鍋爐,形成一個簡單的供暖、通風和空氣調節(Heating Ventilation and Air Conditioning, HVAC)系統,并在理想條件下進行能耗模擬。
在EnergyPlus 軟件中設置HVAC 系統時,主要是對Zone、System 以及Plant 這3 個對象進行設置。對VAV 主要在HVAC Template: System/Zone VAV里進行設置, 在 System VAV 里設置 System Availability Schedule 為Office HVAC、Cooling Coil Design Setpoint 為 13 ℃、 Minimum Outdoor Air Schedule Name 為 Office Minimum OA 以及Economizer Type 為Fixed Dry Bulb 等,其他具體設置見表1。

表1 HVAC 設置表Tab. 1 HVAC setting table
在EnergyPlus 軟件中建立HVAC 系統,考慮到HVAC 系統的復雜度,在本文選用了簡單的HVAC系統,大部分均采用默認數值,因為建筑有5 個區,所以Zone: VAV 要按相同參數設置5 個區。 在辦公建筑中,室內負載對能耗影響較大,本文中室內負載包括人員數量、照明設備以及電氣設備,其中室內負載見表2。

表2 室內負載Tab. 2 Indoor loads
本文中所用的建筑如圖3 所示,該建筑位于美國的芝加哥,長30.5 m、寬15.2 m、高3 m,占地面積為463.6 m2,四面墻上都有窗戶。 由于建筑空間過大,因此把空間分為東區、西區、北區、南區以及中區,中區到外墻的距離均為3.7 m,在天花板和5 個區之間還有一個集氣室,建筑圍護結構及傳熱系數見表3。 用EnergyPlus 軟件模擬之前,要選擇USA_IL_Chicago-OHare.Intl.AP.725300_TMY3 天氣文件。

表3 圍護結構及傳熱系數表Tab. 3 Envelopes and heat transfer coefficients

圖3 建筑圖Fig. 3 Architectural drawing
用EnergyPlus 軟件進行能耗模擬,把模擬結果分為“每天”和“每小時”進行最后的結果輸出,工作安排是做六休一。 由于本文設計的建筑有著5 個熱區,在本文中只選擇了南區作為研究對象,“每天”和“每小時”的能耗模擬結果如圖4 和圖5 所示,可以看出工作日的能耗高于休息日的能耗,在休息日不論是照明能耗還是設備能耗都是最低。 本文基于EnergyPlus 的模擬數據,把“每天”和“每小時”的模擬結果作為訓練集以及測試集。

圖4 “每天”的模擬結果Fig. 4 Simulation results of “daily”

圖5 “每小時”的模擬結果Fig. 5 Simulation results of “hourly”
由于LSTM 神經網絡對于長時間序列數據有著十分出色的預測能力,因此本文采用LSTM 神經網絡來對能耗數據進行預測,具體的LSTM 預測流程圖如圖6 所示。

圖6 LSTM 預測流程圖Fig. 6 LSTM prediction flow chart
(1)數據集劃分。 本文通過EnergyPlus 軟件進行一年的能耗模擬,模擬結果以兩種輸出方式輸出,如圖4 和圖5 所示。 第一種輸出365 天的數據,以前300 天為訓練集,后65 天為測試集;第二種輸出8 760 個小時的數據,以前8 000 個小時為訓練集,后760 個小時為測試集。
(2)數據歸一化。 由于樣本數據之間的類型和數值大小各不相同,會導致絕對值相差很大。 為了消除奇異樣本數據導致的不良影響,會對數據進行歸一化處理,將樣本數據轉換為[0,1]之間的數,歸一化也可以加快訓練網絡的收斂性。 歸一化計算式(7):
其中,x代表樣本數據;xmin代表樣本數據最小值;xmax代表樣本數據最大值;x*代表歸一化之后的值。
為了確定LSTM 訓練網絡預測的效果、精確度以及穩定性,本文中采用平均絕對誤差MAE,均方誤差MSE和均方根誤差RMSE作為預測模型的評價指標。MAE體現預測結果和測試值之間的差值,式(8);MSE體現出預測結果的變化程度,式(9);RMSE則能更好的反映出預測結果的精度,式(10)。
其中,yi代表LSTM 預測模型的預測值,xi代表測試值。
在EnergyPlus 軟件中選擇輸出數據為室外溫度、室內溫度、照明能耗、設備能耗以及HVAC 能耗。 其中,照明能耗和設備能耗在工作時都會產生能耗,會使得室內的溫度上升,從而對HVAC 的能耗有一定程度上的影響。 因此,本文中主要使用室外溫度、室內溫度、照明能耗以及設備能耗作為輸入來預測HVAC 的能耗。
本文以室外溫度、室內溫度、照明能耗以及設備能耗作為LSTM 神經網絡的輸入,HVAC 能耗作為LSTM 神經網絡的輸出。 以“每天”輸出為主,預先設置神經元數目為128、256、512,分別進行5 次訓練,得到不同的MSE值,并取得平均值見表4。 神經元數目為256 時MSE的值最小,因此確定神經元數目為256。 按“每小時”輸出的參數選取與按“每天”輸出相同。 Adam 具有適應稀疏梯度和緩解梯度震蕩的優點,本文中采用Adam 求解器進行優化。在網絡訓練時,在全連接層使用Dropout 并設置為0.2,其目的是在每次訓練批次中,以一定的概率忽略一定數量的神經元,這樣防止在網絡訓練過程中出現過擬合的問題。

表4 不同神經元數目MSE 對比Tab. 4 MSE comparison of different neuron numbers
本文中的LSTM 網絡設置為5 個層,分別有輸入層、隱含層、全連接層、輸出層以及回歸層。 基于不斷的測試,選定輸入層的數目為4,輸出層的數目為1,全連接層把Dropout 設置為0.2,采用Adam 求解器來進行優化,訓練次數設置為250,為了防止梯度爆炸,梯度設置為1,初始學習率設置為0.01,經過150 次訓練后乘以0.5 來降低學習率。 “每天”LSTM 網絡訓練圖如圖7 所示。

圖7 “每天”LSTM 網絡訓練圖Fig. 7 LSTM network training chart of “Daily”
由圖7 可知,本次訓練迭代次數為250,由于是按“每天”進行輸出,僅有300 個訓練集,訓練時間約為43 s,訓練曲線都是隨著迭代次數的增加而逐漸下降,RMSE曲線在大約170 次迭代之后趨于平緩,RMSE的值趨近0.05,而LOSS曲線則是在100 次迭代之后趨于平緩,且LOSS的值趨近0。 “每小時”LSTM 網絡訓練圖與“每天”的類似,差別在于訓練集的增多會導致訓練時間的延長以及RMSE的值趨近0.1。
本文分別對“每天”和“每小時”兩種輸出進行預測,預測結果如圖8 和圖9 所示。 由圖8 可以看出預測值的變化趨勢和測試值的數據基本保持一致,而從圖8(b)所示的預測誤差圖,預測的誤差值在[-2.5×107,1.2×107]之間,其最大誤差約為-2.5×107,而最小誤差值則趨近0;由圖9 可見,在預測曲線與測試值的變化趨勢基本一致,擬合程度更好,而誤差值也只在[-3.6×106,7.36×106]之間波動,不論是最大誤差還是最小誤差都優于前者。

圖8 LSTM“每天”測試結果Fig. 8 LSTM test results of daily

圖9 LSTM“每小時”能耗預測圖Fig. 9 LSTM test results of hourly
為了驗證訓練模型的準確性,本文選擇與BP神經網絡模型進行對比,BP 神經網絡與訓練網絡有相同的結構,即輸入層為4,隱含層節點數256,輸出層為1,迭代次數為250,學習率為0.01,最小誤差設置為0.000 01,兩種輸出方式的預測結果圖如圖10和圖11 所示。 對比相同訓練集的BP 模型和LSTM模型,由圖10 可知,BP 網絡預測值的變化趨勢比LSTM 網絡預測值的變化趨勢更為接近測試值,但在誤差上則是LSTM 網絡模型占優;由圖11 可知,BP 網絡模型的預測值的變化曲線和測試值大部分是重合的,但在峰值前后會有一部分和測試值有細微的誤差,誤差范圍在[-1.4×107,7.5×107]之間,而相對于LSTM 模型的測試結果,不論是測試結果的變化趨勢還是預測值與測試值之間的誤差都是LSTM 模型有著一定的優勢。

圖10 BP“每天”測試結果Fig. 10 BP test results of daily

圖11 BP“每小時”測試結果Fig. 11 BP test results of hourly
同時,對LSTM 模型和BP 模型的性能評價指標進行計算,見表5。 從表5 中可以看出,LSTM 模型僅在“每天”測試結果的MAE指標比BP 模型差,而其他的指標則LSTM 模型都優于BP 模型,說明LSTM 模型對處理時間序列數據的效果比BP 模型要好。

表5 不同模型的評價指標Tab. 5 Evaluation indicators for different models
本文基于EnergyPlus 軟件進行能耗模擬得到的模擬數據,建立LSTM 神經網絡預測模型,并與BP神經網絡預測模型進行對比分析,通過平均絕對誤差MAE,均方誤差MSE和均方根誤差RMSE這3 個評價指標對模型進行評估。 實驗結果表明,LSTM神經網絡預測模型不論是MAE、MSE還是RMSE都是優于BP 神經網絡預測模型,可以更精確的預測能耗,能更好的反映出建筑能耗的變化趨勢。
本文還有一些不足,LSTM 神經網絡預測模型的輸入僅考慮了室外溫度、室內溫度、照明能耗以及設備能耗這些因素,對于人員數目、風速、濕度以及光照等因素沒有考慮,以后會把這些因素考慮進去。另外,在本文中也只分析了采暖能耗,沒有對制冷能耗進行分析。 在于對LSTM 的優化上,本文只引入了Adam 求解器進行了最簡單的優化,后續會考慮用群體智能優化算法來對LSTM 網絡進行優化,提高預測的準確度。