江晶晶 竇真蘭 楊海濤 趙 敏
貧乏信息下基于深度遷移學習的智慧建筑負荷預測方法
江晶晶1竇真蘭2楊海濤1趙 敏1
(1. 國網上海市電力公司市北供電公司,上海 200070; 2. 國網上海綜合能源服務有限公司,上海 200235)
精確的負荷預測可以顯著優化建筑設備運行策略,釋放建筑節能潛力,其中基于數據驅動的負荷預測模型得到了廣泛關注。然而,一些具有新建數據平臺的建筑能夠為模型提供的數據非常有限。為了提高在貧乏信息狀態下的預測性能,本文建立一種基于因果卷積神經網絡結構的深度遷移學習負荷預測模型。首先,引入遷移學習機制,將與目標建筑類型一致的建筑作為源域建筑為模型提供數據;其次,引入全卷積神經網絡和因果邏輯約束增強時間序列特征表達,以增加輸出神經元的接受域并提升預測精度;最后,以實際工程中的辦公建筑為例,對所提出的方法和所建模型進行驗證,并將預測結果與長短期記憶網絡模型的預測結果相比。結果顯示,本文所建模型將預測值與實際值的平均絕對百分比誤差和方均根誤差系數分別平均降低了22.88%和0.372 0。
負荷預測;遷移學習;深度學習;卷積神經網絡(CNN)
從世界范圍來看,建筑負荷目前約占總負荷的40%,由此可見,優化建筑運行性能至關重要[1]。中國已成為僅次于美國的第二大能源消費國,建筑負荷約占全國總負荷的30%[2]。因此,建筑具有相當大的節能潛力。為達到節能環保的運行目標,需要精確預測建筑負荷,因為負荷預測的準確性直接影響建筑能源設備的控制策略,從而影響建筑的節能潛力。例如,減少高峰電力需求能夠取得一定的經濟和環境效益[3],因為高峰需求是能源系統基礎設施投資增長的主要因素[4]。因此,準確的建筑負荷預測可使電網和終端用戶受益[5],從而降低系統的運營風險[6]。
預測建筑負荷的方法可分為兩種:物理建模方法和數據驅動方法[7]。物理建模方法考慮與建筑本身特性相關的參數,并通過明確的供能機制獲得建筑負荷數據。但構建建筑物理模型需要大量與建筑運行相關的參數(建筑熱物理參數、能源設備參數等)和詳細的系統設置(人員活動時間表、空調分區等),而這些數據一般很難獲得。數據驅動方法可以依靠大量歷史數據來預測建筑負荷而不需要建立復雜的物理模型。已有大量的文獻驗證了數據驅動方法在負荷預測中的有效性。例如,文獻[8]使用回歸卷積神經網絡(convolutional neural network, CNN)提取輸入數據的隱含信息并用支持向量回歸模型來預測短期電、熱負荷;文獻[9]總結了五個深度學習模型在負荷及新能源功率預測、電力系統故障診斷、暫態穩定性分析等方面的應用現狀,這五個模型分別是:生成式對抗網絡、遞歸神經網絡、卷積神經網絡、堆疊自動編碼器和深度信念網絡。
近年來,隨著建筑負荷數據維數的不斷提高,深度學習以其處理高維數據的優越性能得到越來越多的應用[10-11]。文獻[12]回顧了負荷預測中的傳統模型和基于深度學習的模型,并從預測范圍、應用領域、模型類型和預測精度等方面對模型進行了討論;文獻[13]證明了簡單稠密深度學習模型相比隨機森林或梯度增強模型能獲得更好的精度。然而,數據驅動模型都需要大量的歷史數據,這一要求在一些新建建筑或具有新建能源監控平臺的建筑中很難滿足。因此,本文在使用數據驅動方法進行負荷預測時,使用遷移學習來解決歷史數據貧乏的問題。遷移學習可以在許多領域中解決現實世界的問題,例如自然語言處理[14-15]、人臉識別[16]和視覺跟蹤[17]等。在能源和建筑領域,文獻[18]使用在線遷移學習預測住宅建筑中的溫度,文獻[19]使用具有強化學習的深度置信網絡構建在線跨建筑遷移學習模型。在目前關于深度學習的研究中,卷積神經網絡和長短期記憶(long short-term memory, LSTM)網絡被廣泛應用,尤其是在計算機視覺和自然語言處理當中[20]。
相較于K均值聚類算法[21]、主成分分析法[22]、支持向量機[23]、極限學習機等[24]算法,以及多尺度時序分析[25-26]方法,CNN模型在特征提取方面具有平移不變性和特征提取結果準確的優勢,所以,本文選用CNN模型從數據中提取高維特征。長短期記憶網絡的網絡結構常被用來處理時間序列數據,因此,本文使用一個典型LSTM模型作為對照。同時,為保證遷移學習中源域數據的有效性,本文采用動態時間規整(dynamic time warping, DTW)和JS(Jensen-Shannon)散度對源域建筑數據與目標域建筑數據的相關性進行評價,作為選擇源域數據集的依據。
合理的源域數據在遷移學習中起著至關重要的作用,與目標建筑具有不同特征分布的源域數據可能會嚴重影響負荷預測模型的性能。因此,本文使用DTW和JS散度來計算不同負荷數據集之間的相關性。
DTW的數學公式為


作為基于距離的方法,DTW著重比較時間序列的形狀相似度,而相對忽略時間序列之間的內部特征分布。因此,使用JS散度進一步計算兩個序列之間的內部特征分布的相似度。
JS散度是KL散度的函數,有


綜上所述,DTW和JS散度的綜合應用考慮了不同序列之間的形狀和內部特征分布,從而可以評估時間序列之間的相似性并指導目標建筑負荷預測的源域數據集的選擇。
負荷預測模型的輸入是一組一維時間序列,任務是根據歷史數據預測1的值。由于時間序列的固有局限性,負荷預測結果只受其先前的觀測值影響,而不受任何未來值的影響。因此,選用因果卷積網絡作為深度遷移學習模型的框架。因果卷積網絡可以等效地通過在輸入時間序列之前填充一組零,然后輸入層1維卷積層來實現。除了最后一層之外,每一層都采用線性整流函數(rectified linear unit, ReLU)作為激活函數,第層采用線性激活函數。最后經過一個1×1維卷積層產生一維輸出。
首先要在源域上訓練模型,然后將學習到的知識遷移到目標域上的因果卷積神經網絡中。在預訓練模型階段,首先基于上述選擇源域數據集的方法篩選合適的源域數據集,然后將篩選得到的源域數據集作為預訓練的數據庫,采用文獻[27]中提出的卷積神經網絡回歸模型訓練方法,使用前向傳播算法得到預測值后,再用反向傳播算法鏈式求導,計算損失函數對每個權重的偏導數,再使用梯度下降法對權重進行更新。所得權重即為預測模型在預訓練階段所得知識,需要后續利用目標域的數據對該模型進行微調,使其滿足新建建筑的預測需求。
微調階段的損失函數是為使源域和目標域的特征分布統一而設計的,詳細說明如下。







本文采用隨機梯度下降法(stochastic gradient descent, SGD)來求解式(3)中的優化問題。梯度的計算方法為















負荷預測模型訓練流程如圖1所示,可以將貧乏信息下建筑負荷預測模型的構建分為兩個階段,即模型預訓練階段和微調階段。在模型預訓練階段,基于源域和目標域的建筑負荷數據訓練參數,獲得的參數是全局參數。在微調階段,將針對目標建筑的負荷時間序列專門訓練參數,即微調階段學習到的參數是局部參數。因此,本文建立的模型可以看作是具有全局參數和局部參數的混合模型。
本節將使用實測數據對本文所建立的基于深度遷移學習的負荷預測模型進行分析和比較,以驗證該模型在貧乏信息情況下進行建筑負荷預測的有 效性。

圖1 負荷預測模型訓練流程
本文對上海世博園區B片區內的三棟辦公建筑進行研究分析,分別將三棟建筑的其中一棟作為目標建筑進行三組對照實驗,即將建筑A作為目標建筑,建筑B和建筑C作為源域建筑,之后將建筑B作為目標建筑,另外兩棟建筑作為源域建筑,以此類推共構建三組不同的實驗用以驗證模型和方法。由于三棟建筑的距離相近,因而三棟建筑所處地區的天氣狀態和氣象參數都比較接近。此外,由于三棟建筑都屬于辦公建筑,其每日運行時間和每年的節假日、公休日時間都是一致的,即這三棟建筑處于同樣的運行時間表中,可以說這三棟建筑是統一類型的建筑。
本文對目標建筑一年的冷、熱、電負荷進行預測,即將目標建筑一年12個月的負荷分別進行12次預測并將結果匯總為一年的數據。表1為不同實驗中源域數據和目標域數據的構成,每個目標域包含目標建筑前一年12個月的負荷數據,每個源域都包括其他兩棟建筑24個月的數據,在整個訓練的過程中,數據按照不同建筑和不同年份按順序排列。

表1 不同實驗中源域和目標域的數據構成
為了在每個實驗中驗證所提模型的有效性,本文在每個實驗中又設定了三種不同的模型。
模型1:使用典型的LSTM層和一層全連接層構建模型,在預測過程中僅使用目標建筑前2個月的負荷數據進行訓練和預測。
模型2:模型2為本文建立的負荷預測模型,即基于因果卷積神經網絡的深度遷移學習模型,訓練集中包含了目標建筑2年的完整數據。
模型3:模型3同樣為本文建立的基于深度遷移學習的負荷預測模型,但在預測過程中僅使用目標建筑前2個月的負荷數據進行訓練和預測。
由于案例中的三棟建筑面積差異較大,其建筑能耗的數值也會處在不同的量級上。因此傳統的方均根誤差(root mean square error, RMSE)不適合用來比較不同建筑的預測精度。在本文的遷移學習案例研究中,選擇平均絕對百分比誤差(mean absolute percentage error, MAPE)和方均根誤差系數(coefficient of variation of root mean square error, CV-RMSE)衡量模型的預測性能。
MAPE和CV-RMSE的計算式為


表2為不同建筑的實驗結果,包含每個實驗中三種負荷預測數據與實測數據的MAPE平均值和CV-RMSE平均值。

表2 不同建筑的實驗結果
比較三組模型的預測結果可以看出,模型1在不同建筑的實驗中都取得了最差的MAPE結果,在建筑B中取得了最差的CV-RMSE結果,在其他建筑的實驗中得到的CV-RMSE結果也較差。這是因為模型1的目的是用于模擬我國當前建筑負荷信息相對貧乏情況下的預測精度,在整個模型訓練的過程中僅使用了目標建筑2個月的數據用于訓練并預測目標建筑下一個月的能耗。這樣的預測結果也更說明了建筑負荷信息的貧乏會很大程度地影響負荷預測的精度。對比每一個實驗中模型1和模型2、模型3的差值可以看出,在建筑B作為目標建筑的實驗中,遷移學習模型取得的精度提升是最明顯的。相比于模型1的精度,模型2將MAPE降低了22.95%,將CV-RMSE降低了0.355 4,可見通過模型2的遷移學習可以有效提升建筑B的能耗預測精度。模型3將MAPE降低了22.81%,將CV-RMSE降低了0.388 5。模型3對于CV-RMSE的提升效果比模型2要更明顯一些,而MAPE則稍弱一些,但總體的差距并不是很大,這說明模型3對于建筑B的遷移學習也有很好的效果,預測的精度也比較好,可以滿足工程實際中的應用要求。
在上述比較當中,建筑A在貧乏信息下的負荷預測精度最好,因此本文以建筑A為例,對上海世博B片區綜合能源站的冷、熱、電負荷的預測結果分別進行分析。冷、熱、電負荷預測結果分別如圖2~圖4所示,負荷預測評價結果見表3。
從建筑A的預測結果可以看出,全年冷負荷的預測精度最差,MAPE高達14.80%,CV-RMSE也為三種負荷的最大值,這可能是由于建筑冷負荷的復雜特性和用能行為導致的。熱負荷和電負荷的MAPE都低于10%,分別為6.80%和5.61%,這是因為,相比于冷負荷,供熱設備的起停和管理通常由建筑調度中心整體調控,因此建筑的供熱需求在供熱季會較為固定,對熱負荷的預測也較為容易。相比于熱負荷,電負荷的CV-RMSE更低,這是由于電負荷的大小往往和各種用電設備有密切的關系,而這部分設備的使用往往由于工作時間的規定而較為固定,導致電負荷在全年的變化往往服從一個規律的工作日變化。

圖2 冷負荷預測結果

圖3 熱負荷預測結果

圖4 電負荷預測結果

表3 負荷預測評價結果
本文建立了一種基于深度遷移學習的負荷預測模型,該模型可以從其他類似建筑的歷史數據中提取有效信息和知識并使原始數據貧乏的目標建筑獲得較為理想的負荷預測結果。
為驗證模型的有效性,以上海三座政府辦公樓為例,分別設置了多組對照案例進行研究。與同樣模擬貧乏信息情況的LSTM模型結果相比,本文所建立的基于因果卷積神經網絡和深度遷移學習的負荷預測模型將負荷的預測值與實測值的平均絕對百分比誤差平均降低了22.88%,方均根誤差系數平均降低了0.372 0。在對建筑A的全年冷、熱、電負荷預測結果的分析中,各類負荷的預測值均接近目標建筑本身的實際值,但冷負荷的預測精度相對較差,預測值與實際值的方均根誤差系數和平均絕對百分比誤差分別為0.165 3和14.80%;電、熱負荷的預測精度相對較好,預測值與實際值的平均絕對百分比誤差均在10%以下。
[1] 王健, 阮應君. 建筑分布式能源系統設計與優化[M].上海: 同濟大學出版社, 2018.
[2] JRADI M, RIFFAT S. Tri-generation systems: energy- policies, prime movers, cooling technologies, configu- reations and operation strategies[J]. Renewable & Sustainable Energy Reviews, 2014, 32: 396-415.
[3] 廖麗娜. 面向建筑的天然氣三聯供與可再生能源的耦合優化設計[D]. 上海: 上海電力學院, 2015.
[4] 潘毅群, 郁叢, 龍惟定, 等. 區域建筑負荷與能耗預測研究綜述[J]. 暖通空調, 2015, 45(3): 33-40.
[5] KAVGIC M, MAVROGIANNI A, MUMOVIC D, et al. A review of bottom-up building stock models for energy consumption in the residential sector[J]. Building and Environment, 2010, 45(7): 1683-1697.
[6] KONTOKOSTA C E, TULL C. A data-driven predi- ctive model of city-scale energy use in buildings[J]. Applied Energy, 2017, 197: 303-317.
[7] 燕達, 陳友明, 潘毅群, 等. 我國建筑能耗模擬的研究現狀與發展[J]. 建筑科學, 2018, 34(10): 130-137.
[8] 羅鳳章, 張旭, 楊欣, 等. 基于深度學習的綜合能源配電系統負荷分析預測[J]. 高電壓技術, 2021, 47(1): 23-32.
[9] 周念成, 廖建權, 王強鋼, 等. 深度學習在智能電網中的應用現狀分析與展望[J]. 電力系統自動化, 2019, 43(4): 180-191.
[10] HAN Fujia, PU Tianjiao, LI Maozhen, et al. Short- term forecasting of individual residential load based on deep learning and K-means clustering[J]. CSEE Journal of Power and Energy Systems, 2021, 7(2): 261-269.
[11] RUNGE J, ZMEUREANU R. A review of deep learning techniques for forecasting energy use in buildings[J]. Energies, 2021, 14(3): 1-26.
[12] WEI Nan, LI Changjun, PENG Xiaolong, et al. Conventional models and artificial intelligence-based models for energy consumption forecasting: a review[J]. Journal of Petroleum Science and Engineering, 2019, 181: 106187.
[13] RUAN Yingjun, LIU Qingrong, LI Zhengwei, et al. Optimization and analysis of building combined cooling, heating and power (BCHP) plants with chilled ice thermal storage system[J]. Applied Energy, 2016, 179: 738-754.
[14] 徐萍, 吳超, 胡峰俊, 等. 基于遷移學習的個性化循環神經網絡語言模型[J]. 南京理工大學學報, 2018, 42(4): 401-408.
[15] YU Chongchong, CHEN Yunbing, LI Yueqiao, et al. Cross-language end-to-end speech recognition research based on transfer learning for the low-resource Tujia language[J]. Symmetry, 2019, 11(2): 179.
[16] 亢潔, 李佳偉, 楊思力. 基于域適應卷積神經網絡的人臉表情識別[J]. 計算機工程, 2019, 45(12): 201- 206.
[17] WANG Shanshan, ZHANG Lei, ZUO Wangmeng, et al. Class-specific reconstruction tansfer learning for visual recognition across domains[J]. IEEE Transa- ctions on Image Processing, 2020, 29: 2424-2438.
[18] GUO Li, LIU Wenjian, CAI Jiejin, et al. A two-stage optimal planning and design method for combined cooling, heat and power micro-grid system[J]. Energy Conversion and Management, 2013, 74: 433-445.
[19] 曾競. 區域供冷供熱管網系統優化設計研究[D]. 長沙: 湖南大學, 2017.
[20] FANG Tingting, LAHDELMA R. Genetic optimization of multi-plant heat production in district heating networks[J]. Applied Energy. 2015, 159: 610-619.
[21] 陳振祥, 林培杰, 程樹英, 等. 基于K-means++和混合深度學習的光伏功率預測[J]. 電氣技術, 2021, 22(9): 7-13, 33.
[22] 洪華偉, 王峰, 鄭鵬, 等. 基于模糊綜合評價與主成分分析的客戶用電能效研究[J]. 電氣技術, 2020, 21(10): 29-34, 40.
[23] 王東, 史曉霞, 尹交英. 不同核函數的支持向量機用于空調負荷預測的對比研究[J]. 電工技術學報, 2015, 30(增刊1): 531-535.
[24] 劉念, 張清鑫, 劉海濤. 基于核函數極限學習機的微電網短期負荷預測方法[J]. 電工技術學報, 2015, 30(8): 218-224.
[25] 張帥, 楊晶顯, 劉繼春, 等. 基于多尺度時序建模與估計的電力負荷數據恢復[J]. 電工技術學報, 2020, 35(13): 2736-2746.
[26] 儲晨陽, 秦川, 鞠平, 等. 基于優化稀疏編碼的超短期負荷滾動多步預測[J]. 電工技術學報, 2021, 36(19): 4050-4059.
[27] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. Imagenet classification with deep convolutional neural networks[J]. Communicatios of the ACM, 2017, 60(6): 84-90.
Load forecasting method of smart building based on deep transfer learning under poor information
JIANG Jingjing1DOU Zhenlan2YANG Haitao1ZHAO Min1
(1. Shibei Electricity Supply Company of State Grid Shanghai Municipal Electric Power Company, Shanghai 200070; 2. State Grid Shanghai Comprehensive Energy Service Co., Ltd, Shanghai 200235)
Accurate load forecasting can significantly optimize the operation strategy of equipment and release the energy-saving potential of buildings. With the advancement of computer science and smart meters, data-driven load forecasting models have become popular because of good forecasting accuracy. To improve the forecasting performance under poor information, this paper proposes a deep-transfer-learning predictive method based on the causal convolutional neural network. Taking three office buildings of the same type as an example, one of them is set as the target building and the other two are set as the source building. The proposed method and the built model are verified, and the forecasting results are compared with the long short-term memory network model. The forecasting results show that the model built in this paper reduces the average percentage error and the root mean square error coefficient of the predicted value and the actual value by 22.81% and 38.85%, respectively. Finally, this paper selects a building with better forecasting accuracy and compares and analyzes its annual cold, heat, and electrical load forecast results. The results show that the forecast accuracy of electricity and heat load is better than that of cooling load.
load forecasting; transfer learning; deep learning; convolutional neural network (CNN)
2021-09-29
2021-11-22
江晶晶(1982—),女,浙江省寧波市人,碩士,工程師,主要從事電能計量裝置安裝與故障處理方面的研究工作。
國家電網公司總部科技項目(5400-202017201A-0-0-00)