彭獻永,王波波,張騫
(1.艾默生過程控制有限公司,上海 201206;2.華電內(nèi)蒙古能源有限公司土默特發(fā)電分公司,內(nèi)蒙古 包頭 014100;3.江森自控日立空調(diào)科技(無錫)有限公司,江蘇 無錫 214000)
2008年修訂的我國《節(jié)約能源法》新增對公共機構(gòu)節(jié)能管理要求。隨著《公共機構(gòu)節(jié)能條例》2008年10月1日施行,公共機構(gòu)節(jié)能需要在政府機關(guān)的積極推動下走在全社會前列,從大量的基礎(chǔ)性、示范性的能耗統(tǒng)計、審計工作和約束性的節(jié)能管理[1-3],轉(zhuǎn)軌到法制化的剛性管理上來。國家機關(guān)辦公建筑及大型公共建筑節(jié)能工作進入了快速發(fā)展的新階段,各省市機關(guān)辦公建筑和大型公共建筑相繼安裝分項計量系統(tǒng),搭建公共建筑能耗監(jiān)測平臺。從2010年起,深圳市、上海市、江蘇省等開始逐步建立城市級公共建筑能耗監(jiān)測平臺。這些公共建筑能耗監(jiān)管平臺在運營過程中積累了大量數(shù)據(jù),既便于公共建筑節(jié)能管理工作的開展,也為公共機構(gòu)節(jié)能的科學(xué)研究和政府制定政策提供數(shù)據(jù)支持。同時,公共建筑能耗監(jiān)測平臺中的分項計量不僅提供了建筑設(shè)備詳盡的用能數(shù)據(jù),而且建筑自控系統(tǒng)記錄的運行數(shù)據(jù)可以真實反映建筑的運行狀況。目前已有較多應(yīng)用分項計量數(shù)據(jù)與系統(tǒng)運行數(shù)據(jù)都已表明,建筑暖通空調(diào)的能耗占建筑物總能耗的50%~60%以上,而建筑空調(diào)能耗中的55%又是冷熱源系統(tǒng)能耗。因此,從微觀層面看,建筑空調(diào)系統(tǒng)節(jié)能運行優(yōu)化以及控制策略及時有效實現(xiàn),都需要對空調(diào)負(fù)荷進行提前預(yù)測;從宏觀層面看,加強建筑負(fù)荷預(yù)測對于推進公共建筑能源管理和參與到電力需求側(cè)的需求響應(yīng)管理,優(yōu)化電網(wǎng)對公共建筑電力資源配置,具有重要意義。
基于大數(shù)據(jù)的建筑冷(熱)負(fù)荷預(yù)測,從研究方向上可以歸納為2個方面,即數(shù)據(jù)預(yù)處理、負(fù)荷預(yù)測算法的應(yīng)用。本文圍繞這2個方面,對現(xiàn)有的大數(shù)據(jù)技術(shù)在建筑冷(熱)負(fù)荷預(yù)測的研究進展進行考察和總結(jié),對已有的不同預(yù)測技術(shù)進行分析,同時也對大數(shù)據(jù)技術(shù)在大型公共建筑冷(熱)負(fù)荷預(yù)測領(lǐng)域未來發(fā)展做出展望。
針對建筑能源數(shù)據(jù)的特點,如建筑數(shù)據(jù)量大、數(shù)據(jù)質(zhì)量不高,需要有針對性的數(shù)據(jù)預(yù)處理方法。數(shù)據(jù)質(zhì)量主要體現(xiàn)在部分?jǐn)?shù)據(jù)缺失、異常值等方面。在其他方面,對于缺失數(shù)據(jù)、異常數(shù)據(jù)經(jīng)常采用刪除整條數(shù)據(jù)(所有數(shù)據(jù)屬性),或者以均值、中位值和眾值等簡單統(tǒng)計量填充替換的方法。顯然,從保持?jǐn)?shù)據(jù)多樣性、充分利用數(shù)據(jù)中的其它可用屬性角度考慮,直接刪除和簡單填充數(shù)據(jù)的方法大多時候都不能適用于建筑能耗監(jiān)測大數(shù)據(jù)的數(shù)據(jù)預(yù)處理。
文獻[4-6]應(yīng)用小波分析算法對數(shù)據(jù)進行篩選。小波分析方法在處理大數(shù)據(jù)中的噪聲數(shù)據(jù)具有很好的適用性和很高的效率。文獻[7-8]應(yīng)用數(shù)據(jù)挖掘的算法對建筑能耗監(jiān)測數(shù)據(jù)中的異常值進行識別與修復(fù),采用基于KNN算法的缺失數(shù)據(jù)填充、K-Means聚類的數(shù)據(jù)異常值和噪聲值識別(數(shù)據(jù)質(zhì)量判斷)與基于PCA算法的多維度數(shù)據(jù)降維。
值得指出,上述研究多是具體場景下某些數(shù)據(jù)集合下的數(shù)據(jù)預(yù)處理,缺少對數(shù)據(jù)預(yù)處理方法的普遍適用性等問題的深入研究。例如對于常見的異常數(shù)據(jù)的識別與清洗算法:(K-Means算法)在數(shù)據(jù)預(yù)處理過程中易受異常值的影響;KNN算法對計算性能要求較高;而小波算法的耗時較長、效率較低。以上算法都有自身的適用性和局限性,如何改進這些算法在處理大數(shù)據(jù)的性能和適用性是將來進一步的研究內(nèi)容。
建筑運行階段空調(diào)負(fù)荷是指制冷(或采暖)設(shè)備為滿足空調(diào)系統(tǒng)運行所提供的冷(熱)量,它比理論的空調(diào)房間冷(熱)負(fù)荷更為復(fù)雜,不僅受室外氣象、圍護結(jié)構(gòu)、建筑使用狀況的影響,還受到空調(diào)系統(tǒng)的容量、控制調(diào)節(jié)等因素影響。建筑運行階段空調(diào)負(fù)荷預(yù)測的主要目的是為了預(yù)測建筑物的冷(熱)負(fù)荷求及用電量,是空調(diào)系統(tǒng)節(jié)能優(yōu)化控制的基礎(chǔ),是隨著空調(diào)系統(tǒng)復(fù)雜化和節(jié)能減排的需求發(fā)展起來的,將會給空調(diào)系統(tǒng)節(jié)能運行帶來明顯效益。由于建筑空調(diào)系統(tǒng)運行負(fù)荷的復(fù)雜性,空調(diào)負(fù)荷數(shù)據(jù)序列始終表現(xiàn)出非線性和動態(tài)特征,因此負(fù)荷預(yù)測一直是國內(nèi)研究的難題和熱點。
目前國內(nèi)建筑負(fù)荷預(yù)測研究主要集中在模型輸入變量和建模方法兩方面。以建筑冷負(fù)荷為例,在影響冷負(fù)荷預(yù)測的輸入變量上,對氣象參數(shù)、時間特征數(shù)、建筑使用狀況、冷凍水溫度等影響因素的選擇進行定量研究。在建模方法方面,主要歸納為三大類:①統(tǒng)計多元回歸模型,代表性的有ARMA,GARCH等,它們主要應(yīng)用于線性回歸場合;②淺層網(wǎng)絡(luò)模型,代表性的有人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(SVM)、高斯過程(GP)模型等,它們既可用于線性回歸,也可用于非線性回歸,而且基于核技術(shù)的支持向量機和高斯過程在回歸領(lǐng)域得到了廣泛應(yīng)用;③深度多層網(wǎng)絡(luò)模型,代表性的有深度自編碼網(wǎng)絡(luò)(DAEN)、深度信念網(wǎng)絡(luò)(DBN)等,它們對回歸影響因素進行學(xué)習(xí),得到稀疏化的影響因子集,這樣可提高在線回歸速度。
考慮多維多變量影響的統(tǒng)計方法試圖通過回歸分析建立歷史數(shù)據(jù)樣本與未來建筑冷負(fù)荷之間的關(guān)系。迄今為止,多元線性回歸(MLR),自回歸積分移動平均(ARIMA)模型[9]都常用于建筑冷負(fù)荷預(yù)測。MLR通過模擬冷負(fù)荷和天氣條件之間的相關(guān)性來預(yù)測建筑冷負(fù)荷。文獻[10]應(yīng)用層次分析法對最佳調(diào)整各個預(yù)報員的權(quán)重進行調(diào)整,從而改善冷負(fù)荷預(yù)測。文獻[11]開發(fā)了一個啟發(fā)多元線性回歸的主成分分析,以實現(xiàn)冷負(fù)荷預(yù)測任務(wù)。然而,盡管統(tǒng)計回歸模型通常需要更少的計算資源,但發(fā)現(xiàn)它們在非線性建模中的應(yīng)用非常有限。
3.2.1 人工神經(jīng)網(wǎng)絡(luò)
基于人工神經(jīng)網(wǎng)絡(luò)的建筑冷(熱)負(fù)荷預(yù)測,通常由影響負(fù)荷的因素構(gòu)成輸入單元,以能耗或負(fù)荷作為輸出單元。文獻[12]介紹了利用神經(jīng)網(wǎng)絡(luò)方法進行負(fù)荷預(yù)測的基本理論和方法。文獻[13]應(yīng)用徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)模型對建筑物冷負(fù)荷仿真軟件的夏季不同月份的逐時冷負(fù)荷數(shù)據(jù)進行訓(xùn)練和預(yù)測,仿真表明RBF神經(jīng)網(wǎng)絡(luò)具有更高的預(yù)測精度及更好的泛化能力。文獻[14]以某地源熱泵空調(diào)系統(tǒng)為實測對象,根據(jù)實測的逐時負(fù)荷數(shù)據(jù)建立了人工神經(jīng)網(wǎng)絡(luò)負(fù)荷預(yù)測模型,并預(yù)測了一個未來24小時逐時負(fù)荷。
3.2.2 支持向量機
支持向量機(SVM)算法的預(yù)測方法具有強大的非線性映射特性,近年來在空調(diào)負(fù)荷預(yù)測領(lǐng)域應(yīng)用較廣泛。文獻[15-16]應(yīng)用支持向量機算法對建筑能耗和空調(diào)系統(tǒng)負(fù)荷預(yù)測,得到相應(yīng)的建筑能耗模型和負(fù)荷預(yù)測模型;研究顯示在特定的場景,支持向量機的預(yù)測效果要優(yōu)于人工神經(jīng)網(wǎng)絡(luò)。
支持向量機可以避免神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選擇和局部極小點問題,有較高的泛化能力和學(xué)習(xí)能力,對小樣本預(yù)測效果明顯;但是對缺失數(shù)據(jù)較為敏感,對大規(guī)模樣本的學(xué)習(xí)速度慢。
3.2.3 高斯過程
短期負(fù)荷預(yù)測具有不確定性、隨機性等特點。概率式預(yù)測法中,基于貝葉斯概率論的預(yù)測方法,高斯過程回歸(Gaussian Process Regression,GPR)參數(shù)少,自適應(yīng)確定超參數(shù),非參數(shù)推斷靈活。與預(yù)測誤差分布特性的統(tǒng)計法相比,高斯過程提供一種置信度較高的解空間范圍解釋,預(yù)測結(jié)果有概率意義,而不需要統(tǒng)計歷史預(yù)測誤差。與基于分位數(shù)回歸的概率密度預(yù)測法相比,高斯過程不需要對每個分位點進行建模,模型結(jié)構(gòu)更簡單。文獻[17]提出高斯回歸過程的兩種變體:緊湊回歸高斯過程、逐步高斯過程,對未來的預(yù)期能源需求進行建模研究,并與決策樹、人工神經(jīng)網(wǎng)絡(luò)進行對比研究,高斯過程顯示出一定的優(yōu)勢。基本高斯過程對大的樣本集的處理會造成較大的運行時間與運算空間。針對大量數(shù)據(jù)樣本處理效果不明顯,出現(xiàn)稀疏高斯過程回歸算法。
3.2.4 算法改進與融合
從算法的本身角度看,每個算法都有其自身的特點及適用性,單一的算法通用性較弱,預(yù)測精度也有限。多種預(yù)測算法融合是今后的一大發(fā)展方向,目的是充分發(fā)揮各個算法的優(yōu)點,形成混合模型來提升算法性能。
文獻[18]以空調(diào)運行負(fù)荷實測數(shù)據(jù)為基礎(chǔ),利用廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)建立混沌預(yù)測模型,對提前1小時和提前24小時的短期預(yù)測效果進行驗證。研究結(jié)果表明空調(diào)運行負(fù)荷可以利用混沌方法對負(fù)荷進行預(yù)測的模型簡單、魯棒性好的優(yōu)點。文獻[19]提出了一種集成算法對建筑能耗和空調(diào)負(fù)荷進行預(yù)測,該集成算法融合了8種基本數(shù)據(jù)挖掘算法,其預(yù)測精度明顯優(yōu)于單個基本算法模型。文獻[20]提出了一種iPSO-ANN的建筑用電量小時預(yù)測模型。應(yīng)用改進的粒子群優(yōu)化算法(iPSO)來調(diào)整ANN結(jié)構(gòu)的權(quán)重和閾值,而主成分分析(PCA)用于選擇重要的建模輸入并簡化模型結(jié)構(gòu)。比較結(jié)果表明,iPSO-ANN和GA-ANN模型的精度均高于ANN模型。從耗時的角度看,iPSO-ANN模型比GA-ANN方法具有更短的建模時間。文獻[21]建立了模糊C均值算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)復(fù)合模型。該模型先采用FCM算法對輸入?yún)?shù)進行聚類,針對不同類建立BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,將待測樣本分類后進行預(yù)測,最后使用決策樹算法篩選預(yù)測結(jié)果中聚類不佳的部分進行加權(quán)優(yōu)化。結(jié)果表明,神經(jīng)網(wǎng)絡(luò)復(fù)合模型的性能明顯優(yōu)于不聚類神經(jīng)網(wǎng)絡(luò)。文獻[22]提出了一種基于混沌分析和支持向量回歸機的短期空調(diào)負(fù)荷預(yù)測建模方法。通過研究實際空調(diào)負(fù)荷序列的混沌特性,確定其混沌特征參數(shù)并選取支持向量回歸機進行預(yù)測;支持向量機建模過程使用粒子群算法進行參數(shù)尋優(yōu)。仿真結(jié)果表明,空調(diào)負(fù)荷序列具有一定的混沌特性,使用混沌支持向量機方法的預(yù)測精度比單一支持向量機法預(yù)測結(jié)果的精度有了明顯提升。文獻[23]提出了一種基于人工智能和回歸分析的辦公建筑負(fù)荷預(yù)測方法,包括小波變換、支持向量機(SVM)和偏最小二乘回歸(PLS)。比較結(jié)果表明,該方法能夠在不同的時間范圍內(nèi)實現(xiàn)高精度的動態(tài)負(fù)荷預(yù)測。以上的國內(nèi)研究結(jié)果都表明,多種算法改進和融合有利于提高預(yù)測精度。
深度學(xué)習(xí)是指一系列機器學(xué)習(xí)算法,它們能在大數(shù)據(jù)中顯示非線性和復(fù)雜模式,且可以對狀態(tài)因素的潛在特征進一步學(xué)習(xí)。深度多層網(wǎng)絡(luò)代表性的模型有深度自編碼網(wǎng)絡(luò)、深度信念網(wǎng)絡(luò)等。深度學(xué)習(xí)既可以以監(jiān)督方式建立具有給定輸入和輸出(即冷負(fù)荷)的預(yù)測模型,也可以用無監(jiān)督方式從原始數(shù)據(jù)中提取有意義的特征作為模型輸入。
文獻[24]采用深度學(xué)習(xí)預(yù)測24小時建筑冷負(fù)荷曲線。分別以半監(jiān)督和無監(jiān)督兩種方式利用深度學(xué)習(xí)將其在冷負(fù)荷預(yù)測中的表現(xiàn)與典型的特征提取方法和建筑領(lǐng)域的流行預(yù)測技術(shù)進行比較。結(jié)果表明,深度學(xué)習(xí)可以增強建立冷負(fù)荷預(yù)測的性能,特別是當(dāng)以無人監(jiān)督的方式用于構(gòu)建高級特征作為模型輸入時。使用由無監(jiān)督深度學(xué)習(xí)提取的特征作為冷負(fù)荷預(yù)測的輸入可以明顯增強預(yù)測性能。這些發(fā)現(xiàn)具有啟發(fā)意義,可為建筑能源預(yù)測帶來更靈活有效的解決方案。文獻[25]提出了一種新的基于深度學(xué)習(xí)的預(yù)測模型,用于高精度的確定性冷負(fù)荷預(yù)測。該模型結(jié)合了經(jīng)驗?zāi)J椒纸?、深度信念網(wǎng)絡(luò)和集成技術(shù)。經(jīng)驗?zāi)J椒纸庥糜趯⒃祭湄?fù)荷數(shù)據(jù)序列分解為若干個具有更好的離群點和特性的數(shù)據(jù)子集。通過基于深度信念網(wǎng)絡(luò)的分層預(yù)訓(xùn)練,有效地提取數(shù)據(jù)中隱藏的非線性特征和高水平的不變結(jié)構(gòu)。此外,引入了集成技術(shù)并進行了適當(dāng)設(shè)計,以減輕不確定性(即模型不確定性和數(shù)據(jù)噪聲)對預(yù)測精度的影響。仿真結(jié)果表明,與BP神經(jīng)網(wǎng)絡(luò)、SVM預(yù)測算法相比,所提出的基于深度信念網(wǎng)絡(luò)的預(yù)測方法表現(xiàn)出很強的性能。深度學(xué)習(xí)方法應(yīng)用于建筑物空調(diào)負(fù)荷預(yù)測,具有提高公共建筑能源系統(tǒng)運行性能的巨大潛力。文獻[26]提出了基于遞歸神經(jīng)網(wǎng)絡(luò)的建筑能量預(yù)測策略。在模型中,每種策略都有兩個層面的獨特特征:①在高級別層,三種推理方法用于生成短期預(yù)測,包括遞歸方法、直接方法和多輸入多輸出(MIMO)方法;②在較低級別,最先進的技術(shù)被用于循環(huán)模型開發(fā),例如使用一維卷積操作,雙向操作和不同類型的循環(huán)單元。研究結(jié)果用于短期建筑能量預(yù)測的深度遞歸模型,有助于彌合建筑專業(yè)人員與先進大數(shù)據(jù)分析之間的知識差距。
在公共機構(gòu)監(jiān)管平臺和大型公共建筑分項計量監(jiān)測系統(tǒng)出現(xiàn)之前,建筑負(fù)荷預(yù)測的研究手段主要為基于理論、模擬、實驗等方法,存在著一定的局限性。近年來,在公共機構(gòu)建筑能源監(jiān)測平臺、大型公共建筑監(jiān)測系統(tǒng)積累了大量的運行數(shù)據(jù),為大數(shù)據(jù)技術(shù)的應(yīng)用提供了很好的應(yīng)用場景;另一方面,大數(shù)據(jù)技術(shù)的發(fā)展為建筑能源監(jiān)測管理提供了優(yōu)良的數(shù)據(jù)處理手段。建筑能源數(shù)據(jù)預(yù)處理有助于提高預(yù)測結(jié)果準(zhǔn)確性,因此,建筑能耗數(shù)據(jù)針對性的預(yù)處理將會是今后一個重要的研究方向。
從目前研究來看,雖然基于大數(shù)據(jù)的建筑負(fù)荷預(yù)測的方法較多,在相關(guān)的研究中也取得了較好的效果,但是在實際工程應(yīng)用中缺乏很好地驗證。目前的預(yù)測方法是否適合于實際工程,需要后續(xù)深入工程實踐。深度學(xué)習(xí)在建筑空調(diào)負(fù)荷預(yù)測的研究表現(xiàn)出巨大的潛力,有望為建筑能源預(yù)測帶來更加靈活有效的解決方案。
①建筑能源大數(shù)據(jù)的預(yù)處理需要從缺失數(shù)據(jù)的填充、異常數(shù)據(jù)的識別清洗以及數(shù)據(jù)的降維三個方面進行處理,為后續(xù)基于數(shù)據(jù)的建筑空調(diào)負(fù)荷預(yù)測奠定基礎(chǔ)。
②多種算法融合的混合模型是建筑空調(diào)負(fù)荷預(yù)測的主要研究方向;深度多層網(wǎng)絡(luò)及其改進,有望成為在建筑空調(diào)負(fù)荷預(yù)測領(lǐng)域里的一個很有發(fā)展前景的新興建模方法。
建筑空調(diào)負(fù)荷數(shù)據(jù)序列始終表現(xiàn)出非線性和動態(tài)特征,難以準(zhǔn)確預(yù)測。充分發(fā)揮各算法的優(yōu)點,多種算法融合建模是解決建筑空調(diào)負(fù)荷預(yù)測的主要手段。人工智能、大數(shù)據(jù)技術(shù)的發(fā)展為建筑空調(diào)負(fù)荷預(yù)測技術(shù)提供助力,深度多層網(wǎng)絡(luò)是一種具有巨大潛力的建筑空調(diào)負(fù)荷預(yù)測解決方法。