李香龍,張寶群,馬龍飛,徐振華
(1.國網北京市電力公司電力科學研究院,北京100075;2.北京航空航天大學自動化科學與電氣工程學院,北京100191)
隨著環境污染問題和能源危機問題日益凸顯,清潔能源和節能環保產品的使用逐漸得到推廣[1]。近年來新能源的快速發展,采用電采暖替代傳統燃煤供暖,不僅能夠有效緩解冬季供暖所帶來的空氣污染問題,同時充分利用新能源,節省大量傳統燃料能源。北京農村供暖建筑保溫性差,相比于城鎮供暖耗能更高。北京農村地區住房供暖面積近年來增長迅速,從2006年農村住宅面積1億平方米增加到2014年1.5億平方米,平均年增長率為5.2%。針對日益增長的農村供暖需求問題,北京市提出“煤改電”計劃,2017年完成20.5萬戶“煤改電”改造任務。“煤改電”計劃的大范圍推廣,使得冬季用戶用電負荷將大幅度增加,電力負荷峰谷差進一步增大,嚴重危害電網安全穩定運行。準確的冬季電采暖負荷預測能夠有效緩解電力系統調峰和調頻壓力,對電力系統的安全經濟穩定運行具有重要作用[2]。
負荷預測研究主要集中氣象因素對電力負荷的影響,負荷預測方法包括有一元線性回歸模型、時間序列模型、BP神經網絡算法、小波分析和支撐向量機等算法[3-8]。其中一元回歸模型和時間序列模型相對比較簡單,考慮影響因素不全面,預測結果誤差較大。BP神經網絡學習訓練則考慮了多種影響因素,但學習泛化能力弱,容易陷入局部優化的困境。支撐向量機算法則只考慮了溫度對供暖負荷的影響,而沒有考慮其他因素對供暖負荷的影響,導致最終預測結果誤差較大。傳統智能神經網絡算法采用黑箱式數據訓練和學習,沒有考慮無法測量數據對實際預測效果的影響,導致預測結果的可靠度不高,預測誤差較大。
貝葉斯網絡用于負荷預測研究在近年來受到廣泛關注,并取得了一定的成果,由于貝葉斯網絡采用圖形結構形式來表示知識,因此對復雜系統簡單化處理的效果十分顯著。Douglas首先采用貝葉斯網絡來實現天氣的預測,包括室外最高氣溫和平均氣溫,然后由得到的溫度預測結果進行短期電力負荷預測[9]。Lauret等人使用貝葉斯網絡首次進行短期電力負荷預測,并且利用Laplace算法實現貝葉斯網絡結構中網絡參數的學習和優化,得到較好的結果[10]。Saini等人結合貝葉斯網絡和BP神經網絡,通過貝葉斯網絡來學習BP神經網絡中的結構參數,從而實現對未來7天的電力最大負荷的預測[11]。Cottet等人引入了馬爾可夫鏈蒙特卡洛方法,通過貝葉斯網絡模型,實現對一階穩態向量的自回歸模型的學習,并利用該模型實現超短期負荷的預測[12]。
采用貝葉斯網絡推理算法建立電采暖負荷預測模型。通過分析影響電采暖負荷的因素和各個影響因素之間的內在關系、條件依賴特性,對不同的影響變量采用不同的方式進行處理[13],搭建合理的貝葉斯網絡結構,不僅改善了傳統神經網絡結構,同時通過概率統計以及對大量統計數據學習訓練,使得網絡結構更加清晰,推理預測更加合理,預測結果更加準確。結合北京電力科學研究院提供的2016年某市冬季電采暖負荷實測數據,通過網絡訓練和學習并進行預測,表明模型預測誤差小,隱含數據分布信息得到有效學習和挖掘。
隨著“煤改電”計劃的實施和推廣,電采暖負荷已經成為冬季電力負荷的重要組成部分。與一般電力負荷不同,電采暖負荷類似夏季的空調制冷負荷,不僅具有明顯的季節氣候特性,受氣溫變化影響顯著,而且具有較強的時序特征,即電采暖負荷變化不僅受到氣溫變化的影響,且與其歷史時刻的狀態也密切相關。
電采暖方式包括直熱式、蓄熱式和空氣源熱泵設備供暖等。直熱式供暖直接利用電熱管將電能轉化為熱能,通過加熱水媒介實現供暖;蓄熱式供暖是在用電谷段開啟蓄熱模式,將電能轉化為熱能并存儲在儲熱物質中,然后在用電峰段優先使用儲熱物質中的熱量供暖,實現用戶經濟供暖;空氣源熱泵供暖則是利用空氣源熱泵設備,依據逆卡諾循環原理,從外界空氣中提取熱量為室內房間供暖,高效節能且環保。
影響電采暖負荷變化因素眾多,主要包括環境氣溫變化、用戶采暖用電習慣、區域電采暖設備規模和建筑熱力學狀態等[14-16]。用戶采暖用電習慣主要指用戶采暖方式和采暖設備設定溫度大小。用戶采暖方式即直熱式、蓄熱式、空氣源熱泵設備等其中一種或幾種的組合。建筑熱力學狀態主要包括建筑房間的等效熱容、等效熱阻和散熱功率等。可知影響電采暖負荷變化因素的信息是難以獲取測量和采集的,采用貝葉斯網絡能夠有效解決這類包含有未知的隱含數據信息問題。
貝葉斯網絡是一種采用圖形結構來表示知識的,一種通過概率統計的計算和大量歷史數據的學習,實現對復雜系統的不確定性推理和預測的智能方法。貝葉斯網絡參數優化學習的過程是通過對歷史數據進行訓練來尋找得到最簡約的網絡結構和網絡參數,從而來表示網絡數據中各個變量之間的因果關系和條件概率特性的過程。
對模型的求解時,常常難以全面獲取模型數據,總有部分數據無法觀測和獲取,此時稱該模型中含有隱含變量,獲得的數據稱為不完全數據,其中無法測量獲取的數據稱為隱含數據,此時對模型的參數進行估計是十分困難的。在貝葉斯網絡的學習中,采用EM算法實現對含有隱含變量的不完全數據進行參數學習,通過算法本身特性可以實現從不完全數據中建立包含隱含變量數據的模型,提高了模型的準確性。
EM算法由期望計算E步驟和最大化計算M步驟兩部分組成,通過兩步驟的反復迭代完成參數的估計計算。 給定觀測樣本數據[x1,x2,x3,…xm],對此觀測數據得到關于參數θ的概率模型為p(x;θ),關于參數θ的對數似然函數為:
如果觀測得到的樣本數據是完全的,那么根據此似然函數很容易得到估計參數θ,但是實際觀測得到的樣本數據是不完全的,令其隱含變量為z,則此時得到的關于參數θ的對數似然函數為:
由于隱含變量z的存在,因此對參數θ的估計就十分困難,此時EM算法就給出了在這種情況下對參數的有效估計方法,其基本的過程就是猜測參數θ和隱含變量z的分布情況,然后進行重復迭代和更新,直到參數滿足條件收斂。
2.2.1 E 步驟
首先令Qi(z)為隱含變量z的分布,那么有:
且有:
由于隱含變量z的存在,則能夠使l(θ)界增大的參數θ均能夠使l(θ)增大,則選擇隱含變量z的分布滿足最大化似然函數l(θ)的下界,式(4)取等號的條件為:
式中c為常數,因此可以得到隱含變量z的分布滿足:
由此可以得到:
2.2.2 M 步驟
在此隱含變量z的分布條件下,調整優化參數θ使得似然函數最大化,即為對上述的似然函數求導,并令其為0,得到的即為最大化似然函數的參數θ。
然后重復上述的E步驟和M步驟,不斷迭代優化直至收斂即可以得到最終模型的求解。
在影響電采暖負荷的各個因素中,可獲取的歷史數據有室外溫度變化和日、時刻類型,其余變量均是難以獲取的,因此考慮采用貝葉斯網絡進行負荷預測,搭建網絡結構如圖1所示。
圖1 貝葉斯網絡結構Fig.1 Bayesian network structure
圖1 中可觀測數據包括室外環境溫度變化和日、時刻類型信息以及供暖負荷數據,隱含變量數據則是設備組合狀態信息和室內設定溫度信息。利用貝葉斯網絡對其中各個變量進行處理。
在貝葉斯網絡進行數據學習中,網絡原始訓練輸入數據,包括室外溫度和日、時刻類型數據,采用歸一化方式處理。
對于隱含節點變量,類型不同,其處理方式也是不相同的,分幾種情況,其中稱需要處理的變量節點為子節點,與其連接的上一層節點為父節點[17-20]。
3.2.1 離散變量
當子節點為離散節點,父節點為離散節點,對該節點處理過程如下:
式中i為該節點的可能取值;j為該節點上一層節點的可能取值。
若子節點為離散節點,父節點為連續節點,需要對連續變量父節點的條件概率進行處理,處理方式為將其轉化為離散節點進行計算。
式中x為父節點變量取值;i為子節點取值;n為子節點可能取值的總數;wi和bi為子節點變量取值為i所對應的權重和閾值。
當離散子節點的父節點既有連續節點,又有離散節點情況時,這時,需要將離散節點處理為連續節點,因此對每一個不同的離散節點離散值的組合給定一個w、b參數集合,這樣將離散節點看作是連續節點進行處理。
式中x為連續父節點變量取值;j為離散父節點變量取值;i為子節點取值;n為子節點可能取值的總數;wi,j和bi,j為離散父節點取值為j時,子節點變量取值為i時所對應的權重和閾值。
3.2.2 連續變量
若子節點為連續節點情況,不論父節點是離散節點,還是連續節點,對其處理方式均是將子節點離散化,即處理為一個離散節點形式,這類節點稱為高斯節點,其滿足高斯分布。
式中當子節點取值為y,父節點中離散父節點Q為i且連續父節點X為x時滿足的高斯分布的各項參數情況。
根據高斯分布特征可以知道,當Y取值為高斯分布的均值時,其概率最大,因此可以得到該節點的最大預測取值為:
式中X為離散節點Q的父節點,m為離散父節點X的可能取值數。
采用國家電網北京市電力公司電力科學研究院提供的2016年某地區電采暖負荷數據共1 512組,采樣間隔為60 min。獲取的數據包含房間供暖負荷、氣溫變化和對應日期。將獲取的數據最后10天共240組數據作為測試集,其余數據作為訓練集。通過貝葉斯網絡搭建的供暖負荷預測模型對訓練數據進行學習并進行相應的負荷預測,得到預測結果如下。
貝葉斯網絡訓練過程對數似然變化如圖2所示。
圖2中表現了隨著貝葉斯網絡數據訓練迭代次數的增加,網絡參數得到優化,概率似然值逐漸增大然后趨于穩定,網絡效果性能不斷提升。通過貝葉斯網絡得到預測功率與實際功率相對百分誤差分布如圖3所示。
圖2 對數似然Fig.2 Log likelihood
圖3 預測誤差Fig.3 Prediction error
圖3 為預測相對百分誤差分布情況,可知總體預測相對誤差小于5%。總體網絡預測效果好,預測誤差符合精度要求。
由此可以得到在不同時刻點不同的日類型條件下,當室外溫度和電采暖負荷信息確定的條件下,得到此時機組的設定溫度和設備組合狀態分布情況。分析貝葉斯網絡中對隱含變量的分布學習情況,得到設備組合狀態部分時刻分布情況見圖4。
圖4 設備組合狀態分布Fig.4 State distribution of equipment
從圖4可以得到房間大部分時段處于使用空氣源熱泵設備采暖為高概率狀態,少部分時間段使用蓄熱式設備概率大于空氣源熱泵設備狀態。其中使用蓄熱式設備概率較高狀態所處的時間段處于用電低谷時段,此時用戶選擇采用蓄熱式設備供暖,提高用電經濟性。
對于隱含變量電采暖設備設定溫度,在貝葉斯網絡模型搭建的過程中取值為離散變量形式,分為高溫、較高溫、低溫和較低溫四個等級,由此得到局部設定溫度狀態概率分布情況如圖5所示。
圖5 供暖設定溫度概率分布Fig.5 Heating set temperature probabilitydistribution
對圖5中局部進行放大并與預測歸一化負荷功率對比和分析如圖6所示。
圖6 供暖設定溫度局部概率分布Fig.6 Heating set temperature local probability distribution
根據圖6,可以看出電采暖負荷功率較大時,設備設定溫度為高溫和較高溫的概率大于設備設定溫度為低溫和較低溫的概率,同樣當電采暖功率負荷較小時,設備設定溫度為低溫和較低溫的概率較大。因此可以說明設備功率變化和設備設定溫度的高低是密切相關的。同時采用該網絡結構進行預測得到預測結果誤差較小,滿足要求。
通過貝葉斯網絡搭建電采暖負荷預測模型,并通過歷史數據的學習進行電采暖負荷的預測,解決了以下關鍵問題。
(1)通過合理搭建貝葉斯網絡結構,通過歷史負荷數據的學習實現了電采暖負荷較高精度的預測;
(2)基于貝葉斯網絡算法的優點,不僅解決了傳統智能算法對不完全數據學習的缺陷,采用概率分布的方式進行負荷預測,同時能夠從學習結果以及貝葉斯網絡結構內部了解到預測數據的推理過程,通過變量之間的影響和條件依賴關系可以得知導致事件發生形成的各個因素條件概率分布情況,使得網絡數據學習不斷“白化”。通過貝葉斯網絡的數據學習能更有效的挖掘數據內部隱含信息,同時能夠挖掘數據中隱含的包含明確物理意義的隱含信息,對提高電采暖負荷預測精度提供了一種新方法和新思路。