李遠征 孫天樂 劉云 趙勇 曾志剛
電網凈負荷為電力用戶用電需求與新能源出力之間的有功功率差值.隨著新能源的高速發展,風電和光伏發電大規模接入電網,在一定程度上減少了化石能源消耗,降低了環境污染.然而,受新能源功率的波動性和間隙性影響,特別是隨著風光等接入比例越來越高,電網凈負荷的精準預測變得十分困難,這給電網運行的安全性和經濟性帶來了一定的挑戰[1-3].因此,如何有效表征凈負荷的不確定性,從而在一定程度上合理安排電力備用資源,對確保電網安全經濟運行具有十分重要的意義.
目前,國內外關于電網凈負荷不確定性表征的相關研究,主要分為以下兩類.第1 類是通過概率預測或者區間預測方法來直接表征凈負荷的不確定性[4].第2 類是通過研究確定性預測值的預測誤差,分析其統計特性,從而表征凈負荷的不確定性[5].由于確定性預測相對于概率/區間預測簡單易行,因此基于第2 類的凈負荷不確定性表征方法受到國內外學者的密切關注.Bhandari 等使用Logistic 分布來描述凈負荷的預測誤差,相比于正態分布,Logistic 分布能更好地描述其偏峰特征[6-7].然而,當分布式可再生能源的滲透率較高時,Logistic 分布則無法描述其尖峰或者多峰的特征[8].為解決這一問題,文獻[9-11]使用高斯混合模型(Gaussian mixture model,GMM)來表征負荷與可再生能源的不確定性,通過利用GMM 對凈負荷預測誤差進行擬合,可以更好地描述尖峰的特性.然而,GMM 需要事先指定概率分布的混合模型組數,目前主要依靠經驗來設定,一般會導致較大的誤差.為了解決GMM上述的缺點,Sun等[12]使用狄利克雷混合模型(Dirichlet process mixture model,DPMM)來表征負荷的不確定性,但是該工作假設觀測數據是獨立的.事實上,在實際電網中,凈負荷表現為時間序列數據,具有較強的數據關聯特點,即數據關聯性[13].然而,傳統的DPMM 沒有考慮這一關聯性,導致其無法較好地描述凈負荷信息,存在一定的偏差.
針對DPMM 的這一缺陷,本文提出基于數據關聯的狄利克雷混合模型(Data-relevance Dirichlet process mixture model,DDPMM)的貝葉斯框架,使用考慮數據關聯的改進后驗概率分布,并結合變分貝葉斯推斷來獲取最優的混合模型個數及其參數,來更好地表征凈負荷不確定性.首先,構造基于狄利克雷過程的混合模型,其中主要包括每個混合模型的權重比例及其對應的參數;其次,利用凈負荷數據具有關聯性的特點,基于變分推斷方法提出一種改進的后驗分布,來描述各個模型與觀測數據之間的關系.進一步,使用改進的期望最大(Expectation-maximum,EM)算法對混合模型進行迭代求解,得到其在不同預測值下的預測誤差邊緣概率分布,從而實現凈負荷的不確定性表征.最后,根據比利時電網的數據進行實驗驗證.本文的主要貢獻包含以下3 個方面:
1)提出了基于數據關聯的狄利克雷過程混合模型,考慮凈負荷時序關聯性來改進DPMM 的后驗概率分布,并描述其不確定性.相比于DPMM 算法,DDPMM 可以更為有效地利用凈負荷數據.
2)本文根據改進的DPMM 后驗概率分布,構造出新的證據下界.基于EM 算法,利用新構造證據下界的更新信息證明了DDPMM 的收斂性.
3)通過比利時電網的實際數據驗證了DDPMM的效果.算例結果表明,與傳統的DPMM 相比,考慮凈負荷數據關聯信息的DDPMM 會大幅度加快收斂速度,混合模型精度也得以進一步提升.
本章首先通過對凈負荷數據進行分析,揭示凈負荷時間序列的數據關聯性;其次,通過該數據關聯性來改進傳統的DPMM,提出考慮數據關聯的狄利克雷混合模型的貝葉斯框架.
凈負荷數據的表現形式為時序序列,其當前狀態與歷史時刻相關,因此本文使用滯后相關性來描述凈負荷的數據關聯程度[14].具體計算為
針對式(1),以比利時2019 年全年凈負荷觀測數據Γ={ζ1,ζ2,···,ζt,···,ζN}為例,其中,ζt為第t個觀測數據,數據集Γ的時間分辨率為15 min,N為96×365=35040代表一年的數據量[15].ΓT代表滯后T步的凈負荷時序序列,ζt+T為第(t+T)個觀測數據.圖1 表示凈負荷的關聯程度,橫縱坐標代表時間滯后的尺度,共10 步,每步步長為15 min,右側色階表示其數據關聯程度大小.在圖1中,可以觀察到凈負荷的數據關聯程度隨著平移時間的增加而逐漸減少.以滯后10 步為例(T=10),坐標(0,10)對應的右縱坐標數值代表150 min 后的凈負荷{ζ1,ζ2,···,ζN-10}與當前數據{ζ11,ζ12,···,ζN}的關聯程度大小,即0.82.這表明當前數據與150 min后的凈負荷關聯性依然很強.
圖1 凈負荷數據關聯圖Fig.1 The data-relevance of net load
因此,在具體使用GMM 或DPMM 對凈負荷數據進行擬合時,需要考慮歷史數據對當前時刻的影響.然而,傳統的GMM 與DPMM 在處理時序序列時會假設各個觀測數據之間是獨立的,沒有考慮凈負荷數據關聯這一特點,可能導致GMM 與DPMM 生成的概率混合模型含有更多的組份,容易引起過擬合,影響凈負荷不確定性的表征精度[16].
為此,本文通過考慮凈負荷數據關聯的特點來改進傳統的DPMM,提出考慮數據關聯的狄利克雷混合模型貝葉斯框架.
本文所提出的基于數據關聯的狄利克雷混合模型貝葉斯框架包括3 個部分,如圖2 所示.
圖2 數據關聯狄利克雷混合模型變分貝葉斯框架Fig.2 The framework of DDPMM variational Bayes
第1 階段進行凈負荷數據歸一化.以x和y分別表示凈負荷的觀測值和預測值,它們的數值在本文研究的比利時實際電網數據集中已經給出.然后,對x和y分別進行歸一化操作[17].第2 階段,使用提出的DDPMM 得到x與y的聯合概率分布.首先,使用折棍構造過程[18]來表示狄利克雷過程,得到該聯合概率分布的混合模型;其次采用考慮數據關聯的改進變分貝葉斯推斷來計算出混合模型的均值矩陣與協方差矩陣,以及混合組數.最后,在第3 階段中,根據x與y的聯合概率分布,得到關于預測值的邊緣概率分布P(z|y),其中z=x-y代表凈負荷的預測誤差.通過上述基于DDPMM 的非參數貝葉斯框架來描述凈負荷的不確定性,其中主要包括折棍構造,狄利克雷過程和改進變分推斷這幾個步驟,下面分別進行闡述.
DDPMM 是基于DPMM 的改進,其中DPMM是一種非參數的貝葉斯的軟聚類方法,即它是將數據E={?1,?2,···,?N}以一定概率歸于某一高斯分布[19],其中N表示數據個數.DPMM 可以從數據中得到最優的概率分布來描述該數據集E,而無需指定混合模型的具體參數以及混合組數.
考慮一個連續的概率分布H(Ω),它的每個樣本點 Ωk={μk,σk}都表示高斯分布,其中μi,σi為其均值與方差,因此H(Ω)為一個混合模型,即它是由無窮個高斯分布加權得到,每個數據被分類到某個 Ωk中.然而,當H(Ω)為連續分布時,從H(Ω)采樣得到兩個相同高斯分布的概率為0,即任意兩個不同的數據?i,?j(i≠j)被分類至不同的高斯分布,將失去聚類的意義.因此需要將H(Ω)離散化,使不同的數據?i,?j(i≠j)劃分到相同的類里,該離散化過程稱為狄利克雷過程,它是用于貝葉斯建模和分析的隨機過程[20].定義H(Ω)為基分布,離散化之后的分布記為G.通過DP 采樣得到的分布G表示為
其中,?為濃度參數,表示的是H(Ω)離散化的程度.當?→0 時,分布G達到最離散的狀態,即成為樣本空間只有一個樣本的離散分布列;當?→∞,分布G與H相等,成為連續分布,即G=H.在這兩極端的情況之間,濃度參數?越大,G越接近基分布H(Ω)[21].
狄利克雷過程的構造方法主要通過折棍構造,其可以直觀地理解混合模型的構造過程.折棍構造就是將一根單位長度的棍子,通過多次折斷,得到不同長度的棍子,該過程被證明服從狄利克雷過程[22].折棍構造可以用以下兩個表達式得到:
考慮一根單位長度的棍子,如圖3 所示,每次選取當前長度的一定比例vm,其中vm服從Beta(vm|1,?),且vm∈(0,1),如式(3)所定義.每次選取出來的棍子長度πm為G中樣本的權重,即每個混合模型的比例,且它是一個概率測度,滿足以下條件:
圖3 折棍構造過程Fig.3 The process of steak-breaking
因此,每次選取出來的棍子其長度總和為1,即分布G的每個混合組份的權重之和為1.
通過每次對H(Ω)采樣出一個高斯分布,以及折棍構造計算出其權重系數,進而得到分布G,其中G的表達式為
其中,δΩm為Kronecker 函數,表達式為
圖4 為基分布示意圖,其中位于橫坐標之上的為基分布H(Ω),而橫坐標之下的是離散化之后的基分布G,其中 Ωi代表從H(Ω)采樣出的高斯分布,而πi表示每個高斯分布的權重.
圖4 基分布示意圖Fig.4 The base distribution
圖5 主要表示基分布G的形成過程.首先,Ωi由H(Ω)采樣得到,隨后通過折棍構造得到其權重πi.重復此操作,得到離散化的基分布G,式(6)為其對應的數學表達式.
圖5 狄利克雷混合模型Fig.5 Dirichlet process mixture model
事實上,通過上述基于折棍構造得到的DPMM,結合數據的統計性質,能夠更新出最優的混合組數,以及每個混合模型的權重πm與Ωm,且無需先驗知識.對于一個二維凈負荷數據?n=[xn,yn],可以采用DPMM將?n的概率密度函數表示為
其中,xn,yn分別表示第n個凈負荷數據的實際凈負荷觀測數據與預測凈負荷,和?=分別表示πm和Ωm的集合,pm(·)表示混合模型的第m個混合組份.一般認為其先驗為高斯分布[23],因此,可以將DPMM 表示為多元高斯分布的組合
圖6 表示DPMM 各變量之間的關系.首先混合模型權重π由濃度系數?生成,表示各混合模型的權重;Ωk表示從基分布H(Ω)采樣出的高斯分布.另外,混合模型權重π與凈負荷數據是通過隱變量Z間接聯系,其中混合模型權重表示了各混合組份占混合模型的比例.因此,圖6 中隱變量Z是由π生成的.可以得到Z在π上的條件概率分布表示為
圖6 DPMM 概率圖模型Fig.6 DPMM probability graph model
通過變分貝葉斯推斷(Variational Bayesian inference,VBI)以及上述的非參數狄利克雷混合模型,可以估計出較優的參數π和?,進而最終得到DDPMM.VBI 將在第2 節進行詳細介紹.
本節提出了考慮數據關聯的狄利克雷混合模型,通過使用數據關聯的信息來改進變分推斷,得到考慮數據關聯之后的后驗分布.首先,通過變分分布來近似凈負荷數據的似然函數,將變分推斷問題轉化為優化問題;然后通過考慮凈負荷數據關聯特點,建立新的變分后驗分布;最后通過構建新的上下界來證明DDPMM 是收斂的.
VBI 用于估計參數θ={π,?}以及隱變量Z的后驗概率密度,其中在數據E給定的情況下,目的是求解混合模型p,使數據E在給定參數θ上的后驗分布p(E|θ)最大:
由于p(E|θ)難以計算出解析表達式,本文利用VBI 使用變分分布q來近似原分布p.VBI 假設變分分布q來自于變分族 L,通過最小化KL 散度來近似后驗分布.因此,VBI 把貝葉斯推斷問題轉化成為一個優化問題.根據定義,p(E|θ)的對數似然可以分解為如下形式:
因此,極大化p(E|θ)就需要優化Z與θ兩個參數,分兩步優化,第1 步優化參數Z,使變分分布q(Z)接近p,稱為期望步(Expectation step,E step),即得到期望的變分分布;第2 步優化參數θ,稱為最大化步(Maximization step,M step),通過優化θ來極大化lnp(E|θ).
本文著重考慮凈負荷的數據關聯性,圖7 表示考慮數據關聯的DPMM 概率圖,與圖6 不同之處在于當前時刻數據參考了上一時刻數據的信息,即Zi的部分信息來自于Zi-1.這一部分由變分分布q(Z)決定,因此DDPMM 主要考慮變分分布的改進,使得q(Z)去近似p(E|θ).通過使用凈負荷的關聯數據的特性可得到改進后的變分分布q(Z),即極小化KL(q(Z)||p(Z|E,θ)),這對應于EM 算法中的E 步,即得到期望的變分分布.其中KL(q(Z)||p(Z|E,θ))為KL 散度,可視為兩個分布之間的距離,KL 散度越小兩個分布越相似.由KL 散度的非負性可知,lnp(E|θ)≥ELBO,其中,ELBO為證據下界(Evidence lower bound,ELBO).當觀測數據和預測數據已知,混合模型固定時,p(E|θ)為常數,因此KL散度的極小化問題可以轉化為如下問題:
圖7 考慮數據關聯性的DPMM 概率模型圖Fig.7 DPMM probability model graph considering data-relevance
VBI 通常假設變分分布來自場變分族,隱變量之間相互獨立,為了更好地描述變分分布,本文將折棍構造截斷,取一個稍大的值作為混合組數上限.
其中,K為混合模型成份的上限值.通過使用信息傳遞算法進行循環坐標優化,得到每個隱變量的更新公式.對于第k個隱變量,將與zk無關的變量都視為常數.因此,式(14)的目標函數可以轉化為如下形式:
根據式(17)得到qk的更新公式如下:
因此,最優的變分分布為其中,Eq(z-k)表示除第k個隱變量,對其他隱變量進行期望運算.
通過式(20)迭代更新每個隱變量的變分分布,可以得到最優的變分分布.此外,由式(21)可知對每個qk的二階偏導都小于0,因此其對于每個qk都是凸的.通過式(20)更新得到的變分分布,可保證ELBO 的更新單調不減.最優變分分布的對數表達式ln(Z)可表示為
將式(11)與式(12)代入式(22),并將與Z無關的變量處理到常數項中,得到
傳統的VBI 假設 L 隱變量之間相互獨立,然而凈負荷是時序序列,其前后數據具有關聯性.因此,考慮關聯性的最優變分分布可以表示為
其中,k′表示第n-1 個數據最大響應度的混合組份.考慮第n個數據與第n-1 個數據的混合組份的信息,可以將定義為
對歸一化,得到歸一化之后的響應度:
因此,根據式(15)和式(28)可以得到改進之后的MELBO (Modified evidence lower bound)與原始的ELBO 差值如下:
MELBO-ELBO的上下界為MHB (Modified high bound)與MLB (Modified low bound),式(33)和式(34)中,MHB與MLB分別表示改進上界與改進下界.
然后考慮凈負荷數據關聯的特征,采用EM 算法找到最優的q*(Z).具體首先求解出變分分布的具體形式.隨后,固定q*(Z),使MELBO 的改變只與參數θ有關∫,進而通過優化θ可以得到最優的對數似然函數從而計算出最優的lnp(E|θ).其具體的表達式以及收斂性證明可見附錄A.
EM 算法結合凈負荷數據關聯性的改進后驗分布對應的迭代過程如圖8 所示.首先,通過式(14)得到對數似然值以及證據下確界ELBO,KL(q||p)表示變分分布q(Z)與p(Z|E,θ)之間的距離,如圖8(a)所示.經過E 步,下界ELBO 得到更新.圖8(b)表示ELBO 單調遞增導致KL(q||p)減小,變分分布q(Z)與目標分布p(Z|E,θ)距離縮短.在得到ELBO之后,計算DPMM 后驗分布時考慮了凈負荷數據關聯的特點,因此使用改進之后的變分后驗Modifiedq(Z).該后驗分布會導致圖8(b)的ELBO 產生變化,所以引入改進上界MHB 與改進下界MLB 來得到改進之后的證據下界MELBO 相對于ELBO的變化范圍,其中MELBO 位于MHB 與MLB 之間,如圖8(c)所示.經過后驗分布的改進,可得到最終的MELBO.最后,通過M 步優化參數θ來極大化對數似然函數,如圖8(d)所示.需要指出的是由于改進之后的EM 算法得到的MELBO 位于MHB與MLB 之間,會導致其與改進之前的ELBO存在差值,進而在迭代時會發生震蕩.但是考慮了數據關聯的DDPMM 能夠提高收斂速度,詳細的結果將在第4 節展示.
圖8 考慮數據關聯的EM 迭代圖Fig.8 EM iterative graph considering data-relevance
為了驗證提出的數據關聯狄利克雷混合模型優越性,本文根據比利時電網2019~2020 年的凈負荷數據進行驗證,比利時電網中風電與光伏裝機容量為3 157 MW和3 369 MW,分別占總裝機容量的16.0%與17.0%.圖9 為2020 年7 月1 日的凈負荷與凈負荷預測曲線以及負荷與負荷預測曲線,其中需要指出的是預測值由數據集直接給出.
圖9 2019 年7 月1 日凈負荷與負荷曲線Fig.9 Net load and load curve on July 1,2019
可以看到負荷預測誤差較小,而凈負荷誤差較大,因為其包括隨機性較強的可再生能源.為了驗證所提出DDPMM 的優越性,本文使用2019 年的凈負荷數據作為訓練集,2020 年的凈負荷數據作為測試集,時間分辨率為15 min.在本文提出的基于DDPMM 的非參數貝葉斯框架中,首先歸一化觀測數據 [z,y]T,其中z=x-y.然后,使用DDPMM得到 [z,y]的聯合概率分布.最后根據凈負荷的預測值得到預測誤差在各預測值下的邊緣概率密度,并通過相關指標來評價DDPMM 的優劣.
結果部分首先驗證了DDPMM 的收斂性;進一步,通過擬合凈負荷預測誤差,得到DDPMM 的擬合效果;最后通過區間指標來評價DDPMM 對凈負荷預測誤差的整體表征效果.
DDPMM 利用了時序序列數據關聯的信息,使收斂速度加快.圖10 表示了隨著迭代次數的增加,DDPMM 與DPMM 逐漸趨于收斂,其中縱坐標代表了每次迭代的變化值p(E|θ),若變化值趨于0,則可認為已收斂.為了詳細地對比DDPMM 與DPMM的收斂速度,本文采用了對數縱坐標軸,對縱坐標軸進行以10 為底的對數運算.從圖10 中可以觀察到DDPMM 與DPMM 在3 000 代之后逐漸收斂.其中對于DPMM 每代p(E|θ)的變化略大于10-10,而DDPMM 的變化則更小.
圖10 基于2019 年凈負荷數據的DDPMM與DPMM 迭代曲線Fig.10 DDPMM and DPMM iterative curves based on net load data in the year of 2019
另外,還可以觀察到DDPMM 在收斂時反復振蕩.這是因為DDPMM 在更新的時候考慮了凈負荷數據關聯的特點,這會導致DDPMM 對應的p(E|θ)變化相較于DPMM 是不均勻的,因此會產生振蕩.另外DDPMM 算法是基于DPMM 改進的,所以在迭代的前期,DDPMM 與DPMM 對應的變化趨勢大致相同,如圖10 中局部圖所示.
隨著迭代次數的增加,DDPMM 由于獲取了更多的凈負荷數據信息,其更新會加快.在大概迭代至3 000 代時,DDPMM的p(E|θ)變化逐漸減小,而DPMM 基本保持不變,這意味著DDPMM 相較于DPMM 收斂更快.因此,從圖10 的收斂曲線可以看出DDPMM 在前期進行迭代的時候,會犧牲一部分穩定性去尋找更多優秀的解來加快迭代速度.
為了比較DDPMM 的條件概率分布誤差擬合效果,本文使用GMM 與DPMM 對其進行對比.其中GMM 的組數通過赤池信息準則(Akaike information criterion,AIC)以及貝葉斯信息準則(Bayesian information criterion,BIC)來確定[24],AIC 與BIC 的具體計算為
其中,k表示模型參數個數,L表示模型的似然函數,n為凈負荷樣本數量.AIC與BIC為衡量統計模型擬合優良性的指標.通過計算GMM 混合組數為1,2,···,m個時的AIC與BIC數值(其中m表示一個較大的數),獲得m1與m2使其對應得到的AIC與BIC數值最小,將其記為GMM-AIC 與GMM-BIC.
通過計算得到 GMM-AIC 的組數為20,GMMBIC 的組數為13.另外,由DPMM 得到的最優組數為15,而DDPMM 得到的最優組數為5.這是因為DDPMM 擬合凈負荷數據 [x,y]T時,考慮了更多的信息,進而合并相似的高斯分布.但是,DPMM與GMM 的混合組數多于DDPMM,表明其考慮了更多局部的信息,容易導致過擬合.
本文根據數據樣本數目,將其均分為10 份,每份樣本條目的平均值作為每個條件概率分布的凈負荷預測值.圖11 為DDPMM,DPMM 與GMM 在各預測值下的條件概率分布圖,通過與凈負荷數據直方圖的比較,得到各模型在測試集上的擬合效果.
通過圖11 可以觀察到,當凈負荷預測值較小或者較大時,如圖11(a)與圖11(j)所示,凈負荷的預測誤差較大.GMM 模型無法很好的表征其不確定性,而DDPMM 與DPMM 在這一方面表現較好.
為了進一步定量比較不同模型的凈負荷預測誤差擬合效果,本文采用對數似然(Log-likelihood,Log-L)與卡方擬合優度值(Chi-square goodness of fit,Gof)兩個指標,其中對數似然以lnp(E|θ)的值為指標,該指標數值越大代表對應模型擬合效果越好;Gof 衡量了兩個概率分布之間的差異,Gof 數值越小則表示擬合效果差異越小.
表1 為4 個模型的對數似然值,在2020 年凈負荷數據上DDPMM 有更大的對數似然值,表明DDPMM 擬合效果更好.表2為4個模型的Gof值,可以觀察到DDPMM 表現比較良好,在圖11(a)~(d),11(g)以及11(j)中Gof 最小,而在其他情況下表現稍弱于DPMM.這是因為Gof 在本文中用來評估圖11 中10 種預測值下的條件概率分布擬合效果,主要描述局部信息.
表1 對數似然比較Table 1 Comparison of log-likelihood
表2 卡方擬合優度比較Table 2 Comparison of goodness of fit of Chi-square
圖11 不同預測值下的凈負荷預測誤差條件概率分布Fig.11 The PDF of net load forecast error conditions under different forecast values
因此,為了更好地衡量DDPMM 表征凈負荷整體不確定性的能力,本文進一步使用區間指標來評價凈負荷預測誤差的整體信息.具體是首先設置預測誤差分位數α,在圖11 中根據不同預測值所屬的預測誤差條件概率分布,得出預測值對應的上下分位數從而獲取凈負荷的預測上下界.然后通過該預測上下界與實際觀測數據xi比較,從而獲得凈負荷的整體信息,如區間寬度,區間覆蓋率等指標.預測值的區間上下界Uα(xi)和Lα(xi)表示為
為了評價通過凈負荷預測誤差概率分布所得到的區間質量,本文引入5 個指標來進行評估,分別為Winkler 分數、PICP (Predict interval coverage probability)、CWC (Coverage width-based criterion)、AIS (Average interval score)、MPICD(Mean predict interval center deviation)[25].其中,PICP 主要衡量區間的覆蓋率;Winkler,CWC 以及AIS 描述了區間覆蓋率與區間寬度之間的關系;MPICD 主要描述了預測值處于區間的位置的情況,如果接近區間的中線則代表效果更好.其中Winkler、CWC和MPICD 越小越好,而PICP和AIS越大越好.這5 個指標具體的數學表達式參見附錄B.
本文選擇0.95 的置信度來構造置信區間,以3 月、6 月、9 月以及12 月為典型月份作為測試,各模型得到的結果如圖12 所示.可以觀察到在0.95的置信度下,DDPMM 的指標表現優秀,其指標基本優于其他三個模型.表3 列出了圖12(a)對應的具體指標值,可以得出DDPMM 的Winkeler 分數相比DPMM,GMM-AIC 與GMM-BIC 分別提高了9.7%,14.2%和8.9%,相對于DPMM 提升明顯.另外,還可以觀察到GMM-AIC 的Winkler 分數最大,而其混合組數為20 個,這說明GMM-AIC 發生了過擬合,而其他三個模型相對來說擬合較好,其中DDPMM 擬合效果最好.另外,CWC 與AIS 綜合考慮了預測區間覆蓋率與預測區間的寬度,可以看到DDPMM 相較DPMM 分別提高了81.7%與34.0%,提升效果顯著.PICP 為區間覆蓋率,在0.95 的置信度下DDPMM 達到了0.80,而DPMM為0.70,說明DDPMM 可以更好地表征凈負荷不確定性.MPICD 描述了模型是否均勻,可以看到在這個指標上DDPMM 與其他三個模型差異并不十分明顯,但是仍優于其余三個模型.
表3 0.95 置信度下2020 年3 月區間指標Table 3 Interval index for March 2020 with 0.95 confidence level
表4~6 給出了圖12(b)~(d)的具體區間指標數值,顯然DDPMM 在Winkler 分數表現最優,而GMM-BIC 模型的Winkler 分數優于DPMM.另外在PICP 指標上,DDPMM 的優越性較為明顯,相對于DPMM 在6 月、9 月和12 月分別提高了8.1%,11%和18%.在CWC 與AIS 指標中,DDPMM 在9 月與12 月相對于其余三個模型表現更為優秀.此外,在MPICD 指標的對比中,3 月和9 月DDPMM 的表現更好,說明DDPMM 可以更好地表征凈負荷的不確定性,并且得到的凈負荷預測上下界更均勻地分布于觀測值兩側.
圖12 0.95 置信區間雷達圖Fig.12 Interval radar chart with 0.95 confidence
表4 0.95 置信度下2020 年6 月區間指標Table 4 Interval index for June 2020 with 0.95 confidence level
表5 0.95 置信度下2020 年9 月區間指標Table 5 Interval index for September 2020 with 0.95 confidence level
表6 0.95 置信度下2020 年12 月區間指標Table 6 Interval index for December 2020 with 0.95 confidence level
由表7和表8 可以觀察到,在不同的置信度下,DDPMM 都表現優異,并且它的PICP 指標最接近置信度,表明DDPMM 的預測區間具有良好的區間覆蓋度.更進一步可以觀察到,DPMM 與GMMBIC 指標相差不大,可以認為在當前數據集下,DPMM 與GMM-BIC 得到的混合組數相近,其中DPMM 為15,GMM-BIC 為13.然而DDPMM 只使用5 個混合組份描述了更多的信息,說明了DDPMM的優勢.
表7 0.8 置信度下2020 年6 月區間指標Table 7 Interval index for June 2020 with 0.8 confidence
表8 0.5 置信度下2020 年6 月區間指標Table 8 Interval index for June 2020 with 0.5 confidence
通過以上的結果驗證了DDPMM 表征凈負荷不確定性問題的優越性.同DPMM,GMM-AIC 與GMM-BIC 相比,DDPMM 得到的混合模型組份數目更少,獲得的有效信息更多,減少了過擬合對于表征凈負荷不確定性的不利影響.
本文提出了基于數據關聯的狄利克雷混合模型,通過變分推斷方法改進了后驗分布,使后驗分布考慮了更多的凈負荷數據關聯信息.從而構造出改進證據的下界,使得DDPMM 通過這一下界得到合適的變分分布,并結合EM 算法證明其收斂性.
最后,通過將比利時電網作為算例,使用不同的指標來衡量DDPMM 表征凈負荷不確定性的局部與整體信息.驗證結果表明,DDPMM 具有更快的收斂速度,更優的精度,可以更好地表征電網凈負荷的不確定性.
附錄 AEM 算法收斂性證明
EM 算法主要是通過迭代來逐步近似極大化lnp(E|θ).設第i次迭代之后θ的估計值為θ(i),則希望新的估計值θ會使 lnp(E|θ)>lnp(E|θ(i)),并逐步達到其極大值.考慮兩者的差,并利用Jensen 不等式得到其下界:
由式(A1)和式(A2)可以得到lnp(E|θ)>B(θ,θ(i)),故B(θ,θ(i))為lnp(E|θ)的下界,B(θ,θ(i))增大會導致lnp(E|θ)增大.通過選擇合適的θ(i+1)使B(θ,θ(i))達到極大值,從而使 lnp(E|θ)增大,即
式(A3)為EM 算法中的M 步.通過式(A3)可以得到一列參數估計序列 {θ(1),θ(2),···,θ(i),···},并且lnp(E|θ(i))是單調遞增的.
證明.
由于E 步是對變分分布q(Z)逐步更新,當迭代更新的次數變多時,變分分布與p(Z|E,θ)的距離足夠接近,可以認為兩者近似相等.因此,式(A8)可以表達為以下形式:
即當迭代次數足夠大時,DDPMM 總是向似然函數增大的方向進行更新,即 lnp(E|θ(i+1))>lnp(E|θ(i)).與此同時,因為p(E|θ)為概率密度函數,存在上界,根據單調收斂的性質,p(E|θ)會收斂至極大值.□
附錄 B區間指標
B.1 PICP
PICP 為真實值xi落在預測區間的比率,稱為覆蓋率.因為得到預測區間是根據邊緣概率分布的上下分位數確定的,所以無法包含所有的數據點.PICP 可以表示為
B.2 Winkler 分數
Winkler 分數是對預測區間的一種綜合度量類型,它可以同時測量區間覆蓋率和區間的寬度,Winkler 分數可以表示為
當實際觀測值大于上區間或者小于下區間時,Winkler 分數就會得到一個懲罰.懲罰由α決定,令α=0.1,δ=1.從Winkler 分數的定義可以看出,Winkler 分數越小說明該模型所受到的懲罰越小,表明該模型有更好的區間預測效果.
為了更好地衡量各模型的區間覆蓋率與區間寬度,通常情況下希望在分位數確定的情況下,區間覆蓋率越大越好,而區間寬度越窄越好.因此,文中引入CWC和AIS 兩個指標來描述這兩個特征.
B.3 CWC
CWC 綜合考慮了預測區間的覆蓋率與狹窄程度,其定義為
其中,PINAW為區間平均寬度,γ由PICP決定:
其中,μ為置信水平,η為懲罰系數.η越大,PICP沒有達到置信水平時的懲罰就越大.本文將η設置為5.
B.4 AIS
AIS 為另一個綜合考慮覆蓋率與區間寬度的指標,AIS 對應的第i個數據點預測區間的區間分數Sα(xi)的定義為
AIS值越大說明預測區間的品質越好.
B.5 MPICD
MPICD 表示觀測數據偏離預測區間中線的程度,其計算式為
MPICD越小,表明xi越接近預測區間中線.