李建宜, 李鵬, 徐曉春, 施儒昱, 曾平良, 夏輝
(1. 華北電力大學電氣與電子工程學院,河北省保定市 071003;2. 國網江蘇省電力有限公司淮安供電分公司,江蘇省淮安市 223400;3. 國網江蘇省電力有限公司蘇州供電分公司,江蘇省蘇州市 215000;4.杭州電子科技大學自動化學院,杭州市 310018)
近年來隨著新能源發電規模日益增大,傳統機組提供的電力占比顯著減少[1-2]。同時,伴隨風機、光伏等分布式新能源、儲能以及柔性負荷大量并網,負荷占比不斷提升,導致傳統配電網逐漸轉變為有源系統[3-5]。上述源荷雙重特性的變化,對電網的安全特性以及電壓控制帶來了風險和不確定性。
分布式光伏、風機接入配電網,其不確定性、波動性及間歇性不可避免地會造成配電網節點電壓波動頻繁[6]。國內外學者針對分布式光伏、風機接入電網后對節點的電壓影響展開研究,文獻[7-8]針對多地區分布式光伏的中壓配電網展開研究,通過標準光伏概率模型生成仿真模型,研究了不同容量光伏、風機接入電網后,配電網電壓穩定性分析。文獻[9]基于誤差前饋法,完成風機集群的超短期快速預測,并考慮不同時間尺度下風電場間的協調互補問題,構建了多時空尺度分層調度模型。文獻[10-11]計及分布式電源的不確定性,引入大量小型分布式光伏、風機,利用半不變量法計算概率潮流,從而計算不同節點的電壓波動范圍,進而驗證了區域電網電壓節點安全性。文獻[12]考慮了風電場之間存在的相關性,采用Copula函數以及K-means聚類方法建立相鄰地區風機出力的聯合概率模型,然而其在K-means聚類方法上使用試湊法,此方法在處理大量數據時費時費力。上述仿真模型存在以下幾點不足:1)光伏、風機模型采用標準概率模型,容易忽略不同地區的光伏、風機出力特性;2)區域內存在多個光伏、風電場時,容易忽略區域內或區域間存在的相關性;3)如采用實際出力數據建立高精度概率模型,既可反映出力特征也可以反映區域間相關性,但數據量過于龐大,極大增加了輸入數據的維度,降低了模型仿真效率。
針對以上問題,為了能夠較好地反映不同地區新能源出力特征且提高仿真效率,本文首先提出一種融合標準概率模型和實測出力數據的綜合概率模型,用于準確構建單個風機、光伏出力特征;然后,結合馬爾科夫-蒙特卡洛狀態轉移模型,對區域內多個光伏及風機的概率模型進行修正,構建考慮多個光伏、風電場相關性的聯合概率分布模型;根據此模型生成大量新能源輸入數據,通過最優潮流計算節點電壓輸出數據,通過節點電壓標準差驗證本模型有效性。最后,為應對數據量龐大這一問題,基于深度學習模型中的PYTORCH框架,建立全連接神經網絡進行訓練,利用數據深度挖掘高維非線性系統的功率-電壓映射關系[13],并且通過驗證數據集準確率驗證本方法的有效性。
蒙特卡洛法是以概率和統計的理論方法為基礎的一種數值計算方法。其原理是將所求問題與概率模型相結合,通過數據離散化對已有概率模型進行合理抽樣,從而可以模擬出近似模型。同時,不同地區光伏、風機因地理距離、物理環境因素具有較強的相關性,僅考慮單個節點出力的概率模型會導致整體電網模擬結果與真實分布有較大差異,故通過馬爾科夫狀態轉移模型進行時間-空間的偏差修正,完成聯合概率分布模型構建。在此基礎上生成電網運行數據集用于深度學習框架訓練,流程如圖1所示。

圖1 功率-電壓映射流程Fig.1 Flowchart of power-voltage mapping
常規電力系統仿真常用Beta和Weibull兩種概率分布模型來模擬光伏、風機實際出力,兩種概率模型有著較強的普適性,對于實測數據樣本要求不高,但不能夠反映光伏、風機的地區出力特征,即實際模擬效果過于理想化,將其在工程上應用會造成較大的功率偏差,從而導致電力系統節點電壓偏差較大。而非參數核密度估計本質上是基于數據來生成的一個動態概率密度模型,不同地區間其概率密度可能擁有著較大的差異性,并且不受傳統經驗或者既定參數影響,故該模型擁有較強的適應性和較高的模擬準確性,可應用于多種運行環境。但該模型計算復雜且基于數據驅動,對于錯誤數據的敏感度更高,所以對于實測數據樣本容錯率及數據精度擁有更高的要求。綜合考慮上述兩種概率模型優缺點,本文提出一種融合傳統概率密度和非參數核密度估計的光伏、風機綜合概率模型。該方法不僅能夠按照實測數據模擬任意隨機分布的光伏、風機特性,同時兼顧傳統概率分布特征。本文綜合概率模型主要流程如圖2所示。

圖2 光伏、風機綜合概率模型建模方法Fig.2 Flowchart of comprehensive probability density modeling of PV and wind
本文綜合概率模型建模方法分為以下幾個步驟:
1)首先通過最小二乘擬合生成迭代關系,剔除錯誤數據,然后通過卡方檢驗判斷根據數據抽樣形成的概率密度是否符合Beta和Weibull分布規律[14]。通過抽樣光伏出力Ps曲線以及風機出力Pw曲線的實測樣本進行檢驗,若檢驗結果符合傳統模型,則通過步驟2)按照傳統概率分布即Beta分布及Weibull分布分別建立光伏、風機的概率模型;如檢驗結果不符合傳統概率模型,則根據步驟3)建立光伏、風機的非參數核密度估計模型。其中,光伏、風機數據采用卡方檢驗,根據檢驗結果判斷實測數據與標準模型擬合度,其擬合度檢驗公式如下所示:
(1)

2)根據Beta分布及Weibull分布可計算得出光伏、風機的概率密度函數fs(p)以及fw(v):
(2)
(3)
式中:fs(·)為光伏Beta概率分布模型;α、β均為Beta分布的形狀參數;Γ(·)為Gamma函數;p為光伏采樣功率;pmax為光伏最大功率;d、q分別為光伏采樣區間的首端和末端;fw(·)為風機Weibull概率分布模型;v為風機采樣功率;k為Weibull分布的形狀參數;c為Weibull分布的尺度參數。
3)根據非參數核密度估計理論,可近似估計fsn(p)以及fwn(v)為:
(4)
(5)
式中:fsn(·)為光伏非參數核密度概率模型;fwn(·)為風機非參數核密度概率模型;ns、nw分別為光伏、風機實測樣本編號;h為平滑系數[15];psi為光伏Beta分布概率密度;pwi為風機Weibull分布概率密度;K(·)為核函數。
4)電力系統負荷一般與用戶用電習慣及用電設備的接入與退出相關,對于短時間尺度,其擁有較大的偶然性,對于長時間尺度則隨時間變化符合正態分布特征,所以節點i負荷的有功功率概率模型如下:
(6)

多光伏、多風電場間存在的相關性受時間-空間多個物理因素影響,其可能與地理位置、天氣環境、氣溫條件等多因素有關,其中存在著極為復雜的深度耦合關系[17]。為簡化計算過程且保留場間相關性,認為距離不同的風機存在功率的滯后關系如圖3所示。

圖3 相鄰風機功率滯后示意Fig.3 Power lag diagram of adjacent wind power generators
以風機為例,如圖3所示,A地風機與B地風機為相鄰風機,且處于同一風場中,兩者功率曲線有較強的相似度,不過存在時間上的偏移,而風場是一個混沌系統,無法精確計算任意時刻風速及風向。
故本文通過馬爾科夫狀態轉移方程完成光伏、風機集群的聯合概率分布模型,僅考慮光伏、風機功率,設立一個參考點,通過n次采樣,計算其與周圍風機的功率轉移概率,可模擬出其相鄰風機此時的出力功率,將轉移概率以矩陣形式表示,即可表達為聯合概率分布模型,從而達到模擬風電集群的效果。馬爾科夫狀態轉移方程如公式(7)所示。
(7)
式中:P11為馬爾科夫狀態轉移矩陣的標準參考點;P′11為下一狀態的P11;ΔPMN表示轉移功率差;PMN為采樣的第M行第N列光伏或風機功率;M表示光伏或風機行數量;N表示光伏或風機列數量;nsw表示光伏或風機設備總數;Pmax為光伏或風機最大功率;P表示馬爾科夫狀態轉移矩陣。
根據概率轉移矩陣,僅需參考點的概率模型,即可計算出同一時刻其他機組功率參數,從而生成光伏、風機集群斷面數據。
通過聯合概率分布模型,利用蒙特卡洛模擬生成最優潮流配電網參數進行最優潮流計算[18],具體計算步驟如下:
1)利用Matpower潮流計算工具,輸入配電網網絡結構參數、光伏和風機分布類型及參數;
2)根據1.1節和1.2節的聯合概率分布模型隨機組合生成多組光伏、風機、負荷隨機樣本,將樣本分為兩份數據集,一份作為訓練深度學習模型輸入數據,一份作為驗證深度學習訓練效果的輸入數據;
3)采用牛頓-拉夫遜法依次進行多次確定性的最優潮流計算;
4)統計最優潮流計算所得配電網各節點電壓,整理成樣本數據,將樣本數據分為兩份,一份作為訓練深度學習模型輸出數據,一份作為驗證深度學習訓練效果的輸出數據。
功率-電壓映射的本質為通過電網運行參數映射得出相對應的電網節點電壓數據。雖然樣本數據維數較低,但數據量仍較為龐大。其中的非線性關系無法通過常規數學模型來表達,因此利用深度學習網絡可快速挖掘數據間的映射關系。深度神經網絡相比傳統神經網絡,其通常分為輸入、隱含和輸出層,其核心算法思路是通過梯度計算逐層調節神經元權重,進而擬合出復雜模型的非線性映射關系,同時通過反向傳播不斷更新神經元權重來減小輸出誤差[19-21]。本文輸入為新能源功率及負荷節點功率組成的電網運行參數數據集,輸出為節點電壓數據集,基于深度學習網絡完成的功率-電壓映射結構如圖4所示。

圖4 基于深度學習的功率-電壓映射方法Fig.4 Power-voltage mapping method based on deep learning

(8)

激活函數是深度學習中引入非線性因素的主要構成部分。其本身是線性結構,通過每個神經元的不斷組合促使整個神經網絡逼近非線性模型,從而達到深度神經網絡對于功率-電壓映射的數據挖掘作用[22-23]。
本文通過sigmoid激活函數來引入非線性關系:
(9)
式中:x為神經網絡輸入;b0為初始偏置項;b1為修正后偏置項。
將神經網絡電壓輸出值與期望電壓存在均方根誤差E定義為:
(10)

當深度神經網絡的輸出電壓與驗證數據集中預期目標電壓之間誤差小于設定值時,網絡結構訓練完畢。
本文采用中國南方某區域配電網進行算例仿真,網絡接線如圖5所示。
該區域有10 kV、35 kV以及110 kV三個電壓等級,同時擁有風機、光伏接入點以及電網分區后的中樞節點,選取本系統中3、7、16、20節點作為風機接入節點,選取其中1、6、9、13、17、19節點作為光伏接入節點;本文采用的光伏、風機位于中國南方某地區配電網,氣候較為規律,四季分明。不同季節、天氣、時刻發電量存在明顯差距但是有周期性規律。故本文選取3月、6月、9月、12月作為特征樣本,并從中篩選出多組符合Beta分布的光伏出力數據以及符合Weibull分布的風機出力數據,同時根據卡方檢驗篩選出多組不符合常規概率分布的出力數據。分別定義光伏接入節點為Ps1、Ps2、Ps3、Ps4,各光伏接入節點參數如表1所示。分別定義風機接入節點為Pw1、Pw2、Pw3、Pw4、Pw5、Pw6,各風機接入節點參數如表2所示。
根據光伏、風機的形狀參數以及尺度參數,繪制出傳統概率分布下光伏、風機的出力概率密度模型,如圖6所示。

圖5 配電網拓撲結構Fig.5 Topology of distribution network

表1 光伏接入點參數Table 1 Parameters of photovoltaic access nodes

表2 風機接入點參數Table 2 Parameters of wind power access nodes

圖6 概率密度模型Fig.6 Probability density model
圖6(a)和圖6(b)分別表示不同尺度參數以及形狀參數下風機和光伏的標準概率密度模型,也是本文實驗數據經卡方檢驗后,較為符合的幾種概率模型。
經過χ2檢驗可知,接入節點7、20的Ps3、Ps4不符合Beta分布,接入節點13、19的Pw5、Pw6不符合Weibull分布,故采用非參數核密度估計模型;其他配電網負荷節點服從正態分布規律,取均值為節點負荷的穩態值,波動范圍為±5%。
基于配電網系統,采用本文概率密度模型進行蒙特卡洛抽樣,利用Matpower工具進行8 000次最優潮流計算。
圖7為本文概率密度模型以及常規概率密度模型抽樣進行最優潮流后的結果準確度。其中,本文選取了2、18、19號節點作為試驗對象,計算其標準概率密度模型下的節點電壓標準差以及本文綜合概率密度模型下的節點電壓標準差。

圖7 節點電壓標準差Fig.7 Standard deviation of node voltages
如圖7所示,通過對比多個節點的電壓標準差,基于綜合概率密度模型進行的最優潮流計算,節點電壓標準差控制在0.004,相較于標準概率模型的0.005,電壓標準差更小。說明本文提出的綜合概率模型具有更高的精度以及更小的誤差,可用于深度學習訓練。
整合3.2節根據概率模型生成的8 000組數據及最優潮流計算結果生成深度學習模型所需數據集,其中選取5 000組數據作為驗證數據集,其余3 000組數據用于訓練模型。利用PYTORCH框架搭建全連接神經網絡,層數設定為5,每層神經元數量分別為39、72、144、72、39。設置訓練循環次數為2 000次,每次反向傳播對神經元權重進行微調整。訓練過程如圖8所示。

圖8 神經網絡訓練結果Fig.8 Neural network training
根據圖8可知,經過反復循環訓練,神經網絡的損失逐漸下降,而輸出結果的準確率逐漸上升,在第800次訓練時準確率無大變化,最后穩定在了98.2%。
計算速度方面,訓練完畢的神經網絡節點電壓計算時間僅為傳統潮流計算的52%,且會隨著電網復雜程度的加強進一步體現計算速度優勢。
本文融合風機、光伏傳統概率密度與非參數核密度估計優勢,提出一種綜合概率模型,并通過馬爾科夫狀態轉移矩陣模擬出光伏、風電集群的聯合概率分布模型,通過蒙特卡洛采樣結合最優潮流生成數據集,利用深度學習模型訓練上述模型,從而實現了功率-電壓映射,相關結論如下:
1)綜合概率模型融合了傳統模型特征,且具備真實數據概率特征,具有廣泛的適用性。
2)通過馬爾科夫狀態轉移矩陣生成的聯合概率分布模型,將光伏、風機間的時空相關性轉化為功率相關性,無須考慮數值預報的天氣數據,通過降低數據維度,降低了計算難度。
3)所提出的深度學習訓練模型,相校于傳統潮流計算,利用數據驅動可以更加快速地計算節點穩態電壓,配電網算例下,計算時間僅為傳統潮流計算的52%,節點電壓計算準確率為98.2%,其適用于多場景復雜狀態下的電網電壓快速計算。
4)通過數據驅動的功率-電壓映射模型雖能準確、快速計算電壓,但是對訓練數據特征有較強的依賴性,如涉及多地、多區域間的新能源深度耦合模型,其間弱相關特征容易被神經網絡所忽略,如何強化模型以及數據間特征仍待研究。