李雅晗,夏世威,馬琳琳,趙康,李新
(1. 華北電力大學電氣與電子工程學院,北京市 102206;2. 國網山東省電力公司電力調度控制中心,濟南市 250000;3.國網山東省電力公司電力科學研究院,濟南市 250000)
新能源和直流并網使傳統電網的拓撲結構更加復雜,其動態特性亦對交直流混聯系統的暫態功角穩定產生較大影響[1]。如何高效準確評估含新能源的交直流混聯系統的暫態功角穩定性(transient angle stability assessment, TASA)并進行關鍵影響因素的解釋性分析具有重要意義。
目前,國內外采用人工智能的方法研究暫態功角穩定評估問題成為熱點,如支持向量機(support vector machine, SVM)、決策樹(decision tree, DT)及其改進算法等淺層學習方法[2-6],也有通過深度學習[7-11]如卷積神經網絡(convolutional neural networks,CNN)、深度神經網絡(deep neural networks,DNN)等方法進行復雜的暫態功角穩定評估分類。文獻[12]提出了基于SVM集成模型的交直流混聯系統暫態穩定評估方法,通過機理分析表明新能源和直流特征量能夠表征交直流混聯系統的暫態穩定性。文獻[13]根據多類間線性判別分析法,基于系統的軌跡簇特征對含新能源的交直流混聯系統進行暫態穩定分析。上述方法有效評估了交直流混聯系統的暫態穩定性,并說明了新能源和直流特征量與系統暫態穩定性間的相關性。文獻[14]基于極致梯度提升樹(extreme gradient Boosting, XGBoost)算法對電力系統進行暫態穩定評估,說明了模型的可靠性和有效性。但以上評估模型均為“黑箱”結構[15],無法闡明新能源、直流等特征量是如何影響系統的暫態穩定性,因此亟需研究可解釋性方法以實現特征量和暫態穩定結果間的關聯關系闡釋。目前有少量文獻進行了可解釋性研究,文獻[16]構建DT模型對暫態穩定評估分類結果進行解釋,但其采用的單一可解釋性模型遷移性較差,且無法對大量數據進行快速評估。文獻[17]利用局部可解釋性方法對暫態功角穩定評估結果進行單個樣本的解釋,但其無法對特征量進行全局解釋性分析,難以呈現特征量值的大小與暫態功角穩定的整體相關性。
為了有效評估交直流混聯系統中暫態功角穩定特性并準確分析新能源、直流特征量對系統穩定性的影響,本文首先基于XGBoost算法構建暫態功角穩定評估模型,選擇電力系統中新能源和直流特征量作為暫態功角穩定評估模型的輸入,并根據sigmoid函數得到樣本預測值與穩定性間的關系,之后基于SHAP(Shapley additive explanations)提出特征量的可解釋性分析方法,最后對所提的暫態穩定評估模型進行仿真驗證,并從兩方面對特征量進行解釋:1)從全局出發對特征量進行重要性排序,挖掘對系統暫態功角穩定影響最大的新能源和直流特征量,并分析特征量的Shapley值與樣本預測值間的關系,進一步說明特征量的Shapley值的正負對暫態穩定結果呈現抑制和促進2種特性,從全部樣本的角度得到特征量值大小與暫態功角穩定之間的關聯關系。2)從局部對單個穩定與失穩樣本進行解釋,說明特征量對樣本預測值的影響關系,從而提高穩定評估結果的可信度。
為了得到暫態功角穩定結果與特征量間的映射關系,可以將暫態功角穩定評估問題轉化為二分類問題[18],因此本文引入一種分類器XGBoost模型用于暫態功角穩定評估,并采用并行計算模式進行學習,并結合多個弱學習器提高模型的訓練效率和準確率。該模型具體如下[19]:
設樣本集合D表示為:
D={(xi,yi)|i=1,…,N,xi∈RM,yi∈R}
(1)


(2)
式中:fk(xi)為第k棵樹對第i個樣本的計算分數。XGBoost包含參數優化及目標函數優化,其中參數優化通常采用網格搜索和交叉驗證方法得到模型最優參數,目標函數優化可以提高分類的準確率,并以最小化損失函數和增加模型復雜度為目標,如式(3)所示:
(3)

(4)
(5)
式中:T為樹的葉子節點數;ωj為葉子節點j的權重;γ為懲罰系數,用于控制模型葉子節點個數;λ為正則項系數,用于調節節點的權重分布,一般情況下取值為1。由于XGBoost以樹模型迭代相加的方式進行訓練,每增加一個決策樹函數fk可使目標函數進一步減小,ft表示fk迭代第t次時的最優樹結構,使用二階泰勒公式展開并去掉常數項后,可將目標函數改寫為:

(6)


(7)

(8)
(9)
基于p∈(0,1),可以將樣本i進一步標簽為0或1,設定標簽0代表穩定樣本,1代表失穩樣本,得到標簽與概率值p1、p2之間的關系:

(10)

(11)



(12)


SHAP對特征量的局部可解釋性表現為:對樣本i而言,可依據式(11)將各特征量Shapley值之和加上樣本預測的基準值等于模型的輸出結果,從而可通過這一線性關系反映各特征量對某一穩定或失穩樣本結果的漸進影響過程。特征量的可解釋性示意如圖1所示。

圖1 特征量的可解釋性示意Fig.1 Interpretability of features
暫態功角穩定評估首先需要一組特征量,再通過XGBoost分類器建立特征量與系統暫態功角穩定性間的映射關系[22]。特征量需要能表征系統的暫態功角穩定性、具有明確的物理意義;同時大量的特征量會增加模型訓練時間且影響模型訓練效率,因此特征量不宜過多。本文研究含新能源的交直流混聯系統的暫態功角穩定性,因此主要選擇新能源和直流特征量;同時由于發電機相對功角Δδ直接影響了系統的功角穩定[23],將其作為特征量以對比分析新能源和直流特征量對功角穩定性的影響;且光伏電站通常為直流發電,并通過逆變器將其轉換為交流電供電網絡使用,因此光伏電站的輸出功率主要是有功功率,而無功功率相對較小,因而可以忽略。綜上參考文獻[6,12]得到如表1所示的特征量集合,包括各發電機相對功角Δδ;HVDC直流輸電線路兩端節點電壓UHVDC、HVDC直流輸電線路電流IHVDC、HVDC直流輸電線路兩端功率PHVDC、HVDC直流輸電線路觸發延遲角α、HVDC直流輸電線路熄弧角γ;各風電機組并網節點電壓UWP、輸出有功功率PWP、輸出無功功率QWP;各光伏電站并網節點電壓UPV、輸出有功功率PPV。

表1 暫態功角穩定評估的特征量Table 1 Features of TASA
通過暫態穩定指標(transient stability index, TSI)可以表征系統的暫態功角穩定性[24-25],TSI計算公式為:
(13)
式中:Δδmax為擾動后任意兩臺發電機的最大相對功角差。暫態功角穩定評估作為一個二分類問題,可基于式(13)的TSI進行標簽以判斷系統穩定性,即當TSI>0時,系統暫態功角穩定,樣本標簽為0;當TSI<0時,系統暫態失穩,樣本標簽為1。進一步定義如表2所示的指標對模型分類效果進行評價[26],其中TP為預測正確的穩定樣本數量;TN為預測正確的失穩樣本數量;FN為預測錯誤的穩定樣本數量;FP為預測錯誤的失穩樣本數量。
準確率ηAccuracy指預測正確的樣本數占總樣本數的比例,越接近1表明模型整體效果好。
(14)
召回率ηRecall是少數類樣本中預測正確的樣本所占比例。由于暫態功角穩定樣本集中失穩樣本數量相對穩定樣本較少,且將失穩樣本誤判為穩定樣本的代價更大,因此可通過召回率指標式(15)反映失穩樣本誤判情況,召回率越高失穩誤判越少。
(15)
為解決交直流混聯系統暫態功角穩定評估及特征量的可解釋性問題,將模型評估分為3個部分,分別是離線訓練、在線評估及結果的可解釋性分析,其流程如圖2所示。

圖2 暫態功角穩定評估流程Fig.2 Flow chart of TASA
1)離線訓練階段:首先通過時域仿真得到如表1所述的不同運行方式下暫態功角特征量集合。將特征量集合及對應的標簽分別作為評估模型的輸入和輸出并隨機劃分為訓練集和測試集,通過訓練集對XGBoost模型進行訓練,并根據網格搜索和交叉驗證計算模型最優參數,最后通過測試集和模型分類性能指標對模型進行評價。
2)在線評估階段:通過實時量測系統獲得數據集并得到特征量集合,將特征量數據輸入已訓練好的XGBoost模型中,分類預測系統的暫態功角穩定或失穩狀態。
3)解釋性分析階段:基于SHAP對XGBoost模型特征量和分類預測結果進行全局和局部解釋,分析交直流混聯系統特征量對暫態功角穩定的影響關系。
本節基于某實際交直流混聯系統對所提暫態功角穩定評估模型的有效性進行驗證。算例拓撲如圖3所示,該系統共包含53個節點,風火打捆經3回交流線路和1回±500 kV HVDC直流輸電線路送出系統,裝機占比為:新能源(480萬kW)/常規(600萬kW)=1/1.25。其中光伏電站4臺,風電機組8臺,常規火電機組10臺(以Gen4A-1作為參考機組)。

圖3 算例拓撲Fig.3 Example topology
采用電力系統仿真軟件PSD-BPA對系統進行機電暫態仿真,構建新能源(風電匯集站A、B,光伏匯集站C)同時率(新能源占所有出力的比例)分別為0、20%、50%、60%四種場景,對26條線路進行三相永久N-1故障,設置故障位置距離線路首段25%、50%、75%,故障發生時間為第50周波(1 s),故障清除時間為故障發生后的第7周波(0.14 s)到第15周波(0.30 s)共9種。根據TSI對仿真產生的2 764個樣本進行暫態功角穩定判斷,其中穩定樣本1 834個,失穩樣本930個,并隨機選取訓練集和測試集且設置比例為7∶3。
針對暫態功角穩定評估中的分類器模型,采用python 3.9.12在Scikit-learn平臺進行搭建。為驗證XGBoost模型的有效性將XGBoost與其他主流分類模型進行對比[27-30],包括AdaBoost、隨機森林(random forest, RF)、K近鄰法(K-nearest neighbor, KNN)、SVM。其中XGBoost、AdaBoost、RF均為樹模型,采用100棵樹,其余算法采用默認參數。通過準確率、召回率和模型訓練時間t來評價分類器性能,對比結果如表3所示。

表3 分類算法性能對比Table 3 Performance comparison of classification method
結果顯示,本文的XGBoost相較于其他算法,準確率和召回率都較高,且訓練時間也較短,能夠準確地對輸入樣本進行預測分類。XGBoost、AdaBoost和RF都屬于樹結構模型,AdaBoost的準確率、召回率低于XGBoost,且訓練時間較長;RF與KNN雖然都能快速對模型進行訓練,但是召回率和準確率均低于XGBoost;SVM結構簡單,處理大量數據誤差較大,整體性能較差。
4.2.1 特征量的全局解釋
將所有樣本的特征量進行Shapley值的計算,該Shapley值可以反映特征量對暫態功角穩定的重要性并對特征量進行全局解釋。由表1得到61維特征量,通過式(12) 得到各特征量對應的Shapley值,并根據絕對值大小進行重要性排序,選擇前20維特征量如圖4所示,主要包括HVDC直流輸電線路觸發延遲角α、熄弧角γ、各發電機相對功角Δδ及各風電機組、光伏電站并網節點電壓U、輸出功率P等。圖中橫坐標為特征量的Shapley值,同時每個樣本點的顏色反映特征量值本身的大小。

圖4 特征的重要性排序Fig.4 Importance ranking of features
以HVDC直流輸電線路送端正極觸發延遲角“α送端正極”和光伏電站C-1的并網節點電壓“UGen光C-1”為例,其對應的特征量Shapley值如圖5所示。以特征量值為橫軸,特征量的Shapley值為縱軸以反映特征量與穩定性的關聯關系。由式(9)-(11)可知,當特征量的Shapley值大于0時,此時特征量對預測值有正向影響作用,即對系統失穩有促進作用;當Shapley值小于0時,特征量對失穩結果有抑制作用。

圖5 特征量Shapley值Fig.5 Shapley value of features
如圖5(a)所示當直流送端正極觸發延遲角α=30°時,Shapley值恒大于0,此時α促進系統失穩,當α≥48.5°時,Shapley值恒小于0,抑制系統失穩;如圖5(b)所示,當光伏電站并網節點電壓U小于0.83 pu時,Shapley值大于0,促進系統失穩,當U大于0.83 pu時,Shapley值小于0,抑制系統失穩。通過同樣方式,可對其他系統特征量展開分析,解釋各特征量對系統暫態穩定性的影響。
4.2.2 特征量的局部解釋


圖6 單個穩定樣本預測結果Fig.6 Prediction result of single stable sample

圖7 單個失穩樣本預測結果Fig.7 Prediction result of single unstable sample
為研究交直流混聯系統暫態功角穩定性并解釋影響因素,本文提出了一種基于XGBoost算法的交直流混聯系統暫態功角穩定評估方法,通過sigmoid函數得到樣本預測值與暫態功角穩定性間的關系,并提出基于SHAP的特征量可解釋分析方法,根據預測值與各特征量的Shapley值的線性關系解釋了特征量的Shapley值與系統功角穩定性間的影響關系,最后通過含有新能源和直流接入的某500 kV實際算例系統驗證了所提功角穩定評估模型的有效性。仿真結果表明:
1)基于XGBoost算法的暫態功角穩定評估方法,并選擇新能源和直流特征量作為穩定評估模型的輸入能夠對交直流混聯系統的穩定或失穩進行有效預測。
2)提出的基于SHAP的特征量可解釋分析方法能對全部樣本和單個樣本進行全局和局部解釋性分析,從而反映交直流混聯系統中新能源和直流特征量對暫態功角穩定的影響關系。
3)暫態功角穩定評估方法及特征量可解釋性分析方法結合,為交直流混聯系統功角穩定性評估及影響因素分析提供了準確、可解釋的分析工具,可為新型電力系統的安全運行提供決策依據。