999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CatBoost的新型電力系統兩階段輕量化暫穩智能評估方法

2024-03-04 05:55:30蘭宇田張文棟劉世超仇玉強
山東電力技術 2024年2期
關鍵詞:特征模型

蘭宇田,姚 偉,張文棟,劉世超,仇玉強

(1.強電磁技術全國重點實驗室(華中科技大學電氣與電子工程學院),湖北 武漢 430074;2.國網山東省電力公司,山東 濟南 250000)

0 引言

隨著新型電力系統建設的推進,以風能為代表的新能源大規模并網,新能源的隨機性、間歇性使得電力系統的運行條件越發難以預測。相比于傳統電力系統,含高比例新能源的新型電力系統形態發生重大變化,穩定機理和特征更加復雜[1]。因此,針對新型電力系統開展快速且準確的電力系統暫態穩定評估(transient stability assessment,TSA)是當前的研究熱點。

傳統時域仿真法[2]和能量函數法[3]已經無法滿足新型電力系統TSA 對時效性、準確性的要求。前者雖結果可靠但計算耗時長,后者雖求解迅速但結果偏于保守。近年來,隨著廣域測量系統(wide area measurement system,WAMS)和相量測量單元(phasor measurement unit,PMU)的發展,電力系統實時運行數據變得易于獲取[4],以數據為驅動的機器學習方法成為當前最具發展前景的TSA 方法[5]。目前大量研究人員將機器學習與TSA 結合,如門控循環神經網絡(gated recurrent neural network,GRU)[6-8]、長短期記憶網絡(long short term memory network,LSTM)[9-11]、卷積神經網絡(convolution neural network,CNN)[12-15]、生成對抗網絡(generative adversarial network,GAN)[16-17],均取得了優異的指標效果。但這些研究大多都基于同步機主導的常規電力系統進行,新型電力系統由于新能源的隨機性和間斷性,表現出更為復雜的穩定機理,所以針對傳統電力系統的研究在新型電力系統中具有一定的局限性。

此外,這些主流的機器學習方法都具有“黑箱”屬性,即只了解模型的輸入和輸出,不清楚模型的內在邏輯或預測過程。可解釋性弱、不透明等缺點,導致“黑箱”模型的不信任感。目前已經有部分文獻嘗試解決模型的“黑箱”屬性,文獻[18]基于模型無關局部解釋(local interpretable model-agnostic explanations,LIME)算法對TSA 模型進行了事后解釋,但LIME 算法基于隨機擾動,存在解釋不穩定的現象;文獻[19]基于注意力機制,繪制了模型對特征的注意力熱力圖,但從中并不易獲取模型具體關鍵決策量等知識;文獻[20]基于沙普利值加性解釋(shapley additive explanations,SHAP)算法對電力系統暫態電壓穩定評估模型進行了事后解釋,雖然其取得了相比于LIME 更佳的解釋結果,但并未就獲取的模型內在知識進行進一步的研究。所以如何解決數據驅動的“黑箱”屬性和對模型內在知識進行進一步運用是當前研究的難點。

文中聚焦新型電力系統暫穩評估,首先提出了一種基于CatBoost(categorical boosting)算法的兩階段TSA 評估模型,解決了模型梯度偏移問題,實現了高質量新型電力系統暫態穩定判別。進一步地,使用Tree-SHAP 算法對所提出的包含粗判和精判的兩階段CatBoost 模型進行了事后解釋,揭示了模型的預測過程,解決了模型的“黑箱”屬性,并通過定量分析特征貢獻度絕對均值,選取新型電力系統暫態評估的關鍵影響因素作為輕量化模型特征。最后,針對文獻[20]未就模型內部知識進行進一步研究的問題,基于獲取的暫態關鍵影響因素訓練了低維CatBoost 兩階段模型,實現了模型的輕量化。

1 輕量化TSA智能評估框架

所提出的基于CatBoost 的新型電力系統兩階段輕量化暫穩智能評估方法主要分為兩個部分:離線訓練部分和在線評估部分,具體框架如圖1 所示。其中離線訓練部分包含CatBoost 暫穩評估模塊、Tree-SHAP 解釋與關鍵影響因素提取模塊、低維CatBoost 暫穩評估輕量化模塊共三個模塊。

2 離線訓練

離線訓練部分需要學習大量新型電力系統運行數據,從而挖掘暫態穩定樣本和失穩樣本的特征,離線訓練的流程如圖2 所示,具體流程如下:

圖2 基于CatBoost的新型電力系統兩階段輕量化暫穩評估模型離線訓練流程Fig.2 Process of the two-stage lightweight transient stability intelligent assessment for new type power systems based on CatBoost

1)構建新型電力系統,通過設置不同運行工況進行時域仿真,獲取仿真數據;

2)基于仿真數據訓練1 階段粗判CatBoost,選取低置信率區間樣本重新訓練2 階段精判CatBoost;

3)基于Tree-SHAP 對兩階段評估模塊從局部和全局兩個角度進行解釋,獲取模型內部知識,即暫態關鍵影響因素;

4)基于Tree-SHAP 獲取的知識,重新訓練低維CatBoost 輕量化兩階段模型。

2.1 CatBoost暫穩評估模塊

對于數據驅動的電力系統暫態穩定評估,需要通過有監督學習構建樣本輸入特征和輸出標簽之間的映射關系。文中基于CatBoost 算法進行暫穩評估。

CatBoost 是由俄羅斯Yandex 公司提出的一種由多棵對稱決策樹(oblivious trees,OT)串聯組合而成的Boosting 集成學習算法[21],隸屬于梯度提升樹(gradient boosting decision tree,GBDT)算法框架。相比于其他GBDT 算法,能有效處理離散類別型特征的編碼問題、梯度偏差問題和預測偏移問題,提升了模型的準確性和泛化能力。

在CatBoost 訓練過程中,每次迭代均會生成一個弱學習器,最終得到強學習器,以此讓整體模型損失函數達到最小值。假設在第t輪訓練中,已經有訓練好的前t-1 輪強學習器Ft-1(x) 損失函數為l(y,Ft-1(x))。本輪的目標就是加入新的弱學習器ht(x),使得本輪損失函數最小。第t輪迭代的目標函數即弱學習的參數如式(1)所示。

式中:y為樣本標簽;E為期望函數;x為輸入樣本。

由于是沿著損失函數下降最快方向進行迭代,所以每一輪損失的近似值由損失函數的負梯度-gt(x,y)表示,如式(2)所示。

將式(2)帶入式(1)得

最終得到第t輪強學習器Ft(x)。

式中:lr為每一輪迭代的學習率。

但在每一輪迭代過程中,使用的梯度都是由相同的訓練樣本xtrain進行計算的,但實際上與所有樣本x之間存在一定的偏差,即梯度偏差。CatBoost 算法為解決該問題造成的模型精度下降,對GBDT 算法進行了改進:在第t輪迭代過程中,令gk(xk,yk)為在本輪第k個樣本(xk,yk)上的損失函數梯度值。為使gk(xk,yk)無偏于模型Ft-1,首先使用前k-1 個樣本重新訓練代理模型Mk,再基于代理模型Mk來估計xk上的梯度。這樣每個樣本的梯度都是通過不包含該樣本的其他樣本進行計算的,進而解決了梯度偏差問題。具體數學證明可參考文獻[21]。

2.2 解釋與關鍵影響因素提取模塊

CatBoost 兩階段模塊在未輕量化之前需要采集電力系統的幾乎所有電氣特征,數據量大,傳輸時間長,在實際電力系統中幾乎無法應用。所以需要對模型進行輕量化,減少模型的輸入特征。

事后解釋算法Tree-SHAP[22]基于合作博弈論,具有局部精度、對稱性、無效性和可加性四種特征[23],是目前理論最優的歸因算法之一。使用Tree-SHAP 算法能透明化模型的決策過程,挖掘模型的內在關鍵影響因素,進而指導模型在維持評估精度的前提下減少輸入特征的數目。

合作博弈論認為單純按照每個玩家固定收益對總收益進行分配是不合理的,故提出了以邊界貢獻(marginal contribution,MC)作為分配指標的收益分配思路。在電力系統中,定義游戲G為暫態穩定評估模型,玩家P為模型的各個輸入特征。可通過式(5)來計算特征對暫穩評估結果的貢獻度,即Shapley 值。

由于模型的輸入特征過多,特征子集有151!個,極難計算。所以針對樹模型的特有結構特性,研究人員提出了兩種簡化思路,實現了Shapley 值的快速計算。

1)簡化方向1。

通過樹結構來評估特征貢獻。根據Shapley 值的可加性特征,繪制出一種可能的特征子集編碼情況中模型預測的預期變化,如圖3 所示。

圖3 模型預測期望變化Fig.3 Expectation changes based on model prediction

所以,為求解特征i的Shapley 值?i,就只需要求解f{x1,x2,…,xi-1}({x1,x2,…,xi-1}) 和f{x1,x2,…,xi}({x1,x2,…,xi})的差值,而樹結構中對具有缺失值的數據條件期望的求解是簡單的,因為其會忽略缺失值所在的葉節點。通過這樣簡化來計算特征子集的特征p的Shapley 值,只需要遍歷每一棵樹的每一個節點。此時,Tree-SHAP 時間復雜度為O(TL2M),其中T為樹的總數,L為總節點數目,M為特征數目。

2)簡化方向2。

按照樹結構進行遍歷。通過簡化方向1,可以將不同特征組合輸入,簡化求解各個特征的貢獻度,但特征組合依然是2M個。簡化方向2 的大致思路為不遍歷所有特征組合,而是只需要遍歷樹的所有路徑,在遍歷的過程中記錄路徑信息,在葉節點處求解這條路徑的特征貢獻。因為從樹的路徑角度來看,在中間節點除了其判斷條件以外,其他特征的引入對樹的決策是不會有任何改變的,這些特征組合均不用考慮。

3 在線評估

獲取電力系統實時數據,對離線訓練獲取的暫態關鍵影響因素進行采集,形成樣本j的模塊輸入矩陣Xj=[x1,j,x2,j,…,xn,j]。首先,將輸入矩陣輸入1 階段粗判CatBoost 進行暫態穩定狀態預測,并獲取預測為穩定的概率值Pj;其次,對Pj進行分析,如果Pj屬于預先設定的高置信區間則直接輸出預測結果,如果Pj落入低置信率區間,則說明該樣本為1 階段粗判CatBoost 的邊界樣本,需要2 階段精判CatBoost模型給出預測結果。評估流程如圖4 所示。

研究人員稱,父母對于子女日后的語言表達能力也起著十分重要的作用。所以嬰兒期堅持給寶寶“磨耳朵”,日后會有意想不到的收獲哦!

4 算例研究

所提出的基于CatBoost 的兩階段電力系統暫態穩定評估和其可解釋性研究是基于仿真數據進行分析的,研究系統為接入高比例風電的IEEE 39 節點系統。算例研究的硬件平臺為CPU Intel? Core(TM)i9-10900K @3.70 GHz,RAM 64 GB,GPU NVIDIA Geforce RTX 2080 Super,電力系統時域仿真基于PSASP 軟件實現,機器學習模型基于Scikitlearn1.3.0 搭建。

4.1 樣本生成

IEEE 39 節點系統也被稱為新英格蘭10 機電力系統,對于含風電的IEEE 39 節點電力系統,有5 臺發電機、4 個風電場、39 根母線、46 條支路、12 臺變壓器和19 個負載,其拓撲結構如圖5 所示,圖中G表示發電機,其中G1 表示多個發電機,WF 表示風電場。

圖5 含風電的IEEE 39節點電力系統Fig.5 IEEE 39 bus power system with wind power

為覆蓋盡可能多的電力系統運行工況和故障發生情況,可以通過以下操作實現:設置潮流水平在85%~115% 之間波動,設置為85%、90%、95%、100%、105%、110%、115%;故障設置為三相金屬性短路并切線(N-1),故障線路遍歷IEEE 39 系統中所有的非變壓器支路,故障位置為每一條線路全長的2%、25%、50%、75%、98%,故障時間設置為0.1 s、0.2 s、0.3 s、0.4 s、0.5 s。具體生成方案如表1 所示,這樣可以較為全面地覆蓋系統運行工況和故障發生的可能性。仿真時間設置為10 s,剔除部分數據異常樣本,最終生成5 873 個樣本。

表1 IEEE 39節點系統樣本生成方案Table 1 IEEE 39 system sample generation solution

4.2 特征選擇與標簽標注

為提高模型的準確率,采集所有能觀測或能計算的電氣特征,采集時間定為故障切除后的下一時刻,具體特征如表2 所示。

表2 樣本具體電氣特征量Table 2 Sample specific electrical characteristic quantity

表2 中共計采集151 個特征量構成樣本的模型輸入數據,樣本標簽由暫態穩定指數(transient stability index,TSI)確定[24]:

式中:|Δδ|max為在仿真時間內,任意兩臺發電機相對功角差值絕對值的最大值;STI為暫態穩定指數,STI>0 說明該樣本為穩定的;STI<0 說明該樣本為失穩的。最后得到穩定樣本共計3 514 個,失穩樣本共計2 359 個。

4.3 CatBoost兩階段評估模塊

將全體樣本分為70%、15%、15%三部分,分別作為訓練集、驗證集和測試集。通過訓練集訓練CatBoost 模型,再根據驗證集調整參數,最后在測試集上測試模型效果。

根據2.1 節中簡述的CatBoost 原理訓練一階段粗判TSA 模型,其結果的混淆矩陣如圖6 所示。

圖6 一階段粗判TSA模型混淆矩陣Fig.6 One-stage prediction segment TSA model confusion matrix

一階段粗判TSA 模型在所有樣本中僅取得了98.33%的準確率。為進一步提升模型的準確率,首先繪制模型對所有樣本判斷為穩定的預測概率散點圖,如圖7 所示。

圖7 一階段粗判TSA模型預測概率散點圖Fig.7 Scatter plot of predicted probabilities for first-stage preliminary TSA

從圖7 中,不難發現:預測概率大于0.6 或小于0.2 時,模型識別準確率極高;但在大于0.2 且小于0.6 的部分,準確率出現了下降。這是因為模型在訓練過程中,會更加偏向于大眾樣本;對于決策邊界附近的樣本,由于正則化的存在,會使得模型精度下降。對于大模型,更希望其決策邊界更加光滑,所以降低正則化參數的操作是不可取的。

為識別這些特殊邊界樣本的特征,可以構建二階段精判TSA 模型。從低置信區中篩選出判別錯誤的樣本,重新構成新的訓練集、驗證集、測試集,注意篩選前后樣本類別須保持一致。基于這些樣本重新訓練能識別特殊樣本的精細化評估模型,其訓練結果和常見模型評價指標[19]結果如表3 所示。

表3 基于CatBoost的新型電力系統兩階段暫穩評估模型指標Table 3 Indicators for the two-stage transient stability assessment model in new type power systems based on Catboost

基于表3,可以發現兩階段TSA 評估模型指標,除測試集的召回率外,全面優于一階段模型。因此可以認為,引入二階段精細化評估邊界樣本能有效提高CatBoost 模型的判斷準確度。類似地,再對比其他機器學習模型,包括XGBoost[25]、隨機森林[26]、支持向量機[27]和決策樹[28],模型常見評價指標[19]對比如圖8 所示。

4.4 模型事后解釋

利用Tree-SHAP 算法對模型預測結果進行事后解釋,首先分析單個樣本。隨機選取第8 號、第13號樣本。前者預測為穩定的概率為10.11%,直接由一階段粗判模型給出失穩判斷結果,其透明化的預測過程如圖9 所示;后者預測一階段預測為穩定的概率為55.13%,為邊界樣本,落入二階段精細判斷模型,二階段模型的預測過程如圖10 所示。通過Tree-SHAP 算法,可以直觀感受模型的決策過程,提高模型的可解釋性,挖掘模型的內在知識。

圖9 第8號樣本的決策過程Fig.9 Decision-making process for sample No.8

圖10 第13號樣本的決策過程Fig.10 Decision-making process for sample No.13

對于每一個樣本都可以分析出其決策過程,挖掘哪些特征對決策做出了重要貢獻。再從全局角度分析,計算如式(7)所示的m個樣本的所有特征絕對貢獻均值mean(||?),就能得出模型主要側重于哪些重要特征,進行電力系統暫態穩定域的關鍵影響因素的挖掘,具體前20 個關鍵影響因素如圖11 所示。

圖11 暫態關鍵影響因素Fig.11 Key transient influencing factors

4.5 低維CatBoost兩階段驗證模塊

模型的效果與選擇的特征之間存在緊密聯系,可選擇篩選出來的前30 個關鍵影響因素重新訓練CatBoost 兩階段評估模型,依據其訓練結果來間接證明識別效果的有效性,其訓練結果如表3 所示。

從表3 可以發現進行特征選擇后的低維CatBoost 兩階段評估模型只用了20%的特征量就達到甚至超過了一階段CatBoost 評估模型的效果。對比原始兩階段評估模型,模型在測試集上的準確率僅下降了1.11%,也遠超于其他算法,所以暫態關鍵影響因素的識別效果比較優秀。為繼續探究低維CatBoost 的模型效果低于高維模型的原因,繪制低維一階段模型預測概率散點圖如圖12 所示。

圖12 低維一階粗判TSA預測概率散點圖Fig.12 Scatter plot of predicted probabilities for low-dimensional first-stage preliminary TSA

根據圖12 可以發現,由于低維CatBoost 特征維度有限,低置信區錯判樣本明顯增多,而且邊界樣本數目上升,導致二階段識別的邊界樣本特征也有限,最終導致了效果低于高維模型。

5 結論

暫態穩定分析是新型電力系統領域的研究重點,傳統暫穩分析方法在時效性和準確性上略有欠缺。機器學習技術目前在各個領域取得了巨大的成果,將其與新型電力系統暫態穩定評估結合擁有廣闊的前景。文中針對TSA,構建了具有高質量指標的評估模型,并基于機器學習可解釋性算法提取模型內在知識,實現了模型的輕量化,具體創新點如下:

1)針對單層CatBoost 評估模型指標精度不足的問題,設計了粗判加精判兩階段CatBoost 評估模型,取得了模型指標的全面提升;

2)針對模型可解釋性不足的問題,引入Tree-SHAP 算法,實現了模型決策過程的透明化,并從中獲取了模型的內在知識,即暫態關鍵影響因素;

3)針對TSA 模型輸入特征量大、參數多的問題,基于暫態關鍵影響因素訓練了低維兩階段輕量化CatBoost 模型,以20%的特征數量實現了超越單層CatBoost 評估模型的評價指標。

文中采用的是仿真軟件獲取的時域仿真數據,與實際中基于PMU 測量獲取的數據還存在一定的差距;僅針對新型電力系統暫態穩定的評估問題,但事后控制并未涉及,如何基于模型解釋結果進行控制也值得深入研究。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 欧洲av毛片| 欧美一级夜夜爽www| 熟妇丰满人妻| 久久夜夜视频| 中文字幕在线观| 日韩人妻精品一区| 国产永久在线观看| 国产精品无码作爱| 高清大学生毛片一级| 国产成人亚洲精品蜜芽影院| 亚洲精品中文字幕无乱码| 亚洲码一区二区三区| 四虎永久免费在线| 中文字幕精品一区二区三区视频| 国产成人精品在线| 欧美亚洲香蕉| 欧美一区二区三区欧美日韩亚洲| 蜜桃臀无码内射一区二区三区 | 亚洲日本中文字幕乱码中文| 亚洲第一黄色网址| 97se亚洲综合在线韩国专区福利| 久久国产精品波多野结衣| 国产精品国产主播在线观看| 久草网视频在线| 国产99精品视频| 欧美中文字幕无线码视频| 999精品在线视频| 鲁鲁鲁爽爽爽在线视频观看| 91精品啪在线观看国产| 日日拍夜夜操| 丁香婷婷激情网| 欧美成人亚洲综合精品欧美激情| 亚洲美女高潮久久久久久久| 婷婷午夜天| 国产色伊人| 国产成人无码久久久久毛片| 动漫精品中文字幕无码| 国产高清又黄又嫩的免费视频网站| 久久久久久国产精品mv| 日韩天堂在线观看| 激情成人综合网| 国产成人综合亚洲欧美在| 亚洲天堂色色人体| 蜜桃视频一区| 久久香蕉国产线| 国产精品无码一二三视频| 国内精品久久人妻无码大片高| 国产在线精品人成导航| 香蕉视频在线精品| 国产欧美在线观看一区| 91精品aⅴ无码中文字字幕蜜桃| 亚洲伊人电影| 国产jizz| 99热这里只有成人精品国产| 国产精品原创不卡在线| 国产成人综合久久精品尤物| 日本成人一区| 久久精品这里只有精99品| 国产在线观看第二页| 久久综合色播五月男人的天堂| 欧美精品一区二区三区中文字幕| 国产精品区网红主播在线观看| 免费a在线观看播放| 亚洲AV色香蕉一区二区| 91最新精品视频发布页| 99re经典视频在线| 99热这里只有精品在线观看| 欧美在线精品一区二区三区| 72种姿势欧美久久久大黄蕉| 色欲色欲久久综合网| 亚洲熟女中文字幕男人总站| 欧美三级日韩三级| 欧美一区精品| 男女性午夜福利网站| 日韩精品久久无码中文字幕色欲| 亚洲Av综合日韩精品久久久| 99热国产这里只有精品无卡顿"| 亚卅精品无码久久毛片乌克兰| 久久成人免费| 毛片手机在线看| 久久精品电影| 永久天堂网Av|