張林林, 胡熊偉, 李 鵬, 石 訪, 于之虹
(1. 山東大學 電氣工程學院, 濟南 250061; 2. 中國石油大學(華東) 信息與控制工程學院, 山東 青島 266580; 3. 中國電力科學研究院有限公司, 北京 100192)
隨著清潔能源發電規模的不斷增長和負荷多樣性不斷增加,電網結構日趨復雜,給電網狀態監測、調度管理、運行控制等帶來巨大的挑戰[1].風電、光伏發電等具有發電隨機性強、間歇性強、可調節能力弱等特點,大規模新能源的并網會降低系統的慣量,引起頻率支撐能力下降、電網電壓水平波動加劇、暫態穩定性惡化等一系列問題[2];而電動汽車、柔性負荷等新型負荷的接入使得負荷波動隨機性增強,現代電力系統表現出強互動、多耦合和高隨機的典型特征[3].風機、光伏陣列、儲能元件等都需要通過逆變器并網,變換器等電力電子設備具有慣性小、響應速度快、過流能力弱等特性,使得其控制及管理理念與常規系統有很大的不同[4].因此,傳統同步發電機占主導地位的電力系統正在逐漸演變,電力系統的動態特征將變得更加復雜.
傳統的電力系統穩定分析一般通過建立物理元件的數學模型,然后選取數值積分及代數方法求解非線性微分-代數方程組,得到數值計算結果.每次仿真計算前需要確定全部數學模型、參數及仿真場景,故計算量比較大,對模型精確度要求較高.電力系統本質上是非線性復雜的動態網絡系統,各個元件之間及其與外部因素間均存在耦合,而物理模型的建立通常基于一定的假設和簡化.電力電子化電力系統的動態行為更為復雜,元件精確建模困難,傳統研究的假設條件可能會失效[5-7],這使得數值仿真結果有時不能充分反映電網實際運行狀況[1].另一類電網穩定分析方法是以能量函數為基礎的直接法,通過判斷擾動結束時系統的運行點是否仍然在穩定域內,即擾動后的系統能量是否小于漸近穩定域臨界能量值來判別系統的穩定性.基于經典模型的直接法已應用于簡單電力系統的暫態功角穩定分析,但由于難以準確計及負荷動態,且難以應用于復雜系統,從而限制了它在實際電網中的應用[8-10].
電網作為一種高維復雜的能量傳遞網絡,伴隨能量傳遞的過程將有大量運行數據的產生,這些數據可反映系統的時空特性與穩定程度.傳統的分析方法并不能有效利用這些運行數據,即無法以數據驅動為途徑及時、準確地進行系統分析和輔助決策[11],造成了資源的浪費.隨著電力量測技術的發展和能源互聯網及智能電網建設的不斷推進,電網量測體系中積累了大量的電力數據[12-13],為將大數據挖掘與分析技術應用于電網穩定評估提供了可能[14-17].數據驅動型暫態穩定評估方法能夠在一定程度上脫離電網物理模型,從數據角度分析電網量測信息與電網運行狀態的關聯性,直觀迅速地獲知電網當前運行情況,使調度人員或自動調節控制裝置及時對電網狀態做出必要修正,提高系統穩定水平.
以機器學習為代表的數據驅動算法已成功應用于電力系統暫態穩定評估,并取得良好的效果.文獻[18]利用帶有輸入記憶功能的多層感知器網絡改善電力系統的穩定裕度;文獻[19]將支持向量機(SVM)和決策樹相結合,在兼顧輸入特征信息量和整體計算效率的情況下進行組合式暫態穩定評估;文獻[20]基于故障后發電機端電壓受擾軌跡簇特征,利用SVM構造預測器進行暫態穩定預測.利用數據挖掘技術進行暫態穩定預測實質上是基于量測數據的,通過離線學習獲得數據關鍵特征與系統運行軌跡的映射關系,形成數學預測模型.但是,電網的網絡結構和運行方式處于不斷變化中,量測數據也處于不斷產生和更新中,若不能快速給出預測結果或者利用最新量測數據快速更新和訓練相應評估模型,將會產生不可信的結果.為提高暫態穩定評估模型訓練速度,提出可在線應用的電網穩定判別算法,本文研究基于極限學習機(ELM)[21-22]的電力系統暫態穩定判別模型.ELM是一種改進的單隱層前饋神經網絡,它克服了傳統神經網絡梯度下降算法需要多次迭代求解、網絡結構復雜等缺點,具有參數選擇簡單、訓練速度快、泛化能力強等優點,適于在線應用.論文通過特征集選取、特征分析及評價指標定義等,改進ELM方法,使之適用于在線電網暫態穩定評估,并用仿真算例進行了驗證和分析.
隨著智能電網建設的不斷推進,量測裝置逐漸覆蓋電力網絡的關鍵節點,調度中心可實時獲取高壓母線及線路上的各電氣量信息,如線路有功功率、無功功率、節點電壓模值及相角.對于m個節點的電力網絡,每個節點選取r個量測信息,構成反映電力網絡的d維特征向量x,其中d=mr.
(1)
以n維類型向量t表示不同運行狀態下系統的穩定水平,向量元素取值集合為{0,1},當全1時表示系統安全裕度最高,全0表示系統失穩.
(2)
本文中取n=1,即t=1時系統穩定,t=0表示系統失穩.一個完整的訓練樣本可以表示為
(3)
在發電機出力變化、負荷水平變化或者系統發生不同地點、不同類型的故障情況下,電網處于不同的運行狀態,得到多個樣本向量形成樣本集合P(設樣本數量為N):
(4)
對應上述數據表示方法,圖1所示為一個輸入為d維、隱藏層為L維、輸出為n維的單隱層神經網絡.輸入層與隱藏層連接權值為w,隱藏層中每個神經元均具有閾值b,根據網絡連接關系可以計算出隱藏層的輸出矩陣為
(5)
式中:s(·)為激活函數,負責將連續量映射為離散量,即實現(-∞,+∞)?(0,1)的映射.

圖1 單隱層神經網絡Fig.1 Single-hidden layer neural network
當輸入數據經權重加和后大于閾值,相應的隱藏層神經元輸出為1,反之為0.為保證整個數學模型的光滑可微,一般采用Sigmoid函數作為激活函數:
(6)
模型的輸出為隱層輸出矩陣H與外權值β之積Y=Hβ,即
Y=
(7)
選擇所有訓練樣本的實際類別與模型輸出結果的誤差累計之和作為目標函數進行優化,定義如下:
(8)
式中:k=1,2,…,n.使E達到最小值的參數即形成理論上性能最佳的神經網絡,根據矩陣理論[23]相關知識,上式可以改寫為
E=(Hβ-T)T(Hβ-T)
(9)

(10)
(11)

(12)
式中:H?為Moore-Penrose增廣逆陣,簡稱偽逆.實際中常用正交法獲得H?:

(13)

(14)
1對應穩定,0對應不穩定,進一步劃分可產生不同穩定裕度的對應關系.
實際仿真中發現暫態穩定問題存在明顯的樣本不平衡特征,即仿真產生的穩定樣本數量明顯多于不穩定樣本.在這種情況下,模型經過訓練容易出現過擬合的問題,即分類器將穩定樣本本身的一些特點當作所有樣本都會有的一般性質,使分類誤差增大.另外,若采用傳統的正確率,即分類正確個數與樣本總數的比值作為評價模型泛化能力的標準,模型對不穩定樣本的識別能力會因為“大數吃小數”而被穩定樣本所掩蓋.
為解決上述問題,全面反映模型的性能,提出以下兩項措施:
(1) 基于裕度距離的欠采樣.由于我國電力系統運行均留有一定的裕度,大量的穩定樣本與穩定邊界有較大的距離.而對于ELM訓練來說,理想的樣本應該以與穩定邊界接近的數據為主,從而得到精細化的穩定規則.所以對仿真得出的樣本數據進行篩選,剔除部分距離穩定邊界較遠(穩定裕度很高)的穩定樣本,提高訓練集中不穩定樣本的比例.實際電力系統中不穩定情況僅占所有數據的3%左右,若通過欠采樣降低穩定樣本數使兩者比例相同,則總體樣本將偏少;但通過調整初始運行的方式增加失穩樣本的絕對數量,又會面臨大電網仿真調整策略不易確定、潮流不收斂、計算量顯著增加等問題.考慮到一般認為不同類別樣本不平衡比例超過 4∶1 時分類器才會因數據不平衡性而無法滿足分類要求,為在提高失穩樣本比例的同時保證足夠的樣本總量,本文控制穩定樣本和不穩定樣本的比例為 2∶1.
(2) 改進泛化能力評價標準.考察不穩定樣本中的正確率與穩定樣本中的正確率的幾何均值,采用全局正確率作為評價指標:
(15)
式中:Au表示數據集中不穩定樣本的正確率;As表示穩定樣本的正確率.可以看出,全局正確率與樣本絕對數量沒有太大關系,只有兩類樣本的正確率都較高的時候,最終結果才會比較高.
輸入特征構建的合理與否會影響最終分類器的預測性能.綜合文獻 [24-26],經過初步篩選,使系統暫態穩定性突變后會出現明顯變化的且易于獲取的電氣量在特征集中占較大權重,忽略部分不發生變化的電氣量,最終構建以潮流計算為基礎的137維原始特征,具體特征如表1所示.
輸入特征過多時,數據屬性中常常含有和暫態評估無關的特征或者多個特征之間互有重疊,這種冗余性不僅會使訓練時間大大增加,更有可能導致算法最終無法收斂,帶來“維數災”問題.因此采取措施進行特征分析以獲取最有價值的特征集是非常有必要的.

表1 原始特征集Tab.1 Original feature set
借鑒SVM中的遞歸特征消除思想[27],本文將遞歸特征消除法應用在ELM上進行特征分析,算法流程如下.

算法1遞歸特征消除法獲取最有價值的特征集
Input:訓練數據集Dtrain,測試數據集Dtest,隱層節點數Lbest,激活函數s(·)
Output:所保留的特征數目value及其在原始特征集中的索引值表index
計算采用全部特征時的正確率G0
fori=1,2,…,N
消除第i維特征;
訓練并測試模型,測試正確率為Gi;
取μi=G0-Gi為該特征的重要性指數;
end for
對i=1,2,…,N依μi降序排列并記為index
依index對原始特征排序得到新的特征集
forj=1,2,…,N
取前j維特征進行訓練;
end for

具體思路為:依次消除原始輸入特征的某一維特征,此時模型的性能會發生變化,這種變化反映出了這一維特征對于模型的重要性,每次消除一維特征,遞歸進行直到最后一維;接著按照特征的重要性從大到小對原始特征排序,然后消除排序靠后(重要性不高)的一部分特征得到最有價值的特征集.
根據以上介紹,基于ELM的暫態穩定性評估的具體步驟如下:
(1) 利用仿真軟件搭建電力系統模型,隨機設置初始條件及故障條件進行仿真,獲取足夠的反映系統暫態穩定性特征的樣本.
(2) 利用遞歸特征消除法對原始樣本集進行特征分析保留最有價值的若干特征形成樣本集.
(3) 按一定比例將樣本集隨機分為訓練集和測試集,同時保證兩者的穩定樣本與不穩定樣本的比例大致相同.
(4) 通過交叉驗證[28]優化網絡結構,確定ELM的隱含層節點數.由于網絡結構中內權值和閾值均隨機初始化,交叉驗證所得到的最佳隱層節點數必然會出現波動.為此引入統計學方法,多次試驗得到多個最佳數目,在此基礎上剔除異常值后取均值作為隱層節點的最終取值.
(5) 利用訓練集訓練ELM,確定輸出層的權值向量.然后對測試集進行分類測試,根據結果對ELM模型性能作出評價.
由于ELM的輸入權重和閾值可以隨機生成,僅需要計算一個廣義逆陣就可以得到輸出權重,整個算法的訓練時間很短,實際仿真中僅需幾十毫秒就可以完成訓練.算法所需要儲存的變量為輸入特征集索引值向量、連接權重及閾值,經特征篩選后,這些參數的維度大大減少,算法空間復雜度較低.
本文選取圖2所示的IEEE 39節點標準測試系統驗證所提出方法的有效性,它包含了46條線路、39個節點和10臺發電機.
仿真軟件采用電力系統分析軟件BPA,負荷水平范圍設置為75%~125%,發電機母線電壓水平在90%~110%范圍內調整,發電機有功控制在70%~130%內,按照均勻分布概率決定具體的數值以獲取大量不同的電力系統斷面數據.
假定系統發生三相短路故障,故障后 0.1 s切除故障,根據任意兩發電機相對功角差是否大于360° 來判定系統是否穩定[29],并分別以“1”和“0”標記,將樣本分為兩類.最終共生成 1 240 組數據,隨機分成訓練集和測試集,訓練集864例樣本,其中穩定與不穩定樣本比例為2∶1;測試集376例樣本,其中穩定樣本282例,不穩定樣本94例.

圖2 IEEE 39節點系統Fig.2 IEEE 39-bus system
由于ELM中輸入權重w與閾值b隨機生成,交叉驗證所得到的隱層節點數會發生波動,所以統計多次試驗的結果,如圖3所示,剔除明顯偏離大部分數據的異常點后取平均值作為最佳統計結果,最終最佳隱層節點為98個.

圖3 網絡結構優化結果Fig.3 Result of network structure optimization
遞歸特征消除結果如圖4所示,橫軸表示特征對應的維度索引值,縱軸為該特征的重要性指數,值越大表示該特征對提高模型分類能力起的作用越大,重要性指數會影響接下來排序篩選得到的輸入特征集,進而影響ELM模型的輸入層節點數量.
將特征按照圖4中重要性指數從大到小排序,然后逐一消除排序靠后的特征,統計測試正確率得到如圖5所示曲線,當保留特征個數為68時(約為特征總數的48%),得到的ELM模型具有較好的性能.若特征空間中包含的特征數較少,分類器預測性能較弱;若保留特征個數高于68個,分類器在預測性能上沒有太大差異,但特征空間維度越高,算法計算量越大.為在保證性能的同時盡可能降低存儲空間和計算時間,選擇保留特征排序后的前68維特征,此時的預測準確率為97.505%.最終得到訓練完成并通過測試的ELM模型,其輸入層、中間層和輸出層節點數目分別為68、98和2,輸入及輸出權重矩陣和中間層閾值向量采用排序篩選中最優性能(68維)處對應的取值,模型訓練耗時約為30 ms.
為比較有無遞歸特征消除對ELM性能的影響,利用原始特征集訓練ELM并統計測試結果與有特征選擇的ELM進行對比,如圖6所示.未加入遞歸特征消除的ELM正確率僅為91%,加入特征分析后ELM準確率提高到97%,特征分析能夠明顯提高ELM的預測準確率,改善模型的性能.

圖4 特征重要性Fig.4 Importance of different features

圖5 特征排序篩選結果Fig.5 Result of feature sorting and screening

圖6 遞歸特征消除結果Fig.6 Result of recursive feature elimination
為了驗證ELM相對于其他機器學習算法在暫態穩定評估中的優勢,選取在電力系統中已經得到了較多研究的SVM進行對比試驗.SVM是一種通過尋找數據空間中不同類別數據之間的最優分類超平面來實現分類功能的算法.
測試中使用的計算機配置:CPU為Intel Core i5-6500 3.2 GHz;RAM為8 GB;操作系統為Windows 10;仿真軟件及版本號為MATLAB R2017b.SVM的核函數依次選擇線性核、多項式核和高斯核,分別進行訓練和測試,統計訓練時間和測試正確率,并與ELM進行對比,結果如表3所示,輸入變量遞歸篩選作為對輸入數據的處理,通過一次離線計算完成,不包含在訓練時間中.

表3 SVM與ELM對比結果Tab.3 Results comparison between SVM and ELM
由上表可知,多項式核函數SVM正確率達到了97.29%,略低于ELM(97.51%).但ELM需要的訓練時間遠少于SVM,證明了所提方案的有效性及其在線應用的可行性.
本文提出了一種基于ELM的電力系統暫態穩定預測方案.首先采用遞歸特征消除法分析原始樣本集保留最有價值的若干樣本,然后利用交叉驗證法優化ELM網絡結構,并利用特征分析后的樣本集訓練神經網絡,最終得到電網暫態穩定評估結果.ELM不需要面對過擬合、局部最小值等問題,只需一步就可以構造出單隱層反饋神經網絡,具有結構清晰的優勢.利用IEEE 39節點系統進行算例研究并與SVM方法進行對比試驗,結果表明,ELM作為分類器應用于電力系統暫態穩定評估可大幅提高效率,利用輸入特征篩選方法可保證較高的預測準確率.上述方法的在線應用將是下一步研究的重點.