蔡忠林
(國家電網寶雞供電公司,陜西 寶雞 721004)
傳統DSA是基于系統運行情況和負荷需求預測的啟發式假設來進行離線開發的[3]。然而,隨著網絡運行狀況不確定性增加,需要在線DSA對系統的安全狀態進行連續監控。同時,隨著廣域測量系統的出現,在線DSA的發展得到了極大的推動[4],在線DSA提供了各種時間同步的測量,同時能夠在線評估系統的安全狀態。然而,在線DSA的應用受到限制,不適用于系統發生干擾后的實時保護和補救控制措施。為了給保護控制應用提供充足的時間進行分析、決策,準確地提供補救控制措施,實時提供系統安全指標至關重要。本文提出了一種基于決策樹分類器的動態安全評估新算法,將對稱不確定性(SU)算法和邏輯模型樹(LMT)算法分別作為特征選擇的高級分類器和決策樹分類器。將這2種方法耦合,可以在不影響評估精度的前提下,最大限度地減少用于電力系統保護和控制應用的DSA工具的計算時間。
DSA方法是一種分析工具,它對系統運行狀況進行快照,然后執行全面的安全評估,以警告系統操作員任何異常操作情況,DSA還提供了相應情況下的補救控制建議。近年來,由于對DSA技術的迫切需求以及計算機功率成本比的不斷提高,使得在線DSA技術在實踐中得到了大量的實現。DSA系統在全球電力系統中正處于使用或實施階段[5]。
DSA技術在文獻中已有報道,這些方法的目的或者是提高計算時間,或者是提高DSA結果的準確性。高本鋒等[6]建立了H橋級聯型SSSC的動態模型及小干擾穩定性分析,采用特征值分析法分析了該系統的振蕩模態,并研究了控制器參數對系統小干擾穩定性的影響。Luo等[7]采用了基于模式發現的先進模糊分類方法,該方法使DSA的準確性提高到98.1%。在現代電力系統的新環境下,電網的規模不斷擴大,因此,突發事件的數量和類型有所增加。由于PMU單元每秒可以為當前操作系統拍攝60~120個快照,利用這個優勢,需要分析的數據量增加了。因此,需要尋求一種準確、快速的DSA工具,尤其是實時的DSA工具,以保證電力系統處于安全狀態。改進DSA工具的基本思路可以分為2個階段:第1階段,在不影響數據集中相關和非冗余特征的情況下,減小DSA數據集大小;第2階段,選擇一個更好的分類器模型,該模型能夠解釋數據集中的模式,從而獲得高精度的結果,并節省時間。
本文考慮使用SU算法來減少分類標簽與數據集中非相關和非冗余特征之間的誤差。SU是一種相關測量檢驗,用于評估特征的價值或分類價值[8]。這種技術能夠研究一個數據集來嵌入或映射從高維到低維變量的數據點,同時保持所有相關結構的完整性。該思想源于熵的概念,即測量隨機變量的不確定性[9]。變量X的熵定義為式(1):
(1)
式中,P(xi)為所有值的先驗概率。
在觀察其他變量Y的值之后的X熵可描述為式(2):

靈隱寺主要以天王殿、大雄寶殿、藥師殿、直指堂(法堂)、華嚴殿為中軸線,兩邊附以五百羅漢堂、濟公殿、聯燈閣、華嚴閣、大悲樓、方丈樓等建筑所構成,共占地130畝,殿宇恢宏,建構有序。靈隱寺自創建以來,高僧云集,文人薈萃,儒釋交融,談禪論道,一吟一詠早已蔚為大觀。此外,寺內還存有不少年代久遠的佛像、法器、經幢、石塔、御碑、字畫等歷史文物,為靈隱寺珍貴的佛教文化遺產。
(2)
式中,P(xi|yi)為給定Y值后X的后驗概率。X熵的減少表示由Y提供的關于X的附加信息,該值稱為信息增益(IG),其表達式如式(3)所示:
IG(X,Y)=H(X)-H(XY)
(3)
若IG(Z,Y) 引入SU(X,Y),表示歸一化信息增益[10],其定義如式(4)所示: (4) SU的范圍從0到1,SU=0表示特征和特征是獨立的;SU=1表明特征X和特征Y高度相關。在本文設計方法中,基于熵的度量方法通過選擇相關、冗余和非冗余的特征來降低數據集的維數,以提高決策樹算法在電力系統DSA應用中的性能。 將SU技術與決策樹分類器相結合,以獲得更好的DSA應用性能。SU降低了數據集的維數,而決策樹為DSA分類難題提供了一個有效的解決方案。SU用于顯著改善決策樹分類器的性能,這些分類器在高維數據存在時,承受著高計算負擔和準確性不足的問題。為了達到研究目標,本文分為3個主要階段,如圖1所示。第1階段包括構造表示測試系統模型動態行為的數據集;第2階段,使用高級特征選擇(FS)來減少數據集中的冗余[11],從而進行數據降維;第3階段,將降維數據集應用于決策樹分類器的DSA應用。 圖1 模型構建路徑Fig.1 Model construction path 提出方法第一階段的詳細過程如圖2所示。本文研究了電力系統元件在各種運行工況下的動態建模行為,構建數據集時考慮的突發情況如下:①在正常負荷和每條輸電線路上,施加平衡三相故障,并在0.1 s后清除。②在正常負荷和110%負荷下,每次有1條輸電線斷開。③在正常負荷、110%負荷、120%負荷下,發電總線附近2條傳輸線同時開路。 圖2 數據集構造Fig.2 Data set construction 在所有情況下,記錄轉子角、電壓幅值和各總線的頻率。 在第2階段,DSA數據集每個實例有n個特征和c個目標類,SU算法通過度量特征與目標類之間的相關性來評估特征的權重,以確定該特征是否與目標類相關。然后將所有計算得到的SUn,c存儲在矩陣中。其根據信息增益值按降序排序,特征選擇可以幫助消除不相關的屬性,但是不能刪除冗余屬性。為了識別冗余特征,本文采用了SU法和排序搜索法。 SUlist矩陣的第一個特征Fa被設置為與目標類具有最高的相關性,因此,將SUa,b與SUb,c進行比較。若SUa,b≥SUb,c,則從中去除特征Fb。然而,若SUa,b 在特征選擇過程之后,該過程繼續使用決策樹技術對數據集進行分類,過程如圖3所示。排序搜索法的特征選擇結果可以根據評價結果對特征進行排序[12],之后用戶可以根據SUnew排名最高的特征和預先定義的閾值,使用決策樹技術指定SUnew中要保留的特征數量。由于很難為每個電力系統中保留特征的數量指定一個合適的閾值,因此,用戶需要進行實驗以獲得最佳結果。在這個過程之后,將簡化的數據集應用到決策樹技術進行分類。本文將邏輯模型樹(LMT)算法應用于電力系統DSA數據集的分類。與傳統的決策樹相比,LMT用邏輯回歸函數代替了決策樹的終端節點[13]。由于這種改進,它能夠對二進制和多類目標變量、數值和標稱屬性以及缺失值進行分類。當在一個節點上擬合邏輯回歸函數時,LMT使用交叉驗證來確定迭代次數,并且在整個樹中使用相同的迭代次數,而不是在每個節點上進行交叉驗證。這種啟發式方法極大地提高了運行時間,但對精度影響很小。 圖3 LMT分類器Fig.3 LMT classifier 在IEEE30節點測試系統模型中,有功功率和無功功率總需求分別為283.4 MW和126.2 MVAr,IEEE 30總線測試系統模型由36個總線組成。使用PowerWorld模擬器程序來模擬測試系統模型在所有突發情況下的響應。本文方法要求得所有總線的電壓幅值和頻率,因此,在每種情況和突發情況下,對所有總線進行72次電壓幅值和頻率測量。此外,該方法還需要對所有6臺發電機的轉子角進行測量。每個度量都是數據集中的一個特征或屬性[14]。因此,這意味著在每個突發情況下都有78個特征。根據上文所述突發情況,47個突發事件來自正常負載下的平衡三相故障,94個突發事件分別來自正常和110%負載下的一條開放傳輸線,45個突發事件分別來自正常情況、110%負載以及120%負載下發電總線附近的2條開放輸電線。因此,研究中考慮的突發情況總數為186。在這里,每個突發情況都是一個實例。因此,IEEE30總線測試系統模型的數據集由78個特征和186個實例組成。 IEEE 30總線測試系統模型在N-1突發情況下的響應如圖4—圖6所示。在t=1 s時,在2號總線上安裝螺栓連接的三相故障,通過打開2—6號線路消除故障。圖4、圖5、圖6分別表示了運行場景下測試系統模型中發電機的轉子角、連接到總線2的所有總線電壓幅值以及連接到總線2的所有總線頻率。 圖4 發電機轉子角響應Fig.4 Angular response of generator rotor 圖5 總線電壓幅值Fig.5 Bus voltage amplitude 圖6 總線頻率Fig.6 Bus frequency 根據圖4所示的發電機轉子角響應,系統能夠在受到擾動后找到一個新的平衡點。因此,系統是瞬態穩定的。圖5顯示了連接到總線2的所有總線的電壓幅度在0.9~1.1 V振蕩,而圖6顯示在N-1突發情況下,連接到總線2的所有總線的頻率在49.5~50.5 Hz振蕩。由于滿足了系統動態安全的3個標準,因此系統可認定為安全。 對數據集中的所有實例重復這些過程。對于研究所考慮的測試系統模型,123個實例被分配為安全實例,63個實例被分配為不安全實例。因此,采用SU算法來減少數據集中的信息冗余,然后利用LMT算法將簡化后的數據集應用于DSA。研究記錄了該方法的精度和計算時間。最后,將本文方法與LMT算法的DSA性能進行了比較。有SU和沒有SU情況下,使用LMT算法的結果見表1。 表1 基于SU的LMT決策樹技術的性能Tab.1 Performance of Su based LMT decision tree technology 從表1中可以看出,DSA應用于IEEE 30總線測試系統模型的數據集中的特征數為78個。然而,使用所提出的方法,特征的數量已經顯著減少到7個,這意味著71個特征與這7個特征高度相關。換句話說,只有這7個特征在數據集中是重要的。因此,71個特征可以被忽略,因為它們代表著與顯著特征相似的特征,這些顯著特征足以表示系統在受到擾動后的動態響應。要考慮的實例保持在186個,這意味著該方法不會忽略決策樹訓練過程中的任何突發情況,減少數據集中特征的數量可以提高LMT算法的性能。結果還表明,帶SU的LMT算法優于不帶SU的LMT算法。使用SU減少的數據集,LMT只需要0.09 s就可以達到100%的準確率,而使用初始數據集來評估IEEE 30總線測試系統模型的動態安全性,LMT只需要0.09 s就可以達到98.387 1%的準確率。這表明該算法通過減少數據集中的實例,通過用于DSA的LMT算法提高了DT的性能。 為了比較SU特征選擇算法與其他機器學習應用中的特征選擇算法的有效性,在同一數據集中使用了4種特征選擇算法(基于相關、增益比、信息增益和RELIEFF算法)。算法SU、相關、增益比、信息增益與RELIEFF準確率為100%、94.086 0%、99.462 2%、99.462 4%、96.774 2%。 可以看出,SU在精確度方面明顯優于其他所有算法。這種優越性是由于SU算法只選擇最重要的特征而排除了冗余特征,因此具有較高的性能。由此可以將錯誤和噪聲降低到最低限度,并改善了LMT分類器的結果。 與傳統技術相比,機器學習技術在DSA的各種應用中都顯示出了更高的效率[15-17]。然而,現代電力系統必須處理來自測量設備(如pmu)每毫秒數據量的巨大變化。因此,減小數據的規模和從數據集中去除不相關或冗余的特征是至關重要的,這樣可以縮短分析時間,提高機器學習算法的精度[18]。與傳統的DT分類方法在DSA中的應用不同,研究結合了SU特征選擇算法的優點和LMT分類器算法的優點,這種組合有效地實現了在線DSA應用的目標(高精度和短時間),因為SU將LMT學習過程轉化為高效、快速的操作。就成本效益而言,這種方法的優點是可以消除DSA數據集的不相關和冗余特征,這可以減少DSA工具需要分析的數據量,從而提高分類算法的性能,降低額外的計算成本。此外,對操作人員進行高度準確的評估,可以降低保護過程的成本。 安全性和穩定性是時變的特性,可以通過監測電力系統在突發情況下的性能來衡量[19-21]。在突發事件中,電力系統的存續取決于故障的性質和位置以及保護裝置對故障的快速清除。保護裝置的任何延遲或該裝置的運行不理想,都可能導致電力系統穩定性的變化,從而導致在短時間內處于不穩定狀態。該方法具有精度高、時間短的特點,有助于電力系統安全穩定狀態的有效評估。 本文提出了一種基于決策樹分類器的改進特征選擇算法,用于電力系統動態安全評估。該方法將動態安全評估與決策樹分類器相結合,使用SU算法來降低數據集的維數。將簡化后的數據集應用到LMT算法中,用于對電力系統的動態安全性進行評估。以IEEE 30總線測試系統模型為例,驗證了該方法在提高決策樹分類器性能方面的有效性。對于IEEE 30總線測試系統模型的DSA,SU算法可以減少30.76%的計算時間,而LMT算法的精度可以提高到100%,該方法對實時保護和控制應用具有一定的參考價值。2 模型設計



3 結果和討論
3.1 IEEE30總線測試



3.2 性能比較

4 結語