郭 杉,賈俊青,思勤
(內蒙古電力科學研究院,內蒙古呼和浩特 010020)
配電網故障自愈是指通過對電網故障區域進行定位并斷路,從而實現非故障區域的正常供電。在眾多故障類型中,接地故障是較為常見的形式。我國配電網通常使用的是中性點不接地,即小電流接地的保護措施[1-3]。當發生單相接地點故障時,線路特征為線性電壓對稱、故障電流小且無法達到系統規定的故障閾值;非故障相路的電壓會增加至原來的1.7 倍,而后端設備也會在過電壓的環境中運行。若無法及時發現該故障,便會引發后端設備短路的狀況,從而擴大故障的范圍。因此,需對單相接地點故障進行識別并加以排除[4-5]。
針對單相接地點故障的識別問題,眾多專家學者也提出了多種解決方法。這些方法可概括為兩種:接地信息分析法與廣域信息對比法。其中,接地信息分析法大多采用信號分析理論來對信號的基波幅度及零序電流進行分析;再通過模態分解法和小波分析法(Wavelet Analysis)來判斷故障發生的線路。該種方法的物理信息明確,但信息單薄、關聯性較差、可靠性也受閾值選擇的影響。而廣域信息對比法通常采用人工智能(Artificial Intelligence,AI)與神經網絡(Artificial Neural Networks,ANN)等算法。這類算法的計算準確度高,能夠挖掘故障及數據現象間所存在的關系,進而獲得故障識別的最終結果。因此,文中從廣域信息的角度出發,基于神經網絡的方法,通過訓練大量故障仿真數據來對故障發生的位置進行判斷,從而實現對非故障電路的有效保護。
配電網的中性點不接地系統如圖1 所示。其中C0為三相電的相對地分布電容,而三相電分別為A相、B相與C相。

圖1 中性點不接地系統
當電網未發生故障時,三相電的電容與電流數值相等,對地電流與中性點的接地電壓均為0,系統呈對稱區間。此時,中性點的電壓可表示為:
則A、B、C相的對地電壓為:
由式(3)可知,當因故障使一條線路的相位發生變化時,其他相次線路的相位也會同步變化為其數值的倍。為了進一步分析零序故障,對各相線路的暫態零序電流進行求解,則有:
式中,ICm和ILm、τC與τL分別為線路等效電容、電感的電流有效值及時間常數;φ為相位角;ωf為工頻角頻率,其可表征為:
其中,R為線路等效電阻。
由式(4)可知,當接地點發生故障時,系統的暫態電流主要由基波衰減量、高次諧波衰減量以及工頻角頻率組成,而工頻角頻率則受等效阻容感的影響。因此,該文使用零序電流的特征作為后續模型的訓練數據。
文中通過對零序電流的特征加以分析,進而得到故障位置,因此首先需對零序電流特征進行綜合提取[6-7]。交流電信號可分為基波與高次諧波,該次將采集信號的時域特征、頻域特征以及小波域特征[8-10]。
1)時域特征是信號的表面特征,信號以時間為度量衡,該文選擇能表示信號特征的變量,分別為電流與電壓的均值、標準差、峰值以及波形因子。
2)頻域特征。當配電網線路發生故障時,信號的頻譜也會發生一定的變化。因此,對信號進行頻域分析也有助于故障的識別。該次選擇的相關特征為:頻譜功率與相位變化指標。
3)小波域特征。對于復雜小信號而言,小波分析是一種全面且無遺漏的信號分析方法,其可對信號進行多個維度的分析。該次使用三層的小波包絡分析算法,能夠得到8 個子信號頻帶。小波分解過程如圖2 所示。

圖2 三層小波分解過程
隨機森林(Random Forest,RF)算法[11-13]是一種由多個決策樹(Decision Trees)組成的數據特征分類算法。其通過對多個子集進行訓練,從而使模型獲得一定的差異性數據搜索能力。RF 算法包含兩個步驟:模型訓練與決策分類。該算法的模型如圖3所示。

圖3 隨機森林算法模型
假設隨機森林算法故障特征樣本集合為X=(xi,yi),i=1,2,…,N,對其進行Bootstrap 采樣以獲得相關子集;然后對每個子集均使用決策樹模型hj(x),進而得到決策樹分類器;而樣本經過該分類器后會進行權重投票,最終輸出對應的類別。分類的策略如下:
LightGBM[14-16]也被稱為輕量級梯度提升機,其是一種類決策樹算法,基于梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)的框架設計而來。與其他算法不同的是,傳統算法僅關注正負樣本之間的權重,而決策樹類算法使用前向分布算法來降低上一次的迭代誤差,使算法朝著梯度下降的方向運行。GBDT 結構框架如圖4 所示。

圖4 GBDT結構框架
GBDT 算法主要用于處理離散數據,但對于其損失函數而言,計算優化時只能使用一階導數,由此導致算法僅能按順序進行操作。而LightGBM 算法利用Histogram 策略,使用深度算法模擬葉子生長的過程,計算時可以調用并行內核來提高計算速度,同時數據的處理能力也隨之增強。
假定監督數據集用N=(xi,yi),i=1,2,…,n表示,則LightGBM 算法對監督數據集進行訓練的目的是找到一個函數映射關系,使模型的損失函數期望值最優,具體如下所示:
式中,Ψ(y,F(x))表示模型的損失函數;E表示數學期望的值。LightGBM 使用回歸樹(Regression Tree)策略對期望值進行搜索,則有:
而求解目標可以定義為:
式中,Ω表示模型的正則項次。使用牛頓法(Newton’s Method)對目標函數進行求解,可得一階和二階的損失函數分別為:
由上式可知,僅需確定樹結構,即可求得葉子節點的權重。其具體表達式為:
其中,λ為權重調節偏置值。
該文算法的實現共包含三個部分:數據預處理模塊、樣本權重排序模塊以及故障分析模塊。其中,數據預處理模塊對原始數據進行采集,并使用時域、頻域和小波域分析對數據進行分割,從而形成多維數據特征。而樣本權重排序模塊采用隨機森林算法對多維數據特征加以排序。故障分析模塊則使用LightGBM 對多維數據特征進行分析,最終輸出故障預測區域的結果。該文算法模型如圖5 所示。

圖5 RF-LightGBM算法模型
文中使用Matlab Simlink 作為仿真平臺,根據某區域實際環境建立500 kV 的高壓輸電線路仿真模型。利用Simlink 自帶的工具,模型可以對暫態響應進行精確抓取。輸電線路的等效電容選擇10 nF,仿真時的電流采樣頻率則為10 kHz。構建的線路共有3 條,長度分別為1 號線路150 km、2 號線路130 km、3 號線路200 km。同時,為了驗證模型的故障檢測性能,對多種故障參數進行選取,并得到盡可能多的樣本集,以提高模型檢測的準確度。根據電流信號的特征,選擇不同初始相位角、過渡電阻以及故障距離進行組合。訓練樣本故障參數如表1 所示。

表1 訓練樣本故障參數
文中在表1 中設置了不同相位角、過渡電阻以及故障發生位置。當輸電線路發生接地故障時,電流便會產生變化。而隨著過渡電阻的改變,系統噪聲也會影響故障識別率。因此,首先對過渡電阻的影響進行了評估。實驗選擇XGBoost、SVM 和CNN算法與該算法進行對比。測試結果如表2 所示。

表2 不同算法誤判率測試結果
由表2 可知,該文算法能對過渡電阻小于700 Ω的線路進行準確地判斷,而對于過渡電阻在1 000 Ω以內的線路,其誤判率也可以控制在0.5%以內。對比表中其他算法的結果可以看出,該文算法的誤判率優于其他對比算法,且具有較大的冗余度。通常線路的過渡電阻在100 Ω以內,故該文算法抗干擾的能力較強。此外,在后續測試中也將100 Ω作為實驗的過渡電阻。
將仿真得到的故障距離樣本輸入至算法模型中完成測試,進而驗證各算法在不同電流相位與故障發生位置的預測精確度。隨機選擇故障發生距離及初始相位角,并選取50 次測試后的平均值作為故障檢測準確率。不同算法的實驗結果如表3 所示。

表3 不同算法的故障檢測準確率
由表3 可知,該文算法的故障識別準確率較高,平均值為98.9%,相較于對比算法分別提升了1.3%、2.4%及0.8%。由此說明,該文算法將特征分類算法RF 與故障預測算法LightGBM 進行結合,能夠提升原算法的故障檢測準確度。此外還證明了,該算法可有效檢測配電網發生的單相接地點故障并保護非故障電路,進而幫助電網完成自愈。
文中基于隨機森林算法和LightGBM 算法提出了一種輸電線路故障識別及自愈算法。該算法以單相接地點故障為例,對零序電流模型進行了分析,并將電流信號進行分解,同時使用隨機森林算法對特征向量進行排序分類。最終,利用LightGBM 算法對故障進行預測。仿真實驗結果表明,所提算法在不同工況下的故障識別率均較高,且具有一定的抗噪聲能力。