嚴宇平,蕭展輝
(廣東電網有限責任公司 數字化部,廣州 510000)
由于我國輸電線路距離長、分布范圍廣,導致電力設備面臨著多種氣候因素與地理環境的影響[1].調查研究表明,我國電網故障的主要誘發因素包括電力設備因素、人為因素和自然因素等[2-3].隨著各種儀器儀表技術的進步,利用采集到的氣象與電網運行數據來預測電網故障,提升電力系統運維檢修和運行調度能力,對減小電網故障率具有重要的工程實際應用價值[4].
為了提升電網故障的預測能力,國內外學者針對各種影響因素展開了相應的研究.王磊等[5]使用氣象數據來預測山火蔓延趨勢,并構建森林火災的處置態勢圖,實現電網森林火災的預警;Li等[6]利用電網在線運行數據、外部環境數據和歷史故障數據,使用模糊理論構建了電力系統運行評估的專家系統.近年來,深度神經網絡[7]在圖像、語音等信號處理任務中得到了快速發展,在分類與檢測等任務中顯著提升了識別精度[8-9].Adem等[10]結合神經網絡和粗糙集理論來預測電網故障;Mei等[11-13]使用自適應網絡與線路數據作為特征,采用魯棒性和泛化能力更強的支持向量機來得到電網故障預測的最終結果.上述工作側重于使用電網設備信息來預測電網故障,但未考慮到氣象因素的影響.
本文從電網氣象防災與減災的角度來研究電網故障預測問題.以氣象數據和電網運維數據為基礎,使用深度自編碼網絡來學習氣象與電網故障之間的關系,并構建電網故障預測模型.案例分析結果表明,所提出的方法能夠全面地建立氣象與電網故障之間的映射關系,并能準確預判電網在給定氣象條件下是否會發生故障.
深度自編碼網絡是一種特殊的神經網絡堆疊形式,其通過重建無標簽的輸入數據來提取特征.假設輸入數據集為{x(1),x(2),…,x(n)},x(i)∈Rn,深度自編碼網絡使用反向傳播算法進行無監督訓練,目標是使網絡輸出與輸入近似相同,即y(i)≈x(i).
圖1為一個包含3層神經元的自編碼網絡.該網絡第1層相當于編碼器,可將輸入映射為低維特征表示;第2層為特征變換層,可得到多樣化的特征表示;第3層為解碼層,從特征表示重建輸入數據.該網絡的目標是學習一個近似恒等函數,使得y(i)≈x(i).該網絡的編解碼過程可以表示為

圖1 3層自編碼網絡
h=fe(x)=S(Wex+be)
(1)
ht=ft(x)=S(Wth+bt)
(2)
y=fd(x)=S(Wdht+bd)
(3)
式中:fe、ft、fd分別為編碼層、特征變換層與解碼層;S()為Sigmoid激活函數;W為卷積操作權重;b為偏置.
為了保證網絡輸出y與輸入x盡可能相似,深度自編碼網絡通過最小化重建誤差L(x,y)來優化網絡參數,L(x,y)表示為
(4)

本文使用無監督預訓練的自編碼網絡提取電力設備因素、人為因素和氣象因素數據來預測電網故障.由于網絡輸入數據種類多樣,首先需要根據其特點進行歸一化處理;其次使用無標簽的數據預訓練深度自編碼網絡來提取輸入數據特征并挖掘數據間的關聯關系;最終基于預訓練好的深度自編碼網絡來構建多尺度電網故障預測網絡,使用自編碼網絡提取出的特征作為全連接網絡的輸入,從而建立氣象數據到電網故障的映射.
本文綜合考慮電力設備因素、人為因素和氣象因素與電網故障間的關系,使用這3類數據進行電網故障預測.本文所采集的具體數據類型如表1所示.

表1 電網故障輸入數據
由表1可以看出,本文使用10種氣象數據,各數據的采集周期為5 min.其中,溫度與濕度主要影響電網設備的絕緣性能,風力因素則可能導致電網線路刮斷、桿塔傾倒等故障.同時,根據各氣象數據的產生條件可以將其分為連續數據與離散數據,如降水量、風力、溫度與相對濕度等為連續數據;雷擊和山火數據則根據其是否發生分別使用0/1進行標識,類型為離散數據.
電力設備因素數據包括不受外界條件影響的靜態數據與電力系統運行時會變化的動態數據.本文選用靜態數據中的線路電壓等級來衡量線路絕緣情況與設備運行情況;選用線路電壓、電流和頻率3個動態數據來衡量線路運行狀態.
由于不同數據類型差異較大,因此本文對采集的數據進行歸一化處理,計算表達式為
(5)
式中:z=[z1,z2,…,zi]為氣象數據向量;z′為歸一化后的數據;zmin、zmax為氣象數據的最小值與最大值.
考慮到本文使用數據種類多,輸入數據難以挖掘不同數據間的關聯特征,文中先使用無標簽的氣象數據預訓練自編碼網絡來提取輸入數據所包含的特征,并挖掘不同數據間的關聯特征.
圖2為本文提出的多層自編碼網絡.該網絡使用兩個編碼層對輸入數據進行特征提取與降維;一個特征變換層對特征進行變換,以提取更深層的特征映射;兩個解碼層將特征反變換為原信號的分辨率.各網絡層由全連接層與Sigmoid激活層組成.由表1可知,本文網絡使用了16種輸入數據.自編碼網絡的各層參數如表2所示.表2中,(16,8)表示輸入神經元的數量為16,輸出神經元的數量為8.

圖2 深度自編碼網絡

表2 網絡參數設置
自編碼網絡的目標是通過重建輸入信號來提取多尺度的特征,因此本文使用式(4)給出的誤差函數來訓練自編碼網絡.考慮到電網數據具有區域性強與時變性強的特點,同時數據樣本受采集過程的影響較大,容易出現誤差,從而降低網絡的性能,本文基于去噪自編碼網絡的思想,通過對輸入信號增加噪聲擾動來提升網絡的泛化能力與魯棒性.
預訓練的自編碼網絡只能提取出輸入數據內部的特征,得到不同數據間的內部關系,而無法預測電網故障類型.本節在自編碼網絡的基礎上構建了電網故障預測網絡,建立了各影響因素與電網故障間的映射.
圖3為本文構建的電網故障預測網絡.該網絡首先使用自編碼網絡提取電力數據的中間特征;其次串接各中間特征表示得到多尺度特征;最終使用一個全連接層與Softmax分類器得到電網故障類型及相應的概率.

圖3 電網故障預測網絡
電網故障預測網絡的輸入為表1中的16種電網數據,輸出為發生短路、斷線、塔桿倒塌、淹水故障和正常運行5種常見電網運行狀態.故障預測網絡的編解碼層使用預訓練的自編碼網絡對權重進行初始化,全連接層使用分類損失進行訓練.
本文以某地電網數據作為研究對象,通過關聯匹配電網設備信息與氣象數據得到電網故障預測數據集.該地區電網覆蓋面積廣闊,包含不同氣象條件,如山火、雷擊和颶風等.本文共采集到500組數據,使用其中的400組作為訓練集,剩下的100組作為測試集進行仿真測試.數據集進行初始化處理后作為自編碼網絡與故障預測網絡的輸入,并分別使用ADAM優化器優化迭代10 000次.網絡使用Pytorch深度學習框架實現,初始學習率為0.1,每2 000次迭代學習率衰減0.1.文中使用精確度參數來判斷網絡的性能;使用正確率P、F-value和G-mean來驗證所提出算法的有效性,各參數定義表達式分別為
(6)
(7)
(8)
(9)
式中:TP為正類被預測為正類的概率;FP為負類被預測為正類的概率;FN為正類被預測為負類的概率;TN為負類被預測為負類的概率.
本文從5種運行狀態中選出概率最高的運行狀態作為電網故障預測結果.圖4為使用本文算法測試兩組不同場景采集數據得到的預測結果.從圖4a可以看出,在給定電網運行數據條件下,發生斷線、短路、塔桿倒塌、淹水故障和正常運行的概率分別為85.2%、1.64%、1.57%、0.15%和11.44%,即在當前電網運行條件下發生斷線故障的概率最高,因此,故障預測網絡的輸出結果為斷線故障.對比實際檢測結果可知,該組數據是在架空線路斷線情況下監測的,表明網絡預測結果與實際情況相符.同樣,根據圖4b結果可以看出,在給定電網運行數據條件下,發生斷線、短路、塔桿倒塌、淹水故障和正常運行事件的概率分別為17.63%、45.78%、10.55%、13.47%和12.57%,即在該組數據下發生短路的故障最高,故障預測網絡的輸出為短路故障.對比實際檢測結果可以發現,該組數據是在發生瞬時單相接地故障條件下采集的,網絡預測結果符合實際檢測結果.

圖4 不同數據下故障預測網絡輸出結果
為了驗證所提出算法的有效性,將該算法與傳統自編碼網絡、貝葉斯分類器和支持向量機等分類算法進行比較,且所有算法使用相同的訓練數據和測試數據.實驗結果如表3所示,從表3中可以看出,文中算法的正確率、F-value和G-mean參數明顯優于其他算法.表明所提出的算法能提取出更有效的特征,提高電網故障預測的正確率.本算法相比于傳統的基于自編碼網絡的電網故障預測結果有較大的提升,表明使用多尺度的特征表示可以提升網絡的預測精度.

表3 不同算法結果比較
本算法綜合考慮了電力設備因素、人為因素和氣象因素與電網故障間的關系.為了評估這些因素對電網故障預測精度的影響,文中測試了使用不同影響因素數據及其不同組合時電網故障預測網絡的精度,結果如圖5所示.從圖5中可以看出,隨著輸入數據種類的增加,電網故障預測網絡的精度逐漸上升,表明輸入數據的種類對網絡的精度具有較大的影響.從圖5也可以看出,氣象因素相對于電力設備因素與人為因素對網絡預測精度具有更大的影響.

圖5 不同影響因素組合時電網預測精度
本文從電網氣象防災與減災的角度研究了電網故障預測的問題,提出了一種基于自編碼神經網絡的電網故障預測算法.與不同算法的比較結果表明,所提出多尺度的特征表示算法可以提升自編碼網絡的預測精度.分析不同因素對電網故障的影響可知,氣象因素相對于電力設備因素與人為因素對網絡預測精度的影響更大.