胡亞山,倉敏,諸德律,王靜怡
(國網江蘇省電力有限公司經濟技術研究院,江蘇南京 210008)
配電網是電力系統發、輸、變、配的關鍵環節之一。隨著智能電網的發展建設,電網公司對配電網領域的投資也越來越多。配電網具有眾多的電力設備,電網公司對配電設備進行運行維護、資產管理過程中產生了海量的數據,如何管理并利用好這些數據是值得研究的重要問題[1-3]。
近年來,大數據技術結合深度學習等人工智能算法深入挖掘海量數據的潛在價值,其在電力系統的負荷預測、故障診斷、狀態評價、用電行為分析等領域應用廣泛[4-6]。該文結合深度學習算法開展多體系信息融合數據在配電網設備剩余壽命預測的應用研究,為配電網設備的退役更換提供信息支撐及輔助決策。
在配電網設備資產的全壽命周期管理中,涉及海量配電網設備的相關數據信息,這些數據與配電網設備的健康狀態存在密切關聯。
基于多體系信息融合的配電網設備數據,分析配電網設備全壽命周期質量與關鍵要素的關聯性,可以為配電網設備全壽命周期的管控優化提供指導。
以配電網中常見的電力變壓器為例,構建多體系信息融合數據架構如圖1 所示。該數據架構主要包括油色譜指標、油化指標和電氣指標共3個方面。

圖1 電力變壓器多體系信息融合數據架構
油色譜指標是指通過分析變壓器絕緣油中特定氣體成分的存在情況,以判斷電力變壓器的使用時間或是否存在局部放電和過熱等故障;油化指標是指通過分析變壓器絕緣油的絕緣性能,實現電力變壓器質量情況的評估;電氣指標包括變壓器繞組的主要電氣特征,其能夠直接反映變壓器的健康情況。
主成分分析(Principal Component Analysis,PCA)是一種重要的多維空間數據統計分析技術。其核心思想是將存在相關性的高維數據映射到線性不相關的低維空間,實現數據壓縮和特征提取,從而簡化數據復雜度,消除數據之間的相關性[7-8]。
假設Rn為特征空間,對于包含j維特征變量的k個數據樣本,PCA 的主要計算步驟如下[9-10]:
1)數據標準化
為了消除不同維度特征變量量綱對主特征提取結果的影響,有必要對原始數據進行標準化,計算方法如式(1)-(2)所示:

2)計算協方差矩陣
為消除不同特征變量之間的相關性,達到線性化與降維度的目的,首先計算表征特征變量之間相關性的協方差矩陣R:

式中,rij為第i維特征變量與第j維特征變量之間的相關系數,計算方法如下:

3)計算特征值與特征向量
通過求解特征方程|λI-R|=0 得到協方差矩陣R的特征值,將這些特征值從大到小依次進行排序:

式中,λp為協方差矩陣R的第p個特征值,共有P個特征值。
進一步計算P個特征值對應的單位特征向量:

式中,ep為特征值λp對應的單位特征向量,epj為ep第j維取值。
4)計算主成分貢獻率
按照如式(7)和式(8)所示的定義,計算各個主成分的貢獻率φp,按從大到小進行排序并計算累計貢獻率ψp,然后篩選出累計貢獻率大于閾值pmin的前h個主成分:

5)數據樣本映射
將主成分對應的h個特征向量作為列向量組成特征向量矩陣:

通過以下矩陣運算將原數據樣本映射到主成分構成的特征空間中,實現數據的降維和線性化:

式中,X′為映射后的數據樣本。
長短期記憶(Long Short-Term Memory,LSTM)網絡是一種具有時間記憶功能的深度學習神經網絡,其核心思想是模擬人類記憶和處理信息的機制[11-12]。LSTM 的結構與神經網絡相似,只是每層的輸入層和輸出層之間由循環的記憶單元連接門[13-15]、輸出門及忘記門構成,其結構如圖2 所示[16]。

圖2 LSTM記憶單元結構
1)忘記門

式中,Wxf為輸入層與忘記門之間的權重;Whf為隱藏層與忘記門之間的權重,αf為忘記門的偏置值;σ(·)為激活函數。
2)輸入門
輸入門負責控制更新的神經元信息,其輸出信息如下:

式中,Wxt為輸入層與輸入門之間的權重;Wsl為記憶單元和輸入門之間的權重;αl為輸入門的偏執值。
3)輸出門
輸出門負責控制記憶單元最終的輸出信息,公式如下:

式中,Wxo為輸入層與輸出門之間的權重;Wso為記憶單元與輸出門的權重;αo為輸出門的偏置值。
該文提出基于PCA-LSTM 的配電網設備數據分析與優化管控方法,實現配電網設備剩余壽命的預測,從而輔助配電網設備資產的管理運維,管控流程如圖3 所示。首先將多體系信息融合數據作為輸入,通過PCA 算法對數據進行降維簡化處理;然后將提取的主成分數據作為LSTM 模型的輸入,從而自動學習數據特征,獲得配電網設備剩余壽命預測結果。

圖3 配電網設備數據分析與優化管控流程
為驗證該文提出的基于PCA-LSTM 的配電設備數據分析與優化管控方法的正確性和有效性,選取1 000 組配電設備多體系數據作為樣本,并按4∶1 的比例劃分為訓練樣本和測試樣本。
1 000組數據樣本中,每個數據樣本都包含如圖1所示的13 個指標值,數據樣本取值如表1 所示。

表1 數據樣本的取值
通過PCA 算法,前7 個主特征的貢獻率及累計貢獻率如表2 所示。由表2 可知,主成分1-4 的貢獻率分別為40.15%、25.67%、17.91%和13.11%,而主成分5 的貢獻率僅為2.25%。前4 項主成分累計的貢獻率已達96.84%,大于閾值95%,故選取主成分1-4構建特征向量矩陣,并對原始數據樣本進行映射。

表2 前7個主特征的貢獻率
1)算法性能對結果的影響分析
以所有數據樣本作為輸入,分別采用PCA-LSTM算法、LSTM 算法和PCA-BP 算法,得到配電網設備剩余壽命的預測模型。然后以5 組數據測試模型的準確性,結果如表3 所示。

表3 不同算法的剩余壽命預測結果分析
由表3 可知,PCA-LSTM 算法配電網設備剩余壽命預測誤差均小于3%,LSTM 算法最大誤差達4.5%,PCA-BP 算法最大誤差達3.8%。對于同一數據樣本,PCA-LSTM 算法的預測誤差是3 種算法中最小的一種,而LSTM 算法與PCA-BP 算法則各有優劣。相比于LSTM 算法,PCA-LSTM 算法通過PCA 將配電網設備的特征數據進行降維簡化,消除不相關特征對剩余壽命預測結果的干擾;相比于PCA-BP 算法,經過主成分特征數據的學習,LSTM 算法比BP 算法具有更優的自動學習性能,剩余壽命預測結果也更加準確。
2)多體系信息融合對結果的影響分析
選取不同的信息方案作為PCA-LSTM 模型的輸入,得到的配電網設備剩余壽命預測結果如表4 所示。由表4 可知,選取單種體系信息作為輸入時,剩余壽命預測誤差大于12%;選取兩種信息作為輸入時,剩余壽命預測誤差大于5%;而該文所提方法將多種體系信息作為輸入,剩余壽命預測誤差小于3%。

表4 不同體系信息的剩余壽命預測結果分析
該文開展了基于PCA-LSTM 算法的配電網設備剩余壽命預測研究,通過算例分析結果表明,PCA 算法能夠實現配電網多體系信息的主要成分提取,從而達到降低數據復雜度的目的;PCA-LSTM 算法相比于LSTM 算法與PCA-BP 算法,剩余壽命預測結果更加準確;而相比于采用單種體系或兩種體系信息,文中所提算法能夠全面利用反映配電網設備剩余價值的關鍵數據,提高預測結果的準確性。但該文所提算法僅實現了配電網設備剩余壽命的預測,如何同步實現配電網設備的故障研判將在后續研究中開展。