李波,李凱,鐘蘇生,黃愷彤,楊朝誼,吳麗瓊
(廣東電力信息科技有限公司,廣東廣州 510080)
電網運行過程中會產生調度、電量、檢修等多種類型數據,這些數據蘊含豐富的電網運行狀態信息。合理挖掘這些信息的價值,能夠提高電網運行的智能化水平[1-6]。
多源數據融合旨在模擬人類從視覺、聽覺、嗅覺等感知到認識的機制過程,在電力系統的狀態監測、故障診斷、負荷預測與新能源預測等方面廣泛應用[7-12]。與神經網絡、深度學習等人工智能算法相結合[13-16],能夠充分挖掘電網海量數據的應用價值,在保障電網安全、穩定運行的同時,提升電網公司信息服務能力。
由于電力系統中設備的狀態不僅與電氣參數相關,還與溫濕度等環境參數有關。因此,基于多源數據融合驅動電力設備狀態的監測與故障評估,結果的準確性與多源數據的選取緊密相關,多源數據的選取應該遵循科學性、可行性與全面性的原則。科學性原則是指選取應符合客觀物理過程的發展規律;可行性原則是指數據的選取應在統計基礎上,具有可操作性;全面性原則是指數據選取應全面反映電力設備狀態的變化。
以油浸式變壓器為例,其表征故障狀態的特征參數眾多,依據科學性、可行性與全面性的原則,構建油浸式變壓器故障診斷的多源數據體系,如圖1所示。正常狀態下變壓器絕緣油中氣體含量與空氣大致相同,但隨著變壓器使用時間的增長或出現過熱與放電故障時,絕緣油會發生分解,產生一氧化碳、氫氣等氣體。通過油色譜試驗分析變壓器絕緣油中某些氣體含量,可以對變壓器狀態進行評估及診斷故障情況。變壓器絕緣油是變壓器主要的絕緣介質,通過油化試驗絕緣油狀態間接評估變壓器的健康狀態。電氣試驗指標通過測量變壓器的主要電氣參數,直觀、簡明地反映變壓器的狀態。

圖1 油浸式變壓器故障診斷多源數據體系
多源數據融合(Multisource Data Fusion,MDA)是模擬人類從感知到認識的過程,結合不同學科的數據信息,通過對其進行優化分析、綜合處理,完成所需任務的評估與決策。
DS 證據理論是多源數據融合領域常用的算法,屬于決策級別的多源數據融合算法。其核心思想是將待分析的問題分解為多個子問題,通過DS 合成規則實現多源數據融合,最終依據所需任務的決策規則得到決策結果?;贒S 理論的多源數據融合決策算法如圖2 所示。在數據層面,通過多個傳感器進行多源數據采集,通過數據標準化、相關性分析等數據處理方法,實現多源數據整體識別與特征提取。在特征層識別所需任務決策證據,并通過DS 合成規則實現融合,在決策層依據融合形成的決策規則得到決策結果。

圖2 基于DS理論的多源數據融合決策算法
DS 證據理論采用集合形式描述命題,假設N個互斥的獨立事件構成一個集合,該集合稱為識別框架,如式(1)所示。

式中,xn為識別框架θ的第n個元素。
識別框架θ的所有子集構成一個集合,稱為冪集2θ,如式(2)所示。

由此可見,冪集由2N個元素構成。假設A為冪集2θ的任意子集,即A?2θ,A與所需決策問題的一個命題相對應。進一步采用區間[0,1]的數值來描述對命題為真的信任程度,數值越大信任程度越高。命題A與該數值的對應關系采用基本概率分配函數進行描述。基本概率分配函數應滿足以下關系,如式(3)所示。

對于同一決策目標,由于決策過程的數據來源不同,所以對應著不同的基本概率分配函數。假設兩個來源不同的數據樣本X與Y,其對應的基本概率分配函數分別為m1與m2,合成后的基本概率分配函數,如式(4)所示。

式中,E為合成后的數據樣本,k為X與Y之間的沖突系數,k值越大說明X與Y之間的沖突越大。當k=1 時,說明X與Y完全矛盾,合成不成立,k的計算方法如下:

機器學習算法是模擬人類大腦神經元處理信息機制的算法,傳統神經網絡模型包含2~3 層神經單元,如圖3 所示。傳統神經網絡處理大規模數據的能力有限,通常要經過人工的數據特征提取,將提取后的特征數據作為輸入。

圖3 神經網絡模型
深度學習網絡(Deep Learning Network,DLN)由神經網絡發展而來,其可由5~10 層神經單元構成。因此可以處理更大規模的數據,實現特征的自動提取,具有較高的學習效率。其典型結構,如圖4 所示,由多層受限玻爾茲曼機(RBM)堆疊而成。DLN的訓練方法包含正向傳播與反向傳播兩個過程,正向傳播過程以原始數據作為輸入數據,采用對比散度法進行無監督的預訓練;反向傳播過程根據輸出結果的預測值與實際值的誤差,采用梯度下降法對預訓練得到的參數進行微調。

圖4 深度學習網絡模型
文中將DLN 與DS 理論結合,并將該算法應用于電力變壓器的故障診斷。基于DLN-DS 的電力變壓器多源數據融合模型如圖5 所示。

圖5 DLN-DS多源數據融合模型
以圖1 的油浸式變壓器多源數據作為輸入數據,采用DLN-DS 算法進行故障診斷的步驟流程,如圖6 所示。其包含以下3 個步驟:

圖6 基于DLN-DS的變壓器故障診斷算法步驟
1)采集原始數據,其樣本包含多源特征數據與變壓器故障類型標簽,多源特征數據作為DLN 模型的輸入數據;
2)采用對比散度算法與梯度下降法對DLN 模型進行迭代訓練,直至得到滿足精度要求的DLN 模型;
3)采用DS 證據理論對DLN 模型輸出結果進行數據融合,根據融合結果得到變壓器故障診斷結果。
文中算例采用某省電網2019 年變壓器檢修報告的故障數據,數據樣本總數為1 400 個,每個數據樣本包括油色譜指標L1、油氣試驗指標L2與電氣試驗指標L3共13 組數據。將變壓器故障類型作為數據標簽,常見變壓器故障類型包括局部放電、過溫過熱、中低溫過熱、高能放電和低能放電。
以某次局部放電故障為例,分析采用DS 證據理論進行多元數據融合對變壓器診斷結果的影響。圖7 為各證據體關于局部放電故障的信任度。可以看出,只選取單種數據時信任度在0.2~0.4 范圍內;選取兩種數據時信任度在0.5~0.7 范圍內;同時選取3 種數據時信任度為0.784。雖然不同數據方案下均能判斷故障類型為局部放電,但采用3 種數據進行融合決策,結果更直觀、明顯,可以提高故障診斷的準確率。

圖7 局部放電故障各證據體的信任度
選取不同數據方案的變壓器故障診斷準確率,如表1 所示。只選取單種數據時平均準確率低于85%;選取兩種數據時平均準確率低于95%;同時選取3種數據信任度時,平均準確率高達98.1%。由此可見,采用多種數據融合方案具有更高的診斷準確率。

表1 不同變壓器故障類型診斷準確率(%)
為對比深度學習算法與其他機器學習算法在變壓器故障診斷應用上的差異,將上述變壓器故障多源數據樣本作為輸入數據。機器學習模型構建方面分別選用BP 神經網絡(BPNN)與支持向量機(SVM),均將其與DS 證據理論相結合,形成BPNN-DS 和SVM-DS 算法。各類機器學習算法故障診斷結果如表2 所示。

表2 各類機器學習算法故障診斷結果
由表2 可知,故障診斷平均準確率DLN-DS>SVM-DS>BPNN-DS,因為DLN 算法相比于BPNN與SVM 算法更適應大量數據的應用場景,具有較高的故障診斷準確率。
文中以油浸式變壓器為例說明多源數據選取原則,構建電網多源數據體系,分析基于DS 證據理論的多源數據融合決策算法,進一步提出基于DLNDS 算法的電力變壓器故障診斷算法。由算例仿真分析可知,通過DS 證據理論進行多源數據融合,能夠更加明顯、直觀地得到故障診斷結果。多源數據融合決策相比于單源數據單獨決策或雙源數據融合決策,具有更高的故障診斷準確率。DLN 算法比BPNN 或SVM,具有更理想的故障診斷準確率。