趙志新,趙宗羅,趙 穎,王子凌,俞建飛,李忠民
(1.國網浙江富陽市供電有限公司,杭州 311400;2.國網浙江省電力有限公司電力科學研究院,杭州 310014;3.西安交通大學 電氣工程學院,西安 710049)
作為電力系統的重要組成部分,配電網承擔了由電網主干部分向各實際用電客戶分配電能的重要任務。與主網相比,配電網發展相對落后,整體架構較為薄弱,網絡拓撲結構較為單一,故障率較高。據相關統計,配電網故障造成的電網區域性停電事故占比達80%以上[1]。因此,保障配電網的穩定運行,是進一步提升電網可靠性及供電質量的重要途徑[2]。對于配電變壓器各類故障的檢修工作,目前仍以預防性檢修及故障后搶修方式為主。上述方式存在明顯的弊端:定期檢修方式存在檢修不及時、檢修過度等問題;故障后搶修屬應急維修手段,故障問題已經造成實際經濟損失。隨著電網投資逐步向配電網傾斜[3],各類多運用于主網的設備在線監測技術,如油中溶解氣體分析、電能質量檢測、局部放電監測及紅外成像監測技術,逐步在配電網設備運維工作中推廣使用。集成配電網設備狀態監測、運行調度等數據的統一化信息平臺也已初步建立,但相關技術在配電網設備狀態檢修中的應用仍處于起步階段。
就配電變壓器而言,實現其狀態檢修的關鍵在于開展設備故障預測與診斷工作,以準確判斷其運行狀態,并依此輔助制定檢修策略。
配電變壓器故障一般可按故障發生位置劃分為外部故障和內部故障兩大類,外部故障即變壓器油箱、套管及引線等裸露部分出現的故障,內部故障包括各類變壓器箱體內部的放電及過熱故障[4]。目前,配電變壓器故障監測及診斷手段包括絕緣油試驗、局部放電試驗及紅外成像試驗等,其中DGA(溶解氣體分析)技術由于不受外部環境因素的干擾,是有效的內部故障監測手段。DGA 基于油中溶解氣體類型與內部故障的對應關系,采用氣相色譜儀分析溶解于油中的氣體,根據氣體的組分和含量來判斷變壓器內部有無異常情況,并判斷故障類型、大概部位、嚴重程度和發展趨勢,能夠實現變壓器的不停電檢測和早期故障診斷,并在此基礎上發展出了三比值法和特征氣體判別法等故障判斷方法。另一方面,隨著信息智能化處理技術的廣泛應用,國內外學者結合數據挖掘技術,如ANN(人工神經網絡)[5-7]、SVM(支持向量機)[8-11]及貝葉斯網絡[12-15]等,提出了許多基于DGA 的變壓器智能故障診斷方法。其中以基于ANN 方法的設備故障診斷技術應用最為廣泛,但目前該類方法存在一些共性問題,包括網絡訓練時的收斂速度較慢、分類結果易陷入局部最優值等[16-17],不利于實際應用。
針對目前基于ANN 方法的變壓器故障診斷技術存在的主要問題,本文提出一種基于MapReduce 并行化的BP(反向傳播)神經網絡算法——MR-BPNN 算法,以實現對于配電變壓器故障的快速診斷,并借助Hadoop 平臺實現MR-BPNN的優化運行。最后,基于所采集的某電力公司配電變壓器油中溶解氣體數據,驗證所提方法運用于設備故障診斷時的有效性。
ANN 按學習策略可粗略地分為兩大類:有監督的ANN 和無監督的ANN。
BP 神經網絡是一種典型的有監督前饋型ANN,由非線性變換神經單元組成,一般呈現多層結構,具備優秀的非線性映射逼近能力與預測性能。
神經元(Neuron)也稱為節點(Node),是ANN的基本單元,同層中的神經元具有相同的非線性轉換函數,不同層的神經元則可能具有相同或不同的非線性轉換函數。組成BP 神經網絡的神經元模型如圖1 所示,主要由5 部分組成:

圖1 BP 神經網絡神經元模型
1)輸入。x1,x2,x3,…,xp為神經元的p 個輸入變量。
2)網絡權值與閾值。x1,x2,x3,…,wp為網絡權值;b 為神經元的閾值(或者稱為偏置值)。
3)求和模塊。

4)傳遞函數f。對求和模塊的計算結果進行函數運算,得到神經元的輸出。
5)輸出。輸入變量經神經元加權求和,得到最終的輸出o=f(wx+b)。
BP 神經網絡一般由輸入層、隱含層和輸出層組成。圖2 描述了典型的3 層BP 神經網絡的拓撲結構,其中圓圈表示神經元。

圖2 三層BP 神經網絡的拓撲結構
數據經過標準化處理后,由BP 神經網絡的輸入層輸入,再經施以權重后傳輸到隱含層,數據在隱含層進行權值和閾值的調整以及激勵函數的運算,并將處理好的數據傳輸到輸出層,由輸出層輸出數據的預測值,將此預測值和期望值相比,如果有誤差,則將誤差從輸出層反向傳播,根據誤差的大小對權值和閾值進行相應的調整,使BP 神經網絡的輸出逐漸與期望值一致。
直接采用BP 神經網絡進行色譜數據分析時,學習過程誤差收斂速度較慢,權值的調整可能需要數萬次才能收斂,計算量龐大,故本文提出采用Hadoop 集群計算平臺,從而實現BP 神經網絡的并行化計算,大幅度提升訓練效率。
Hadoop 是 由Apache Software Foundation 公司開發的開源集群計算平臺軟件框架,可以讓用戶在廉價的計算機集群上部署運行。Hadoop 為程序的分布式運行提供了大量的接口和服務。Hadoop 由9 個項目構成,如圖3 所示,每個項目的功能如表1 所示。

表1 Hadoop 組成項目功能

圖3 Hadoop 的組成結構
Hadoop 集群計算平臺中的MapReduce 模型是本文的應用重點,其由Map 和Reduce 兩階段組成,Map 階段對任務進行分解,Reduce 階段對子任務結果進行匯總。HDFS(分布式文件系統)負責數據存儲,當獲得大型數據集后,首先要存儲到HDFS 中,實際文件存儲到集群中的多個節點上,然后再經MapReduce 將數據集分成更小的數據塊進行處理。
對于BP 神經網絡而言,MapReduce 并行化包括兩個過程:第一個是Map 過程,該過程將數據集分成多個數據塊,每個數據塊作用于一個計算節點中的神經網絡,計算節點中的神經網絡訓練數次后滿足收斂條件則輸出神經網絡權值;第二個過程是Reduce 過程,匯總Map 過程輸出的神經網絡權值,若權值偏移量小于一定的閾值,則停止迭代,輸出最終結果。以下對上述過程的設計進行詳細闡述。
在Map 過程中,計算節點從HDFS 中讀取神經網絡初始權值,然后根據初始權值設定一個BP 神經網絡,并讀取訓練樣本數據塊,訓練BP神經網絡,當訓練達到收斂條件后,就認為在該計算節點上基于該訓練樣本數據塊訓練的網絡收斂。Map 以一組鍵值對

圖4 BP 神經網絡的Map 流程
Reduce 過程的輸入是Map 過程輸出的鍵值對組,獲取Map 輸出的網絡權值,并根據value的數目和value 的累加和計算權值的算術平均值,然后讀取HDFS 中存儲的神經網絡權值,將其與更新的權值對比,求差值。如果差值小于設定的閾值,則停止迭代,輸出權值;否則用訓練后的權值替代HDFS 中的權值,作為下次Map 迭代訓練任務的初始權值。并行化BP 神經網絡的Reduce 流程如圖5 所示。

圖5 BP 神經網絡的Reduce 流程
為了測試本文所提方法的性能,以下通過針對配電變壓器的故障診斷實例進行說明,所使用的數據來自于某電力公司2015—2020 年的配電變壓器檢測數據,挑選其中的357 臺配電變壓器共計2 642 條數據作為樣本數據集。
初始化階段首先選取配電變壓器油中溶解氣體H2,CO,CO2,CH4,C2H6,C2H4,C2H2和 總 烴的含量數據作為網絡的輸入。對于所采集的任意類型氣體數據,均采用極大-極小法進行歸一化:

式中:xi為任意種類的氣體含量值;為xi經歸一化處理后的值;max(xi)為所有該類氣體含量值中的最大值;min(xi)為所有該類氣體含量值中的最小值。
在運用MR-BPNN 算法前,首先根據數據集特性確定隱含層節點的選擇方法。隱含層節點是為了從樣本數據中抽象出并存儲其隱含信息,節點數越少,神經網絡的學習時間越短,學習過程中忽略的隱含信息越多,對樣本變化規律描述性能越差;相應地,隱含層節點數越多,存儲的信息就越多,但過多的節點數會導致神經網絡的學習時間過長,學習過程中可能出現過度擬合問題,即將噪聲作為知識進行識別。隱含層節點數的確定取決于樣本的個數與維度,目前常用的方法為試湊法,即采用不同隱含層節點數進行訓練,選擇網絡誤差最小時的節點數。
通過計算不同隱含層節點數網絡的收斂性可以發現,就本例而言,當隱含層節點數為10 時誤差曲線振蕩較小、收斂速度最快,因此確定隱含層節點數為10。測試過程在Hadoop 集群計算平臺上進行編程實現,每種情況循環運行10 次,取各指標相應的均值。
設置隱含層節點數后,利用百葉窗分組策略將原始數據集隨機劃分為訓練集(占比80%)和驗證集(占比20%),訓練集用于訓練神經網絡權值分配,驗證集用于評估模型分類性能。隨后需要確定輸出特征向量,為簡化說明,選擇過熱和電弧放電這兩個變壓器典型故障類型的發生概率作為神經網絡的輸出向量,以0~1 的數值表示對應的故障程度,數值越大表示發生此類故障的概率越大,并設定該網絡輸出層神經元節點數為2。
MR-BPNN 算法執行過程中的參數變化情況如圖6 所示,包括均方誤差隨迭代次數變化曲線(性能曲線)、梯度變化曲線、檢驗錯誤數曲線以及學習率變化曲線等。

圖6 MR-BPNN 算法執行過程中的參數變化情況
完成數據初始化及網絡訓練過程后,運用基于溶解氣體驗證集數據,評估MR-BPNN 算法針對配電變壓器故障診斷的性能,并將診斷結果與特征氣體法、三比值法的診斷結果進行對比。表2 給出了不同方法針對部分典型樣本和部分特征氣體的故障診斷結果示例,表3 對比了MRBPNN 與BP 神經網絡基于相同油中溶解氣體數據集實現故障診斷時的運行時間。

表3 MR-BPNN 與BP 神經網絡實現配電變壓器故障
實驗結果顯示,基于給定驗證集,應用MRBPNN 算法、特征氣體法、三比值法對配電變壓器故障診斷的準確率分別為91.67%,58.33%和75%。由表2 中典型診斷結果可見:由于三比值法中提供的編碼是由實際案例總結得到,應用過程中編碼缺失問題較為嚴重,許多情況下無法得到診斷結果;特征氣體法存在無法全面反映故障狀況的問題,易產生誤判;相比其他兩種方法,采用MR-BPNN 算法對同一故障性質進行判斷的準確率有顯著提高。另一方面,MapReduce 的引入將數據集進行了拆解,并為每個數據塊分配單獨的處理單元,同時集合Map 過程、Reduce 過程實現迭代過程的并行化,從而在相同故障診斷準確率的前提下提升收斂速度。

表2 典型故障診斷結果對比
通過對部分故障變壓器進行拆解檢修,進一步驗證了所提方法用于配電變壓器故障診斷時的準確性。以表2 中最后一行色譜數據所對應配電變壓器為例,其出現故障運行狀態后,油箱外觀正常,套管瓷瓶無破損,壓力釋放閥正常,油位計顯示油量不足。試驗人員首先對設備本體進行了多項試驗,結果表明:配電變壓器高壓側直流電阻、變比試驗及空載損耗測試結果不合格。通過對配電變壓器進行離線油色譜分析,發現H2,C2H2及總烴含量不合格,初步提示故障類型為電弧放電。隨后,對故障變壓器進行了吊芯解體,發現B 相繞組高壓側與下鐵軛之間有銅屑,切開后發現第5 層線圈開始出現擊穿部位,油道位于第5、第6 層線圈之間,證實故障類型為電弧放電,與本文方法診斷結果一致。
本文針對配電網設備狀態檢修工作中的設備故障快速診斷問題,提出了一種基于MapReduce并行化的BP 神經網絡算法——MR-BPNN 算法。相比于傳統的特征氣體法和三比值法,該方法的故障判斷準確率明顯改善,且Map 和Reduce 過程的引入使其在相同故障診斷準確性前提下的算法執行效率相較傳統BP 神經網絡有顯著提升。MR-BPNN 算法可實現配電變壓器狀態的快速識別與診斷,為開展其狀態檢修工作打下良好的基礎。