葉任時,馬書民
(長江設計集團有限公司,湖北 武漢 430061)
變壓器內部的絕緣油是由許多不同分子量的碳氫化合物組成,一旦變壓器內部發生潛伏性故障,放電或過熱現象會導致絕緣油中C—H 鍵和C—C 鍵斷裂,由此產生的氫原子或自由基通過復雜的化學反應迅速重新化合,進而快速形成氫氣和低分子烴類氣體。特別是,隨著故障進程的不斷發展,絕緣油中的溶解氣體組成也隨之慢慢發生變化。因此,分析油中溶解氣體的組分和含量是監視充油電氣設備安全運行最有效的措施之一。
在此基礎上,若能通過大量數據分析歸納絕緣油內部氣體含量的變化規律,并在一定程度上對其發展趨勢進行預測,則能在變壓器內部故障嚴重之前,甚至在故障發生之前提前安排相關檢修,避免可能出現的事故。值得注意的是,電弧放電、局部放電等故障由于具有瞬發性和高能性,不是簡單的隨機過程,而是混沌過程,只能通過當前油色譜數據進行檢測判斷,不在預測評估的范疇之內[1]。
目前,國內外已有部分學者針對絕緣油內部的氣體量預測開展了相關研究[2-4],現有研究工作表明,油中氣體溶解濃度變化趨勢具有一定的規律性或可預測性,但總體而言現有預測方法的精度還有進一步提高的空間[5-6],而且變壓器在不同工況下的油色譜發展規律不盡相同,僅采用單一算法難以保證不同工況下的預測精度,同時當歷史油色譜數據出現較大幅度的波動時,單一預測算法會得到誤差較大的離散點,方法的魯棒性有待提高[7]。此外,對于相同的數據樣本,單一算法的預測結果可能是正誤差(預測結果大于實測值),也可能是負誤差(預測結果小于實測值)[8]。因此,針對這樣的特征,有學者提出將多種單一預測方法進行組合[9-11],在某種準則下構建最優化模型,以期實現中和預測誤差、減小誤差波動范圍、提高預測精度的目標。但是,這些組合方法均是針對某一特定應用場景、以固定的幾種單一預測方法進行組合,方法的普適性有待提高。組合預測方法的關鍵在于組合權重的確定,目前有學者通過計算預測誤差的協方差矩陣構建最優化組合預測模型,求解得到最優的自適應變權重系數[11],為本文油氣組合預測方案中權重系數的確定提供了有益的啟迪。但上述方法采用均方誤差作為概率分布預測模型的損失函數,在梯度參量下降時存在學習速率降低的問題。
此外,現有的研究成果絕大部分側重于預測方法理論的研究,缺乏實際工程場景的應用。在目前的實際運維中,工作人員僅能通過關注狀態量數值是否超標來對設備的異常狀態進行判斷及處理,無法基于預測結果進行設備狀態變化的預警。
針對上述不足并結合現場實際情況,本文提出了一種基于信息熵組合的油中溶解氣體含量預測方法。首先基于前期收集到的變壓器運行數據樣本對常用的預測算法進行比較,選取相對表現最優的兩種算法建立本文的預測模型,其次利用多信息融合技術,運用信息熵組合預測算法,將選取的神經網絡與支持向量機算法進行有機組合,綜合考慮多項造成預測誤差因素的影響,并運用熵權法分配各因素的權重。最后,通過與常用的最優權重組合預測算法以及原有算法的對比,驗證本文所提算法的優越性與可靠性。
目前預測算法種類繁多,但不同的預測方法對不同場景具有不同的適應性。為尋找到最適合預測油中氣體含量變化規律的方法,本文選取平均誤差以及最大誤差作為預測方法的篩選指標,其數值上越小,則預測精度越高,對油中氣體預測的適應性也越強。其中,平均誤差的定義如式(1)所示:
式(1)中,δˉi表示第i種預測算法的平均誤差,n表示數據 樣 本 的 總 量,y?ij表 示 實 際 測 量 值,yˉij表 示 算 法 預測值。
在此基礎上,選擇了支持向量機、RBF 神經網絡、灰色理論、回歸分析、遺傳算法、蟻群算法、模糊數學法以及貝葉斯網絡這8 種常見的預測算法作為待選算法,并利用收集到的1 000多組油浸絕緣電氣主設備正常工況下的運行數據進行預測訓練,得到的訓練誤差如表1所示。

表1 常見預測算法的誤差比較Table 1 Error comparison of common prediction algorithms
從表1 可以看出,支持向量機和RBF 神經網絡算法在進行油色譜預測時,相比于其他預測方法,預測平均誤差與最大誤差都能有較優異的表現。因此,本文選用支持向量機與RBF神經網絡算法進行預測。
但值得注意的是,并不是所有場景都要選取支持向量機和RBF神經網絡預測方法兩種算法,也并沒有規定只能選取兩種方法進行組合。事實上,如果有多種預測方法同時表現得較為優異,此時可以選取多種預測方法進行組合,本文只是提供一個組合預測思路,具體選取方法根據實際場景決定。
RBF 神經網絡屬于前向神經網絡類型,網絡的結構與多層前向網絡類似,是一種三層的前向網絡,具體如圖1 所示[12-13]。第一層為輸入層,由信號源結點組成;第二層為隱含層,隱含層節點數由所描述問題的需要而定,隱含層中神經元的變換函數即徑向基函數是對中心點徑向對稱且衰減的非負非線性函數,該函數是局部響應函數,而以前的前向網絡變換函數都是全局響應的函數;第三層為輸出層,它對輸入模式做出響應。

圖1 徑向基神經網絡結構示意圖Fig.1 Diagram of radial basis function neural network structure
在RBF 網絡中,輸入層僅僅起到傳輸信號的作用,與神經網絡相比,輸入層和隱含層之間可以看作連接權值為1的連接。輸出層和隱含層所完成的任務是不同的,因而它們的學習策略也不相同。輸出層是對線性權進行調整,采用的是線性優化策略。因而學習速度較快。而隱含層是對激活函數(格林函數或高斯函數,一般取高斯函數)的參數進行調整,采用的是非線性優化策略,因而學習速度較慢。
RBF 神經網絡算法用于點預測時自身需要確定3個參數:基函數的中心、方差及隱含層到輸出層的權重,這幾個參數會影響RBF 神經網絡的泛化性能。RBF的輸出可表述為:
式(2)中,N為隱層單元總數,t= 1,2,…,m,m為訓練樣本總數。
SVM 利用回歸算法解決預測問題,其中回歸算法分為線性回歸和非線性回歸[14]。其中線性回歸給定訓 練 樣 本 集{(x1,y1),(x2,y2),…,(xt,yt)},其 中xi∈Rn,yi∈R,則回歸線性方程可以用式(3)表示:
最佳線性回歸函數可以轉化為求解式(4)中函數的最小值得到,如式(4)所示:
式(4)中,C表示懲罰因子,ξ、ξ?表示松弛變量的上下限,且滿足約束條件如式(5)和式(6)所示:
式(5)、式(6)中,ξ≥0,ξ*≥0,i= 1,…,k。在此基礎上,為求解該最優問題,本文引入Lagrange函數,如式(7)所示。

影響SVM預測精度的主要有三方面因素:正則化參數、不敏感參數以及核參數。其中正則化參數影響了模型的泛化特性,不敏感參數影響了支持向量的數量,而核參數則反映了訓練樣本數據的分布或范圍特性。適當的參數選擇可以更精確地對數據進行預測。
算法的選擇只是預測的第一步,為了得到準確的預測結果,還需要對算法本身進行相應的優化調整與改進。不同的函數模型均有其自身對應的參數需要根據數據樣本進行擬合,而這些參數需要隨著數據樣本的變化作出自適應改變,從而更好地對數據進行預測。特別是在訓練數據樣本不完善的情況下,預測誤差將顯著增大。因此,需要將不同算法進行有機組合,揚長避短,充分發揮算法的優勢,盡可能地減小預測誤差。
考慮到影響充油設備油中溶解氣體濃度的因素很多,但暫時無法獲取完整的相關因素的統計數據,所以僅能劃分不同的時間區間(日、周、月),通過分析待預測氣體的歷史數據來預測其未來發展趨勢。事實上,僅用單一預測模型進行預測時,因其考慮角度的局限性、信息選擇的片面性以及信息利用程度的差異性,導致其預測精度不高且穩定性差。而組合預測法能很好地綜合各種單一預測算法的優勢,更大限度地發揮不同方法的優點,做出正確的預測[16]。
經調研可知,目前主要使用的組合預測算法是最優權重組合預測,具體步驟是:對于各種單項預測模塊,先計算各自的最優權重,形成組合預測模型,然后加權綜合求出最終的預測結果。目前對于最優的標準,多是按照測量誤差平方和最小為原則,采用拉格朗日乘子,進行最優權重的計算。然而,最優權重組合預測算法也存在著問題,在計算中往往只能考慮單一因素的影響,因而精度還是受限[17-18]。為了解決這個問題,本文引入了基于信息熵的組合預測算法,該算法可以綜合考慮多項因素的影響,并運用熵權法智能分配各因素的權重,使預測精度進一步提高[19]。
熵權法可以綜合各預測模型的重要性和指標提供的信息量這兩方面更客觀地確定各模型的最終權重。某個預測模型的信息熵越小,表示該模型的變異程度越大,所提供的信息量越多,即在整個預測過程中起到的作用越大,其權重也越大[20]。本文采用的組合預測模型使用多種評價指標來評判各單一預測方法的預測精度,評價指標j(j= 1,2,…,q)的重要性熵值如式(9)所示:
式(9)-式(13)中,Nij為各評價指標參數值相對于各評價指標的接近程度,x表示訓練樣。
由于信息熵e(dj)可用來衡量評價指標j信息的有用程度,信息熵越小則評價指標j的有效程度越高,因此用hj來評價指標j的信息效用程度hj=1-e(dj)。
利用熵權法計算各評價指標的客觀權重,實質上是利用該評價指標信息的效用價值系數來計算的,效用價值系數越高,對評價的重要性就越大,于是得到評價指標的客觀權重值θj如式(14)所示。
最后,利用上個步驟求出的信息熵,可求出預測方法i的熵權值,即對應的權重值[21]:
由《Q/GDW169-2008油浸式變壓器(電抗器)狀態評價導則》[22]可知,充油設備內部的絕緣材料在放電或過熱情況下,會產生各種特征氣體。其中對充油設備故障診斷分析有價值的特征氣體主要有氫氣(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)和乙炔(C2H2)。這里以H2為例,對其含量進行預測分析。為了比較預測值與實測值,采用預測的相對誤差和平均相對誤差來評價算法的預測結果,定義如下:
式(16)、式(17)中y為實際監測值,y?為模型預測值,n為樣本個數。
綜上,所提基于信息熵的組合預測算法的具體思路如圖2所示。

圖2 基于信息熵的組合預測算法思路流程圖Fig.2 Flow chart of combined prediction algorithm based on information entropy
為驗證所提算法的優越性,本文以北京某220 kV發電廠主變在線監測數據為樣本,分別采用RBF、SVM、最優權重算法以及組合算法進行預測。需要說明的是,不同的預測場景存在不同的最優預測算法,然而本文的重點在于比較組合算法相較于單一算法以及傳統最優權重算法的優越性,單一預測算法的最適性或者最優權重算法的優化并非本文研究的重點。
在此基礎上,本文所采用的在線監測數據以天為監測間隔,使用2017/11/2 至2018/5/10 的數據作為預測模型的訓練樣本,且數據樣本中不包含突變型數據,最終預測未來31 d(2018/5/11 至2018/6/10)H2含量的變化,實際值與預測結果如表2 所示。其中,x表示實際值,RBF、SVM、最優權重算法以及組合算法的預測結果分別以x1、x2、x3、x4表示,各預測算法與實際值的相對誤差分別以y1、y2、y3及y4表示。

表2 RBF神經網絡和SVM預測模型的預測值與實際值對比Table 2 Comparison between predicted value and actual value of RBF neural network and SVM prediction model
進一步地,各單一預測方法、組合預測及真實值的數值曲線如圖3 所示,基于信息熵的預測算法與最優權重組合預測算法的對比結果如圖4所示。

圖3 基于信息熵的組合預測與單一預測方法對比結果Fig.3 Comparison of combined forecasting and single forecasting methods based on information entropy

圖4 基于信息熵的組合預測與最優權重方法對比結果Fig.4 Comparison of combination forecasting and optimal weight method based on information entropy
結合表2、圖3、圖4 可知,本項目使用的基于信息熵組合預測算法的平均相對誤差不僅遠小于RBF 神經網絡和SVM兩種單一預測模型的平均相對誤差,還小于基于最優權重組合預測算法的平均相對誤差,因此所提基于信息熵組合預測算法相較于單一算法具有顯著的優越性。
本文所提出的故障甄別流程是基于預測數據和實際數據的對比,實現對真實故障和運行環境變化所帶來的數據突變的甄別,其具體步驟如下所述:
將第N天的實測值與基于0~N-1天的實測數據做出的第N天的預測數據進行比對,如果兩者偏差較大(這里設置一個門檻值,為之前預測統計平均誤差的兩倍,正常的預測不會達到這個誤差值。如果出現這個偏差,證明油浸絕緣電氣主設備運行出現了變化),存在兩種可能,一種是運行工況變化,如變壓器突然重載造成預測數據與實測值的暫時性背離。這個重載工況消失以后,后續的實測數據應該將會向基于預測做出的軌線回歸。第二種就是實際發生了故障,后續的實測數據將會與基于預測的軌線存在持續性的背離。
基于上述分析,進行第N+1天預測時,應以第N天的預測值而不是第N天的實測值填入預測序列,而預測序列第1~N-1 天的值均為實測值,預測得到第N+1天的預測值。
如果第N+1 天的預測值與其實測值依然吻合,則初步斷定第N天的實測值與預測值偏離是擾動引起,則對第N+2 天的預測依然是第N天用預測值,其他天均用實測值來進行預測,如果第N+2 天的預測值與實測值吻合,那么基本可以斷定系統未發生故障,且形成的預測序列是可信序列。
如果第N+1 天的預測值與其實測值背離,則初步斷定第N天的實測值與預測值偏離是故障引起,這時應該調用故障診斷模塊進行診斷,判斷出具體故障類型。
如果故障比較嚴重,變壓器停運檢修,預測結束。如果故障不太嚴重,變壓器帶病運行,在誤差允許的條件下,將預測數據窗內全部填入實測值進行預測。也可以將之前的預測序列清空,之后的每一天將實測值填入預測序列的數據窗(一般會用到7 d的數據,每天采集1 個點),直到數據窗填滿,具備預測的條件后再啟動新的預測。此時可以對帶病運行的變壓器是否會發生新的故障或經歷擾動進行新一輪的判斷。
基于上述思路,本文將所提基于信息熵組合預測算法應用于實際場景中,得到以下算例。
3.2.1 算例一
某220 kV 變壓器在2014 年7 月20 日出現輕瓦斯保護動作,根據三比值法判斷為中溫過熱故障。實際上該設備在2014年6月25日就出現了總烴含量超標,根據三比值法判斷為低溫過熱故障,但由于產氣速率較慢(3.8%),該故障會如何發展未知,因此運維人員并未采取應對措施。本文收集了該變壓器前溯1年的油色譜數據,分別采用RBF、SVM以及由本文所提組合預測方法(兩種算法組合)對2014 年7 月1 日-2014 年7 月30 日的油中溶解氣體含量進行預測,針對每一種方法獲取得到的油中氣體含量數據系列,采用三比值法判斷變壓器是否發生故障以及故障類型,三種方法均成功判斷出設備將發生中溫過熱故障的趨勢。其中RBF 算法為正誤差(即預測狀態異常早于實際時間),SVM算法為負誤差(即預測狀態異常晚于實際時間),預測結果如圖5所示(以H2為例)。

圖5 預測對比結果(場景1)Fig.5 Comparison results of prediction (Scenario 1)
由圖5中的對比結果可以看出,RBF算法、SVM算法以及組合方法預測設備故障狀態躍變為中溫過熱的時間分別在2014年7月12日、2014年7月26日及2014年7月19日。
RBF算法預測結果相比實際情況提前了8 d,雖然可以更早地發出報警信號,但如果采用RBF算法的預測結果,則運維人員將在2014 年7 月9 日開始調集檢修資源,而實際上2014 年7 月12 日設備狀態尚未躍變,繼續等待至2014 年7 月15 日仍未提示異常,則將會解除檢修計劃,而到了2014年7月20日設備狀態躍變發生時又需要緊急調集檢修資源,這樣就造成了檢修資源的往復浪費,增加了檢修成本。
SVM 算法的預測結果比實際情況滯后了6 d。如果采用SVM算法的預測結果進行檢修準備,即在2014年7 月19 日才開始調集檢修資源,僅僅比故障實際發生時間提前了1 d,因此,該預測算法未達到規避應急檢修的目的。
相比上述3 種方法,本文所確定的組合方法的預測結果與實際情況最相近(提前1 d),因此采用組合方法結果能夠為運維部門提供最為準確有效的檢修提示,彌補了其余單一方法的不足,避免了檢修資源的浪費,這也充分說明了高精度預測的必要性。
3.2.2 算例二
再采用另外一組實例來說明預測結果均為負誤差的場景。某220 kV 變壓器在2013 年4 月17 日出現輕瓦斯保護動作,根據三比值法判斷為中溫過熱故障。實際上該設備在2013年3月8日就出現了總烴含量超標,根據三比值法判斷為低溫過熱故障,但由于產氣速率較慢(2.5%),該故障會如何發展未知,因此運維人員并未采取應對措施。本文收集了該變壓器前溯1年的油色譜數據,分別采用RBF、SVM以及由本文所提組合預測方法(兩種算法組合)對2013 年4 月1 日-2013年4月30日進行預測,結果如圖6所示(以H2為例)。

圖6 預測對比結果(場景2)Fig.6 Comparison results of prediction (Scenario 2)
由圖6中的對比結果可以看出,RBF算法、SVM算法以及組合方法預測設備故障狀態躍變為中溫過熱的時間分別在2013年4月24日、2013年4月18日及2013年4月19日。
RBF算法預測結果相比實際情況滯后了7 d,如果采信該結果進行檢修準備,則中溫過熱故障已經發生時,檢修準備工作才剛剛開始,沒有達到提前準備、避免應急檢修的目的;SVM算法的預測結果相比實際情況滯后了1 d,采信該結果進行檢修準備的時間裕度為6 d;信息熵組合預測算法的預測結果相比實際情況滯后了2 d,采信該結果進行檢修準備的時間裕度為5 d。
由此可見,當所有預測算法的誤差均為負誤差時,即預測結果均滯后于設備狀態異常的實際時間,則各類預測方法的檢修準備時間裕度均受到一定影響,甚至出現了剛進行檢修準備時故障就已經發生的情況。但是,在此情況下,組合預測算法仍能保證預測結果與實際結果的偏離程度在可承受范圍之內(提前5 d 安排),能夠為安排檢修提供一定的時間裕度。
類似地,在所有預測方法誤差均為正誤差時,某些單一方法的檢修準備提前量可能過大,在目標日期到達后,接下來的ΔT2天內,仍未能將實際的異常情況或故障工況囊括在內,則檢修待命狀態解除。但是,幾天后設備出現異常工況報警,則需重新調集檢修資源,又陷入了應急檢修的困局。上述場景直接對應的是場景1 中RBF 方法的預測結果。對于上述風險,某一類單一預測方法的出現概率是最大的,而由于組合方法是基于各類單一預測方法的優化組合,其啟動應急檢修的風險介于各類單一方法之間。
綜上,當各類單一預測方法的誤差沒有呈現單向性(即誤差有正有負)時,組合方法總體上優于所有參與組合的各個單一方法。當各類單一預測方法的誤差呈現單向性(即誤差均為正或均為負)時,在某個特定的場景下預測結果不一定最優,但是從統計意義上來說,組合方法可以保證在全局范圍內結果最優。
當選擇的觀測和預測指標恰當時,組合預測方法及其結果的應用方法同樣適用于其他電網設備。此外還需指出的是,目前運維人員對預測結果的信任程度可能不高,如果完全依據預測結果,在狀態被判定為劣化時提前進行檢修,則將造成預測結果無法后驗證的后果,即無法確定此次提前檢修是否正確、是否過檢修。因此,在試運行期間,應該充分累積數據,結合定期檢修或其他形式狀態檢修的結論,驗證組合預測方法判別結果的準確性,最終,以保證既不喪失預測功能,又能保證有足夠的時間裕度提前安排檢修為目標,合理整定ΔT、ΔT1及ΔT2的值。
針對單一預測方法在不同場景應用下的局限性,本文提出了一種具備普適性的變壓器油中溶解氣體含量組合預測方法,并基于該預測方法形成了一套完整的故障甄別流程,最終通過仿真驗證形成以下結論:
1)相比于傳統的單一型預測方法,本文所提出的組合預測優選方法可以綜合考慮多項因素的影響,并運用熵權法智能分配各因素的權重,在預測結果上具有更高的精度;此外,本文所提出的預測方法能根據不同場景選定最合適的預測方法組合,避免了單一預測方法的局限性,保證了預測結果的可靠性。
2)基于所提出的組合預測方案,本文進一步形成了一套基于時間窗的故障甄別流程。相比于傳統故障甄別方法呈現的誤差單向性,所提故障甄別流程在全局范圍內具有最優的預測結果,對現場運行具有指導作用。
3)本文所提出的方法不僅適用于變壓器油中溶解氣體的預測,同樣也可以適用于電力系統其他方面的預測工作。在后續的研究中,宜拓展組合預測方法的應用范圍,形成一套完整、普適的工業化應用方案。