王曉蓉
(陜西省地方電力(集團)有限公司,西安 710061)
變壓器是電力系統中必不可少的電氣設備,其可靠性直接影響到電力系統的安全[1],溶解氣體分析(Dissolved Gas Analysis,DGA)技術是判斷變壓器狀態的主要方法。與局部放電監測方法相比,它具有更強的抗干擾能力,在世界范圍內得到廣泛應用[2]。DGA在線監測系統可在一個監測周期內獲得8種氣體濃度,根據這些實時監測值,報警系統將實時瓦斯濃度及其上升率與設定的報警閾值進行比較,來判斷變壓器的運行狀態。因此,合理設置預警閾值是保證預警準確率的關鍵[3]。
對于預警閾值的設置,已經存在多種方法,文獻[4]提出了一種新的圖解法,基于所有8種氣體,一氧化碳(CO)和二氧化碳(CO2)作為重要指標。文獻[5]也提出了一些新的指標,為克服傳統圖論方法的矛盾,采用基于特征氣體的圖形化技術對變壓器故障進行了診斷。以上基于圖論和新準則的方法可以克服一些局限性,但解決模糊邊界問題仍然是一個挑戰。
除了傳統方法,人工智能技術的興起,如人工神經網絡和支持向量機等,也得到了廣泛應用。文獻[6]提出了一個基于模糊邏輯的強大專家系統。此外,文獻[7]將基于模糊邏輯的自適應神經模糊推理系統應用于DGA。文獻[8]使用深部信念網絡(Deep Belief Network,DBN)來反映溶解氣體比率與轉換斷層之間的數學相關性。人工神經網絡、DBN、SVM和模糊邏輯等智能算法雖然可以取得較好的精度,但它們需要大量的樣本數據和專家經驗,并且耗費了大量的計算時間[9]。除此之外,這些方法忽略了變壓器個體之間的差異特征。
為解決上述問題,提出了一種基于大數據挖掘的電力變壓器健康狀態差異預警規則策略??紤]了變壓器個體之間差異設置預警閾值。實驗結果驗證了提出方法的有效性。
由于屬性和運行環境的差異,任何變壓器都與其他變壓器不同。這些屬性包括電壓等級、油型、結構、材料、容量、連接方式、制造等。運行環境包括區域、安裝位置、使用年限、海拔、氣候、負載等。但是,變壓器在每個屬性或運行環境中并未顯示出明顯的差異。因此,選擇最佳分類屬性作為差異分析的基礎。選擇最佳分類屬性的原則是,這些最佳分類屬性應能夠最大程度地反映變壓器之間的差異。根據文獻[10]可知在對現場溶解氣體大數據進行分析的基礎上,區域、使用年限、電壓等級、安裝位置和油型是變壓器分類的影響較大的候選屬性。
根據五個候選分類屬性劃分了共82,948,872條記錄,每個屬性下的詳細分類如表1所示。

表1 根據候選屬性對收集的溶解氣體數據進行分類
對于每個候選屬性,可以應用聚類方法來獲取它們的聚類中心?;诰垲愔行闹g的歐氏距離,可以實現最佳的分類屬性??紤]了四種聚類方法,包括k均值,自組織映射(Self Organizing Maps, SOM)和模糊C均值(Fuzzy C-means, FCM)[11-14]。但是,當考慮聚類效果和計算效率時,FCM是最合適的聚類方法。另一方面,復雜的現場操作環境會導致由變壓器DGA在線監測系統獲得的數據波動很大,而FCM中的模糊方法剛好可以處理這些波動。因此選擇FCM作為聚類方法最為合適。

(1)
(2)
式中λj,j=1,2,…,n表示拉格朗日乘數。
最小化新目標函數的必要條件如下:
(3)
(4)
式中m表示模糊度,控制聚類中心的模糊重疊。并且滿足1.5≤m≤2.5。
以H2、CO、CO2、CH4、C2H6、C2H4、C2H2和TH為數據集X。根據變壓器的性質,將X分為c類。然后采用FCM來計算每個類別的聚類中心。結果顯示在表1中。為了更直觀地說明,在三維(3D)空間中繪制了不同電壓等級分類下的三種典型溶解氣體(H2、C2H2和TH)的聚類中心,如圖1所示。小球代表實際數據,大球代表聚類中心。三維空間中的所有氣體數據均采用最小-最大歸一化方法進行處理。

圖1 3D空間中各種電壓等級下H2、C2H2和TH的聚類中心
如表2所示,由于每個候選屬性下的子組件數不同,因此在不同候選屬性下的聚類中心數目也不同。因此,使用平均歐氏距離來識別一種分類屬性下聚類中心之間的離散度。C={c1,c2,…,ct}(t大于1)包括數據集X={x1,x2,…,xn}(n>t)的t個聚類中心。C的平均歐氏距離定義為:
(5)

表2 八種氣體的聚類中心作為預候選屬性
式中‖·‖ 表示L2-范數;t表示聚類中心的數量。
也就是說,如果一個分類屬性的平均歐氏距離較大,則該分類下的數據更加分散,這表明該分類屬性對溶解氣體數據的影響更大。如果距離較近,則認為不能根據此分類屬性對溶解氣體數據進行有效分類,并且不能很好地反映變壓器之間的差異。經過最小-最大標準化后,表3中顯示了聚類中心之間的距離及其平均歐氏距離。在3D空間中繪制了三種典型溶解氣體的聚類中心及其歐氏距離,如圖2所示。

圖2 H2、C2H2和TH聚類中心在3D空間中的歐氏距離

表3 分類屬性的歐氏距離
根據表3,變壓器的電壓等級、使用年限和油型對設備的影響遠大于區域和安裝位置。換句話說,電壓等級、使用年限和油型可以更有效地反映變壓器之間的差異。因此,選擇這三個屬性作為最佳分類屬性。
在每個分類屬性下的溶解氣體記錄的數量非常大。在文中,將每種分類屬性下的每種氣體濃度數據放入“計算集”中。“計算集”包含從變壓器投入運行的第一天到變壓器狀態改變的所有數據。選擇所有時間的數據,而不是僅僅選擇一段時間的數據,后者無法反映故障的動態和累積特征,因為缺陷和故障發展過程是動態的、累積的并且經常受多個因素影響[15]。
對于每個選定的“計算集”,根據適當的類寬度將計算集的范圍劃分為幾個間隔,并對每個間隔內的氣體濃度數據的頻率進行計數。以氣體濃度為X軸,頻率/類寬度為Y軸,繪制頻率分布直方圖。以220 kV變壓器的H2和500 kV變壓器的TH的頻率分布直方圖為例,如圖3和圖4的深色區域所示。結果表明,從定性的角度看,氣體濃度數據的分布符合Weibull分布。然后,如圖3和圖4中的圓點和線所示,使用Weibull概率圖來驗證該結果。X軸表示對數形式的氣體濃度,Y軸表示Weibull百分位數。圓點是實際氣體濃度,線代表標準的Weibull分布,其形狀和比例如圖3和圖4所示。從圓點和線之間的關系可以看出,實際氣體濃度符合Weibull分布,置信度為99.9%。圖3和圖4中帶有明顯形狀和比例參數的Weibull概率密度曲線的黑線進一步證明了這一結論。

圖3 220 kV變壓器H2的頻率分布直方圖和Weibull概率圖

圖4 500 kV變壓器TH的頻率分布直方圖和Weibull概率圖
僅根據溶解氣體的濃度,仍然很難對故障的嚴重性做出正確的判斷,因為故障通常始于低能量和潛伏放電。還必須考慮故障點的氣體增長率。IEC 60599標準以一年中氣體濃度的絕對增加作為增長率。GB/T7252考慮了變壓器的體積、油密度、氣體濃度,以得出絕對的氣體增長率。IEC 60599中定義的時間跨度太長,這使得實時分析變得困難。很難從DGA在線監測系統獲得變壓器體積和油密度。根據電力負荷的波動特征和現場經驗,采用當前濃度和附近的六個歷史值來計算氣體增長率。根據最小二乘法,線性擬合七個樣本數據以獲得趨勢曲線,并將曲線的斜率作為氣體增長率。
對于氣體濃度樣本數據Y={y1,y2,…,y7},附加了時間戳T={1,2,…,7}。氣體濃度的趨勢符合式(6):
y=f(t)=at+b
(6)
其中a和b是未知參數。Y中每個樣本點的殘差如下:
Ei=yi-(ati+b),i=1,…,7
(7)
目標函數定義為:
(8)
根據波峰定理,當a和b滿足等式(9)時,目標函數F(a,b)達到最小值:
(9)
將該曲線的斜率(式(9)中的a)設定為第7次時間戳的氣體增長率。當斜率為負時,氣體增長率等于零。如圖5所示,獲取了一個變壓器的所有H2數據以計算氣體增長率,其中放大的圖片顯示了擬合過程。

圖5 變壓器中H2的氣體濃度和增長率曲線
使用上述方法,采用220 kV和500 kV變壓器中C2H2和C2H6的氣體增長率來繪制頻率分布直方圖和Weibull概率圖,如圖6和圖7所示。根據這兩張圖,氣體增長率數據也符合Weibull分布,置信度為99.9%。

圖6 220 kV變壓器C2H2增長率的頻率分布直方圖和Weibull概率圖

圖7 500 kV變壓器C2H6增長率的頻率分布直方圖和Weibull概率圖
對于變壓器,其與溶解氣體有關的異常狀況可分為兩種不同的類型,一種是“缺陷”,另一種是“故障”。“缺陷”表示變壓器有故障,但仍可以正常運行?!肮收稀北硎咀儔浩魈幱诜浅乐氐漠惓顟B,需要進行離線實驗和中斷維護。缺陷率和故障率是電網中整個變壓器穩定性的關鍵指標。因此,在文中提出的差異預警系統中,分別為“缺陷”和“故障”定義了溶解氣體的“注意值”和“報警值”。“注意值”和“報警值”是兩個不同的預警閾值,后者大于前者。變壓器狀態與氣體濃度和增長率之間的關系按式(10)進行分析:
(10)
式中C和R分別代表氣體濃度和氣體增長率;CAttn和RAttn分別是氣體濃度和氣體增長率的注意閾值;CAlm和RAlm分別是氣體濃度和氣體增長率的報警閾值。
繪制圖8中的式(10)表示的關系,可清楚地看到溶解氣體分布特征與缺陷/故障率之間的關聯關系。透明的淺色表示實際數據的直方圖。黑線是實際數據的擬合曲線,各區域分別表示來自正常、缺陷和故障變壓器的數據。顏色不同區域的比例分別代表正常率、缺陷率和故障率。

圖8 溶解氣體分布特征與缺陷/故障率之間的關聯
根據以上分析,氣體濃度和增長率數據符合Weibull分布,其特征與缺陷/故障率有關。 因此,可以根據Weibull分布獲得預警閾值。
Weibull分布是可靠性分析和壽命測試的基本理論。它廣泛應用于可靠性工程中,特別適用于金屬材料、電子元器件和其他工程領域的疲勞壽命問題。Weibull分布的概率密度函數定義為式(11),其累積概率分布函數如式(12)所示:
f(x)=(β/η)(x/η)β-1e-(x/η)β
(11)
F(x)=1-e-(x/η)β
(12)
式中β代表形狀參數;η代表縮放參數。這兩個參數可以唯一確定Weibull分布模型。最大似然法通常用于估計這些參數。
對于氣體濃度數據集或氣體增長率數據集X={x1,x2,…,xn},n表示X的數量,θ表示參數列(β,η)。對數似然函數為:
(13)
似然方程為:
(14)
當組合式(13)和式(14)時,可以獲得參數β和η。對于任何分布,如果給出了累積概率,則可以通過使用逆累積分布來獲得與此累積概率關聯的響應值。Weibull分布的逆累積分布為:
x=F-1(p|η,β)=-η[ln(1-p)]1/β,p∈[0,1]
(15)
式中p是累積概率;x是估計值。
根據上述關聯規則,當累積概率等于1-故障率時,可以獲取報警值。當累積概率等于1-故障率-缺陷率時,可以獲得注意值。
對選定的三個最佳分類屬性的缺陷率和故障率進行計算并顯示在表4中。根據挖掘的計算規則來計算這三個最佳分類屬性的注意值和報警值,如表5所示。

表4 最佳分類屬性的缺陷率和故障率

表5 在使用年限、電壓等級和油型分類下的注意值和報警值
對于每個變壓器,可以獲得總共24組氣體濃度和增長率的預警值,涵蓋了八種溶解氣體和三種選定的最佳變壓器屬性。每種氣體在不同屬性下的預警值的交點被當作最終的差異化預警值。氣體數據與注意/報警值之間的關系可以分為注意值以下、注意值與報警值之間以及超過報警值。可以根據那些差異預警值和預警關系來挖掘差異預警規則。將實時氣體濃度和氣體增長率值與不同的預警閾值進行比較,可以分別獲得變壓器的狀態。將氣體濃度和氣體增長率作為二維相關規則,如式(16)所示,可以最終確定變壓器的運行狀態。
(16)
式中C和R分別代表氣體濃度和氣體增長率;CAttn和RAttn是注意閾值;CAlm和RAlm是報警閾值。
根據此規則,變壓器的運行狀態可以分為四個階段:正常、注意、異常、嚴重,如表6所示。實際上,一旦檢測到實時溶解氣體數據,便可以啟動預警過程。利用所選變壓器屬性的差異化的預警閾值,可以實現差異預警過程。

表6 差異預警規則
現場使用了一個變壓器來驗證提出的差異預警規則。根據離線實驗,該變壓器在2014年3月16日-5月25日之間被診斷為高溫故障。該變壓器在220 kV電壓下工作,充滿25#變壓器油,使用壽命為10年-20年。根據該變壓器的屬性,可以獲得一系列預警值,如表5所示。選擇這些預警值的交點作為最終預警值,如表7所示。提取該變壓器的在線監測數據以計算氣體增長率。圖9和圖10繪制了2月22日-6月12日氣體濃度和增長率的趨勢圖。在圖9中,“嚴重”信號將在3月16日和5月25日左右發出,因為C2H4的濃度超過注意值,并且其增長率超過3月16日的報警值,并且C2H4的濃度和增長率都超過了5月25日左右的報警值。從圖10可以看出,在3月16日和5月25日也會發出“嚴重”信號,這是因為3月16日前后總碳氫化合物的濃度超過了注意值,并且其增長率超過了報警值,并且濃度和增長率都超過了5月25日的報警值。但是,如果使用150 μL/ L作為IEC 60599標準中提出的注意值,則這些預警信號很容易被忽略??傊?與現有標準相比,差異化預警規則可以更準確地檢測故障。

圖9 C2H4濃度和增長率趨勢圖

圖10 TH濃度和增長率趨勢圖

表7 驗證變壓器的最終預警值
為了進行更廣泛的驗證,選擇了諸如ANN、DBN、SVM和模糊邏輯方法之類的智能算法,以與所提出的差異預警規則進行比較。在驗證之前,將變壓器分為訓練集和測試集。訓練集中有815個案例,其中800個正常案例和15個異常案例。測試集有528例,包括514例正常和14例異常。驗證結果如表8所示。

表8 使用ANN、DBN、SVM和模糊邏輯智能算法進行驗證
選擇準確率、誤報率和漏檢率來定量驗證該預警規則。準確率是反映正確識別正常和異常案例的比例的指標。計算公式為:
(17)
式中μaccuracy代表準確率;numn-n代表被判為正常的正常例數;numa-a代表被判為異常的異常例數;numtotal代表總例數。
誤報率是代表正常案例被判定為異常的比例的指標。計算公式為:
(18)
式中μfp表示誤報率;numn-a表示判斷為異常的正常例數;numnormal表示正常案例總數。
漏檢率是代表被判斷為正常的異常案例比例的指標。計算公式為:
(19)
式中μfn代表漏檢率;numa-n代表被判斷為正常的異常例數;numabnormal代表異常案例總數。
除了上述準確性指標外,計算時間對于變壓器預警方法也很重要。計算時間過長,無法滿足預警的及時性要求。由IBM生產的、配置為Intel-Xeon(R)CPU E5-2630 v3 @ 2.40 GHz×32 RAM 128 GB的計算服務器和CentOS 7操作系統被用作驗證的計算平臺。構建了MATLAB 2017b軟件作為分析平臺。
分別對差異預警規則、常規預警規則、ANN、DBN、SVM和模糊邏輯的準確率、誤報率、漏檢率和計算時間進行比較,結果如表9所示。

表9 不同方法在準確率、誤報率、漏檢率和計算時間上的比較
根據表9,可以看出,盡管差異預警規則與常規預警方法相比花費更多時間,但是準確率顯著提高,并且漏檢率和誤報率顯著降低。每臺變壓器的差異預警規則的平均預警時間為2.78 s,可以滿足及時性要求。
與智能算法相比,盡管ANN、DBN和模糊邏輯方法可以產生與差異預警規則相似的準確性,但漏檢率和誤報率較高,計算時間明顯更長。特別是,需要大量訓練的ANN和DBN會浪費大量時間,無法滿足及時性要求。綜上所述,差異預警規則在各個方面都是極好的,并且更適合于變壓器的預警。
文章探討了差異化的預警規則,以獲得具有不同屬性和工作條件的電力變壓器的細致和個性化的預警結果。提出了最優分類屬性的選擇方法和差異預警閾值的計算規則,在此基礎上,挖掘了差異預警規則。實踐證明,挖掘預警規則能夠較好地實現對電力變壓器運行狀態的預警。該方法的優點可以總結如下:
(1)將FCM和歐氏距離方法應用于溶解氣體大數據中,挖掘出對溶解氣體數據影響最大的最佳變壓器屬性,從而更好地表征變壓器之間的差異。確定了三種最佳變壓器屬性包括電壓等級、使用年限和油型;
(2)經驗證,根據分布直方圖和概率圖,氣體濃度和氣體增長率均符合Weibull分布。通過分布特征與缺陷/故障率之間的關聯分析,可以計算出三種選擇的最佳分類屬性下的氣體濃度和氣體增長率的預警閾值;
(3)結合氣體濃度預警閾值和氣體增長率預警閾值,可以得到差異預警規則。與傳統的閾值診斷方法和智能診斷方法相比,可以得出差異預警規則不僅在較短的計算時間內準確率高達98.21%,而且需要較少的故障案例。此外,差異化預警規則可以有效降低誤報率和漏檢率,具有較強的魯棒性。