(1.華北電力大學 計算機系,河北 保定 071003;2.國網河北省電力公司 電力科學研究院,石家莊 050021)
在電力系統中,變壓器運行狀態的變化將直接對電力系統的狀態產生影響。因此,對電力變壓器的健康狀態進行預測,保障送變電安全,對提高電力系統的可靠性、促進電力設備基于狀態的維修(condition based maintenance, CBM)具有重要意義。為保障變壓器的正常和安全運行,對其健康狀態的監控與故障預測技術越來越受到變壓器運維人員和研究學者們的重視[1]。在實際應用中,變壓器在故障產生前,通常會經歷一系列的退化狀態,當積累到一定程度時,會最終導致變壓器故障[1]。如何正確的劃分和識別變壓器從正常狀態到故障狀態之間的狀態序列,是故障診斷研究中非常關鍵的一步,也是能夠得到較高診斷可靠度的前提條件之一[2-3]。
近年來,已有大量針對電力變壓器狀態評估與故障診斷的研究成果報道[4-6],但由于變壓器是一類內部結構復雜、運行工況與外在環境多變的設備,因此,尋找一種有效的方法對其故障演化規律進行清晰的刻畫較為困難。例如,有研究者開始把HMM模型引入到基于狀態的設備維修和故障診斷領域中來,取得了良好的效果[7-9]。HMM在設備狀態識別領域的應用是對設備歷經的多個健康狀態分別建立并訓練對應的HMM,實現對狀態的劃分。文獻[10]將HMM應用于機械設備故障診斷領域,通過對振動信號的學習,實現了基于狀態的維修。文獻[11]將HMM應用到發電機轉子的狀態識別中,描述了設備運行狀態的變化。文獻[12]對旋轉機械的變速過程進行HMM建模,在建模過程中采用了多個觀測變量進行分析,得到了較好的診斷結果。但這些研究只使用了標準HMM技術,因為HMM的狀態持續時間遵循指數分布,所以模型對時間結構的描述不夠精確,建模過程中未考慮設備的歷史狀態信息,為充分利用馬爾科夫過程的特點,需要對HMM模型中對歷史狀態不敏感的缺點進行改進。
隱式半馬爾科夫模型(hidden semi-markov models, HSMM)將歷史狀態信息納入計算過程,能夠克服 HMM對歷史狀態信息不敏感的局限性[13]。本文嘗試在變壓器故障診斷中,對HSMM模型引入“微狀態-宏狀態”的對應關系來描述變壓器健康狀態的轉移。最后使用變壓器DGA故障數據對HSMM模型進行訓練,并通過實驗來驗證模型的可靠性及準確性。
一個HMM模型可用下列參數描述[9]:
(1)N為模型中Markov鏈的狀態數目。記N狀態為:s1,s2,...,sN,記t時刻Markov鏈所處的狀態為qt,顯然qt∈(s1,s2,…,sN)。
(2)M為一個隱狀態產生的觀測值種類數量。記M個觀測值為o1,o2,...,oM,記t時刻的觀測值為ot,其中,ot∈(o1,o2,...,oM)。
(3)π為初始概率分布矢量,π=(π1,π1,…,πN)。πN初始時刻時,模型處在該狀態的概率。其中:
πi=P(qt=si),1≦i≦N
(1)
(4)A為狀態轉移矩陣,A={aij}N*N。其中:
aij=P(qt+1=si|qt=si),1≦i,j≦N
(2)
(5)B為觀測值概率矩陣,B={bjk}N*M。其中:
bjk=P(ot=vk|qt=sj),1≦j≦N,1≦k≦M
(3)
這樣可以記HMM為λ=(N,M,π,A,B),因為在模型中,各個參數之間又具有一定的關聯,N和M確定之后才能計算A和B,所以HMM可簡寫為λ=(π,A,B)。
HMM在實際應用中的3個相關基本問題及算法描述如下[11]:
(1)評估問題(“前向-后向”算法):在給定的觀察序列o=o1,o2,...,oM和參數組為λ=(π,A,B) 的HMM中,該觀察序列出現的概率是多少?
(2)解碼問題(Viterbi算法):在給定的觀察序列o=o1,o2,...,oM和參數組為λ=(π,A,B) 的HMM中,隱藏狀態序列s=s1,s2,...,sN生成所給出的觀察序列的概率是多少?
(3)學習問題 (Baum-Welch算法):觀察序列確定的情況下,如何設定HMM中的參數,如:初始概率分布(π)、狀態轉移矩陣(A)等,才能夠使得HMM輸出該觀測序列的概率最大?
HMM是一個雙重隨機過程,它可以在概率統計學的基礎上解答上述3個問題。HMM的參數λ=(π,A,B)可以由Baum-Welch算法從觀測到的DGA數據中估計出來,由估算出的HMM組成分類器,可以實現對觀測序列的分類。具體流程如圖1所示。

圖1 HMM故障診斷流程圖
在使用HMM對變壓器運行狀態進行建模時,將初始模型的隱狀態數量設定為4,并采用均勻選取的辦法對模型的觀測值概率矩陣選取進行確定。HMM的初始形態如圖2所示。模型中變量之間的依賴關系用箭頭來表示,箭頭上的數字表示此次狀態轉移的概率,由圓圈中的數字表示HMM模型中不同的隱狀態。根據HMM模型的基本理論可知,每個隱狀態都可能產生多個觀測值,圖2中的o1,o2,...,oT都表示為離散的觀測值序列。

圖2 HMM變壓器故障模型
當建立了HMM的初始模型后,就可以采用Baum-Welch算法進行計算,為變壓器的每個故障類型訓練出相應的HMM,從而建立起面向變壓器的HMM分類器。
在HMM研究和應用領域的相關內容中可以歸納出其模型的局限性,主要表現為以下幾點[14]:
(1)HMM狀態駐留概率遵循指數分布。即系統在狀態i持續時間為d的概率為:
(4)
式中,aii表示系統駐留在狀態i的概率。根據公式(4)的表示,隨著駐留時間d的增加,Pi(d)呈指數下滑,這也與實際情況不符合。
(2)HMM假設模型中各觀測變量之間互不影響,即觀測序列產生僅與當前所處的狀態有關:
P(o1,o2,...,ot|s1,s2,…,st)=P(ot|qt)
(5)
o1是由s1生成的,o2是由s2生成的,但是s2的形成受s1影響,所以o1和o2也一定有聯系。但是為了研究和應用方便,就假設s1和s2不獨立,但o1和o2獨立。在實際的變壓器DGA運行過程中,各個狀態之間能夠相互轉化,所以這個假設與實際情況不符。
(3)HMM模型中,馬爾可夫過程具有齊次性,表現在變壓器的狀態轉移中即為——狀態轉移矩陣確定后,不會隨變壓器狀態的變化而變化。在實際情況中,隨著變壓器運行狀態的不斷改變,其各個狀態之間的轉移概率肯定會不斷變化。
針對上述局限性,目前的改進方法就是根據應用場景的不同,適當放寬HMM模型的假設條件,主要思路如下:
(1)在傳統的HMM 結構上加入時間要素,使狀態轉移矩陣能夠根據歷史狀態信息進行改變,打破馬爾科夫過程的齊次性。
(2)在HMM模型各個狀態轉移概率的計算過程中,加入歷史狀態的變化量,來描述各個狀態之間的跳轉信息。該方法具有較強的適應性,但是每次狀態轉移過程的計算與建模較為復雜。文獻[15]表明,在基于HMM的手寫字體識別系統中,因為手寫字母的分割處理程序本身具有極強的不確定性,所以使用結合歷史狀態的模型來實現手寫字體的識別是切實可行的。
(3)針對HMM的觀測序列輸出僅與當前狀態有關的假設,可將觀測序列之間的依賴性加入建模過程中。自回歸隱馬爾可夫模(Auto-Regressive Hidden Markov Model, ARHMM)通過AR模型計算的觀測值概率矩陣B={bjk}N*M,其中,bjk=P(st=sj|ot=oj),反映了狀態st和觀測序列ot之間的統計對應關系:
bjk=P(sj|ot=oj)=N(sj|∑ak(i)ot-i|∑k)
(6)
式中,N(·)表示高斯函數,∑k表示高斯分布的估計方差,通過統計學將狀態與觀測序列之間建立關系,實現了觀測序列之間的依賴性。文獻[16]通過ARHMM 對工業控制過程的數據進行異常檢測,提升了檢測精度和抗干擾能力。
目前基于HSMM故障診斷的應用對象主要以旋轉機械居多,通過對其工作過程中的振動信號進行建模分析,實現對其健康狀態的劃分,旋轉機械振動信息采集的連續性較強[17]。但是變壓器的故障數據,如DGA數據的采集通常為間隔操作,變壓器健康狀態的持續時間也遠較機械設備等更長久,具有宏觀上的離散性。因此,本文結合變壓器DGA數據采集特點及狀態演變規律,引入“微狀態-宏狀態”的對應關系來描述變壓器的運行過程,將變壓器歷史狀態信息納入建模過程中,以提升模型準確率。
變壓器的運行狀態分為正常狀態和故障狀態,故障類型分為放電性故障和過熱性故障,其中放電性故障分為:低能放電、高能放電;過熱性故障分為:中低溫過熱(溫度≦700 ℃)、高溫過熱(溫度≧700 ℃)[18]。其中兩種故障特性都包含的有:低能放電兼過熱和高能放電兼過熱。本文所采用的HSMM是在傳統HMM結構上加入了時間要素,為變壓器故障診斷提供更好的建模和數據分析能力,具體如下:
針對變壓器的各個健康狀態,使用各類DGA故障數據對HSMM進行訓練,與HMM不同的是,HSMM中的 “宏狀態”對應變壓器的各個健康狀態。
HSMM與傳統HMM的不同還體現在狀態與觀測值的產生方式上,傳統HMM 的一個狀態僅產生單個觀測值,但HSMM的一個狀態會產生一個由多次觀測值組成的觀測值片段。本文將HSMM中隱狀態一次產生的觀測值被稱為“微狀態”,由連續多次的觀測值組成的片段稱為“宏狀態”。其對應關系如圖3所示。在HSMM中s表示變壓器的隱狀態,o表示由采集的DGA數據處理得來的觀測序列。

圖3 HSMM模型示意圖
如圖3所示,值為oqi-1,...,oqi的觀測序列,對應的微狀態為sqi-1,...,sqi,這個微狀態序列對應HSMM模型中相同的宏狀態即hi。
HSMM可表示為λ=(π,A,D,B),其中,π表示初始狀態分布,A表示狀態轉移矩陣,D表示狀態持續時間分布,B表示觀測值概率矩陣。在HSMM模型中具有多個微狀態,這些微狀態的轉換不具有馬爾科夫性,而模型中宏狀態之間的轉換是符合馬爾科夫過程的,狀態轉移矩陣(A)用來描述這些隱狀態之間的轉換:
P(hql=j|hql-1=i)=aij
(7)
為了能夠使HSMM模型識別出變壓器在運行過程中不同的狀態,所以在訓練模型時采用各種變壓器DGA故障數據,為所有變壓器的正常狀態和每個故障類型各訓練一個單獨的HSMM模型,從而建立起變壓器故障的HSMM分類器。如圖4所示。

圖4 HSMM故障診斷示意圖
基于HSMM的變壓器故障診斷流程,由特征提取、狀態分類和故障識別3個部分組成。其中,狀態分類是該流程中的關鍵步驟,其HSMM的計算過程如下:根據觀測序列利用“前向-后向”算法求解最優模型λ,采用Baum-Welch算法訓練模型,得到輸出該觀測序列概率值最大的模型參數。在模型中每個變壓器的運行狀態都對應一個訓練好的HSMM,將觀測序列依次代入每個HSMM模型中進行計算,得到該觀測序列的P(o|λ),即為發生該故障的概率。
在電力變壓器的診斷分析環節中,DGA分析技術的數據采集方便,分析結果也較為準確,所以近年來的變壓器健康管理和DGA技術緊密結合[19]。在運行過程中如果變壓器發生過熱或放電性故障時,會使得內部固體絕緣材料和絕緣油如絕緣紙板、電纜紙等加速發生分解,產出氣體。主要氣體有氫氣(H2)、烴類氣體如:甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、一氧化碳(CO)、二氧化碳(CO2)等。在這7種氣體中,因為變壓器內部受到空氣中二氧化碳滲入的影響較大,故其不能夠靈敏的反應運行狀態變化,所以一般不將二氧化碳(CO2)作為判斷故障的特征變量。當變壓器運行狀態發生改變時,一氧化碳(CO)在絕緣油中的溶解濃度要遠大于其他特征氣體,在HSMM建模過程中容易掩蓋其他油中溶解氣體對于模型計算的影響。為了簡化問題,同時結合實際情況,將用于HSMM建模的特征變量定為5個,即氫氣(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4),且只考慮樣本之間的關系。由此可得到特征氣體的矢量表達式:
X=[H2,CH4,C2H6,C2H4,C2H2]
(8)
先對DGA數據進行歸一化,使數據限制于[0, 1]之間。由于H2、CH4、C2H6、C2H4、C2H2這幾種特征氣體都是可燃性氣體,通常將這些DGA特征氣體含量總和稱為可燃氣體總量(TCG)。通過將這5種特征氣體變量與TCG的比值實現DGA數據的歸一化處理,即以H2/TCG、CH4/TCG、C2H6/TCG、C2H4/TCG、C2H2/TCG作為歸一化的DGA數據,從而將DGA數據限制在0到1之間。
當發生放電性故障時,若CH4/H2>1,則同時伴隨有過熱性故障的發生,即此時變壓器的運行狀態出現放電兼過熱性故障;當CH4/H2≦1時,一般認為是純放電性故障。當訓練HSMM變壓器故障模型時,我們將放電性故障和放電兼過熱性故障合為一種故障類型,即將變壓器的運行狀態由7類合并為5類:正常、中低溫過熱(溫度≦700℃)、高溫過熱(溫度≧700℃)、低能放電,高能放電。合并運行狀態,可以提升HSMM的訓練速度和正確率。例如,若輸入的特征氣體觀測矢量為x=[85.9,66.0,15.3,25.7,6.3],則HSMM模型各狀態的識別結果輸出如表1所示,其發生高能放電故障的概率是98.45%。

表1 HSMM輸出
表1中的對數似然值就是由HSMM對觀測矢量X進行分類得到的對每個狀態的logP(o|λ),其中Inf表示無窮大,HSMM輸出的對數似然值越大,則表示此故障的發生概率就越大。
我們從相關文獻和資料收集到的樣本中選出變壓器運行過程中每個狀態各15組數據,這75組數據未在模型中參與訓練過程,作為HSMM的輸入矢量進行分類測試。在本算例實驗中,因為變壓器運行狀態共有5種,所以設定HSMM模型中隱藏狀態數目為5;因為初始值的選取對于訓練結果的影響不大[19],所以對于HSMM的初始模型π,我們采用均勻選取。設置訓練過程中的收斂值0.0001,最大迭代次數為100。在一開始的訓練過程中,隨著迭代次數的增加,各個狀態輸出的對數似然值也逐漸加大,即狀態識別的正確率也在逐步提高。各個狀態輸出的對數似然值曲線在10次后趨于平穩,總體訓練過程的迭代次數都在15次之內,訓練過程如圖5所示。


圖5 5種狀態HSMM的訓練曲線
當各種故障類型的HSMM建立以后,就可以使用圖4所示的方法進行故障識別。為了能夠直觀的了解HSMM變壓器診斷方法的效果,把這75組數據用傳統HMM方法進行診斷,并和本文所述的診斷方法進行比較。從本次實驗的結果可以看出,相較于傳統HMM方法, HSMM方法正確率更高。HSMM對于每個故障類型的劃分都要比HMM準確。測試結果如表2所示。

表2 暫態運動各自由度穩態誤差
本文針對傳統HMM在電力設備故障診斷中的局限性,通過引入“微狀態-宏狀態”,考慮變壓器運行過程中的歷史狀態對于狀態轉移的影響,給出了一種基于HSMM的變壓器故障診斷流程,并采用DGA數據進行了算例分析,結果驗證了模型的有效性,也更加符合變壓器實際運行狀態。