王碩禾,鞏方超,2,古曉東,田繼祥,金 格,牛江川
(1.石家莊鐵道大學 電氣與電子工程學院,河北 石家莊 050043;2.威海海洋職業學院,山東 威海 264300;3. 中國鐵路設計集團有限公司,天津 300142)
牽引變電站作為電氣化鐵路的核心樞紐,其室外長期運行的電氣設備受環境影響出現的各類故障易對牽引供電系統的安全穩定運行造成沖擊。這些故障設備整體或局部的溫度會發生變化,呈現出不同于正常狀態的熱像特征。當前,多數基于紅外熱成像檢測技術的變電站電氣設備熱狀態監測還是僅依靠操作人員的經驗分析紅外圖像,進而對電氣設備的熱故障做出診斷[1]。
解決人工巡檢出現的耗時耗力、檢測精度低、可靠性差等問題的方法之一,就是結合紅外技術和機器視覺對電氣設備類型及故障進行識別[2-3],提升圖像分析處理的自動化與智能化水平。文獻[4]通過提取紅外圖像的HOG特征,選擇支持向量機進行特征分類,本文采用HOG特征有效分類了局部場景下的高壓設備。但HOG算法對圖像的空間信息描述不足,無法更細致地判別設備圖像的局部外觀和形狀信息,對此有學者提出PHOG(Pyramid Histogram of Oriented Gradients)算法來進行改進[5]。文獻[6]結合GLOH描述子和GVF Snake模型精準分割絕緣子,并通過分析統計直方圖來實現零值絕緣子的自動檢測。對于零值絕緣子本方法檢測效果較好,但是并不適合其他狀態的絕緣子或其他電氣設備。文獻[7]利用Faster-RCNN精確定位,采用深度殘差網絡(Res-Net)提取圖像特征,最后利用稀疏表示進行絕緣子狀態分類。文獻[8]結合紅外圖像和可見光圖像分割變壓器故障子圖像,并在Tensorflow上搭建卷積神經網絡(CNN)對巡檢目標進行圖像分類和識別。這兩類方法均采用深度學習算法訓練,相較于傳統方法,有更高的準確率,但運算開銷較大,難以達到實時要求。文獻[9]采用Gist算法和PHOG算法進行全局和局部的特征提取,并以Gist+i*PHOG形式進行特征融合,但最后的分類準確率不高,識別率僅達60%~80%。
多特征融合技術[10-11]一直以來都受到高度重視,已成為解決圖像整體信息特征與局部信息特征描述矛盾的方法之一。鑒于此,本文融合設計了FastPCA和PHOG特征加權融合的特征描述子,同時聯合優化參數的SVM作為分類器,設計了紅外圖像下高壓電氣設備類型及其故障狀態識別系統。該系統首先引入K-means完成紅外圖像分割,然后對提取的FastPCA和PHOG特征向量進行數據規格化描述,并加權融合成新的混合描述子;最后,輸入到訓練好的SVM分類器進行分類,并分析紅外圖像下電氣設備劃分層數L、錯誤代價系數C以及RBF(徑向基函數)核自身的參數γ取值大小對識別精度與速度的影響。經試驗證明,該算法有效提升了特征提取效率、電氣設備類型及故障識別的準確率。
根據上述相關研究成果和設備圖像先驗知識,結合現場訓練樣本集的分析,發現快速主成分分析法(Fast Principal Component Analysis,FastPCA)對圖像全局特征描述能力強,而金字塔式梯度方向直方圖PHOG在兼具HOG良好的局部特征描述能力的同時,魯棒性和幾何光學不變性較強,所以本文選擇它們作為互補特征。
主成分分析法PCA是一種基于協方差矩陣對信息進行處理壓縮的有效方法[12],能很好地解決維度災難問題。但是PCA算法中樣本協方差矩陣的本征值和本征向量計算非常耗時,當維數d較大時計算復雜度會非常高,常會耗盡計算機的內存。后來經過加速的FastPCA則可以快速計算協方差矩陣非零本征值所對應的本征向量。
設協方差矩陣S為
(1)
式中:xi為樣本,大小為1×d;m為樣本均值。若設Zn×d=xi-m,則協方差矩陣S的表達式可改寫為S=(ZTZ)d×d。令R=(ZZT)n×n,由于實際應用中樣本數目n遠小于樣本維數d,所以R的尺寸遠小于S,但R卻與S有著相同的非零本征值。計算分析,設n維列向量ν是R的本征向量,那么
(ZZT)ν=λν
(2)
對于式(2)ν兩邊同時左乘ZT,整理得
(ZTZ)(ZTν)=λ(ZTν)
(3)
式(3)說明λ為協方差矩陣S=(ZTZ)d×d的特征值。通過上述分析不難得出,先計算小矩陣R的本征向量ν,再對公式進行左乘ZT得到散布矩陣S=(ZTZ)d×d的本征向量ZTν來達到簡化計算目的。本文利用 FastPCA 快速降維,刪減部分區分力較差的特征,擴大了差異性較大的特征占比,快速降維后識別正確率往往會提高。
自Navneet Dalal和Bill Triggs在2005年的CVPR上提出HOG后,這種主要用來描述圖像局部特征的方法得到了許多科研工作者的青睞[13]。具體描述就是將圖像分成若干胞元,計算得出每個胞元的梯度直方圖作為一個本征向量,每4個胞元組成一個塊,然后把圖像所有分塊的特征向量組合合成目標圖像的HOG本征向量。HOG雖然具有較強的圖像邊緣信息描述能力,但是對于圖像的空間信息描述不足。因此,Anna Bosch采取空間四叉樹分解方法,劃分目標圖像子空間,并且進行多尺度表達,通過利用已經劃分的空間區域分析邊緣特征的梯度方向直方圖來體現目標特征,即PHOG[5](金字塔式梯度方向直方圖)。圖1為絕緣子紅外圖像不同尺度L下PHOG特征的梯度柱狀圖。

圖1 不同尺度PHOG特征的梯度柱狀圖
PHOG相對于HOG可以檢測到不同尺度L下圖像的特征,能夠更好地進行巡檢目標圖像描述,展現出更豐富的特征信息,但另一方面其特征計算量與L成正比增加。這是因為當圖像所劃分的層次過高時,所分無效信息區域概率增大,它們不包含必要的圖像邊緣特征,反而增加了特征向量的長度和計算時間,且會對之后的分類產生干擾。因此,選取合適的L值對具體應用很關鍵。
由于不同的描述子對圖像的特征描述各有側重,很多情況下是無法達到最優的,如前文所介紹的兩種應用算法:FastPCA更強調對圖像的全局特征描述,PHOG對圖像的局部特征則有更強的描述能力。針對紅外圖像下變電站電氣設備類型及其故障識別問題,以及受多特征融合技術的啟發,本文提出兩種特征加權融合的混合描述子,同時設計了變電站電氣設備類型及其故障狀態識別算法。因此,本文算法提取的特征充分利用了圖像全局和局部的信息,有效解決了圖像整體信息特征和局部信息特征描述的矛盾,為后續的分類工作奠定了良好的基礎。
本文算法具體流程見圖2。

圖2 識別系統算法流程
由于變電站各種電氣設備之間的分布比較緊湊,從而導致巡檢拍攝的電氣設備圖片背景異常復雜。因此,引入改進的K-means算法進行紅外圖像分割,該方法根據原始圖像直方圖估計聚類數K值,分割前分別采用直方圖均衡化、模糊集理論進行對比度調整和增強圖像,為后續K-means算法對圖像數據的處理做準備[14]。
本文算法提取的FastPCA和PHOG特征數量巨大,為防止采集圖像特征數據中大的數字范圍的壓倒性,必須進行數據規格化。通常應用最大最小規格化方法 (min-max Normalization),其實質是進行一種線性轉換,將原屬性A的一個值v映射為新v′(v′∈[newmaxA,newminA]),設vminA和vmaxA為v的最小值和最大值,則有
(4)
為得到類內差異小、類間差異大的最佳區分力特征,本方法采用 FastPCA 從樣本圖像提取主成分,利用投影進行基的轉換和降維,得到相應的FastPCA特征向量;再結合PHOG 對該巡檢設備目標圖像進行不同尺度的分割,采集分割后圖像邊緣輪廓的梯度方向直方圖并串聯成一維特征向量,即 PHOG 特征向量。
在主成分分析時,從描述能力和速度的角度出發,一般對特征向量選取20維特征,所以設提取的FastPCA特征為20維的特征向量Y。在PHOG(L=1時)中,每個Block生成的描述子維度36或45(順序疊加4個胞元的9個bin的直方圖,會額外添加9維的整體信息),所以設提取的PHOG特征為45維特征向量X。在進行數據歸一化后,為區別FastPCA特征和PHOG特征的權重,可將其分別乘以權重系數α、β,再重新組合,構成新的65維描述子。
權重系數α、β的選取非常重要,它們都為正數且滿足約束條件α+β=1。首先在0~1區間內選取等間隔的10組α、β值;而后,針對不同組的權重系數進行訓練分類,選擇分類效果最好的那組作為當前數據庫的權重系數。圖3為電壓互感器瓷套紅外圖像的新描述子的梯度柱狀圖(PHOG特征提取參數設置為:bin=9,L=0、1、2,angle=180,α=0.5,β=0.5)。
不同尺度L下,圖像的特征向量維數不同,隨L的增大而迅速增大。并且訓練集不同,L最佳取值往往不同,常選取L=1~4。對于本次使用的紅外圖像數據樣本,L=1時描述子維數為45維,當L=2時描述子維數為209維, 試驗表明當L≥3時維數迅速增加,分類效果下降。本文算法充分汲取了PHOG特征和FastPCA特征的各自優點,通過訓練樣本集的特點分別調節α、β值,以達到最優的描述效果。
本文采用SVM進行最終的分類,支持向量機參數中選擇RBF作為核函數。目的是利用其可將輸入樣本映射到高維空間,解決非線性不可分問題。而且具有對樣本大小、維度變化適應性強的特點。利用SVM分類時,SVM分類分類器的性能受到多個參數影響,同時影響其推廣能力[15]。所以,本文采用文獻[16]基于交叉驗證和網格搜索的參數選擇方法LibSVM來優化RBF核自身的參數γ、錯誤代價系數C以及權重系數α和β,其中C的初始值一般可以設置為inf,γ設置為1。
本文算法試驗所用的自建紅外樣本庫是利用FLUKE TI400熱成像儀采集的圖像數據。此采集設備包括工業級500萬像素的可見光相機、IFOV(空間分辨率)1.31 mrad的紅外鏡頭以及先進的IR-Fusion技術(具備可見光圖像與紅外圖像融合功能,并且可以改變融合比例)。本文所設計的識別系統試驗平臺選擇的硬件參數為:Intel(R)Core(TM) i5 CPU 1.7~2.4 GHz RAM 12GB,Windows8.1操作系統。
試驗數據樣本集Ⅰ有訓練及測試數據樣本共80個,包含變壓器、正常狀態絕緣子、過熱絕緣子、零值絕緣子、電源和其他3種干擾物體。為測試不同參數下分類器的性能,設置樣本集Ⅱ,樣本數量80個,設備種類有所區別。樣本集Ⅰ、Ⅱ所有圖像的分辨率均調制為128×96。圖4為樣本集Ⅰ的部分樣本圖像,包括正常、過熱、零值3種同型號絕緣子及干擾物。樣本符合2016版《帶電設備紅外診斷應用規范》[17]的設備特征要求。

圖4 部分樣本的紅外圖像
為驗證本文算法對紅外圖像下電氣設備類型及故障狀態識別的有效性,將本文算法與PHOG+SVM算法[18]、FastPCA+SVM算法[19]進行運行時間、分類精度的對比以及參數優化后的性能分析。此對比試驗數據為樣本集Ⅰ,試驗結果如表1所示。

表1 算法測試數據對比分析表
由表1的數據對比分析可知,對于自建樣本集Ⅰ的80個紅外圖像樣本,未優化參數時3種算法的識別精度都低于80%,對RBF核自身的參數γ以及錯誤代價系數C優化后,3種算法的識別精度都得到一定的提升。總體而言,本文算法精度最高,可達到95.7%,3.7 s的運行時間相比于另外兩種算法稍長。但是,隨著多線程編程技術和計算機高性能GPU和配套加速庫的發展,其處理速度越來越高,算法運行時間會大大縮短,足以滿足實時要求。除此之外,由于本文算法訓練所需樣本集很小,而且僅提取65維特征向量,特征向量維度小、計算機相對計算量低,對于硬件配置同樣要求低,便于擴展應用。
同時根據訓練樣本結果分析,該融合算法不僅對不同類型巡檢目標圖像有較高的分辨能力,而且對同型巡檢目標圖像也具有較高類內分辨能力。該特點,為同型巡檢目標圖像的不同故障判別奠定了基礎,如對試驗樣本集Ⅰ中的正常、過熱、零值3種同型號絕緣子具有很好的分辨效果。
性能良好的特征描述子區分能力強,除此之外為保證推廣能力,要有較強的魯棒性,所以本文設計了相關的測試試驗。首先在測試集Ⅰ中設置目標設備圖像角度和位置變化的樣本,根據測試數據分析,對于目標巡檢圖像,當尺度L=0時基本無變化,L=1時識別精度下降5%。此外,對測試集Ⅰ的樣本添加干擾,見圖5,均添加噪聲密度為0.02的椒鹽噪聲以及一定程度的背景干擾(線條、顏色、虛化)。經試驗發現:從這些樣本提取的特征向量依舊具有較好的區分能力。

圖5 算法的魯棒性試驗
總體來說,本文提出的FastPCA和PHOG特征加權融合的混合描述子綜合考慮了訓練樣本集局部和整體信息,并調節α、β值權重,因此增強了算法的魯棒性。
本節主要分析參數L、C、γ對本文算法識別性能的影響,試驗數據為樣本集Ⅰ和樣本集Ⅱ。
由表2可以得出:當L≤2時,本文算法分類精度相比PHOG+SVM有很大的提高,但當L≥3時分類精度急劇下降,這和L過高時,那些不包含邊緣信息且會使特征向量變長的空白塊的增加相關。由此可以縮小L的最佳值尋找范圍,通過測試樣本集數據對比分析,可以得出,對于本測試數據L=1時存在最佳分辨率。

表2 尺度L對樣本識別性能的影響 %
通過調整附加錯誤代價系數C,可以權衡最大分類間隔與最小化訓練錯誤以及增強對測試樣本的推廣能力。根據本測試數據樣本集分析,C值的影響較弱,而對支持向量機中采用的RBF核函數的參數γ則較為敏感。不同樣本集的最佳參數會有差異,利用LibSVM對自建數據庫進行參數搜索優化后發現對樣本集Ⅰ的推薦值為C=127,γ=0.007 8;對樣本集Ⅱ的推薦值為C=127,γ=0.02。為了更加直觀地觀察參數γ對分類精度的影響,對兩組試驗數據集的訓練與測試樣本采取交叉試驗取平均值的方法,測試數據如表3、表4所示。

表3 參數γ對Ⅰ組數據識別性能的影響

表4 參數γ對Ⅱ組數據識別性能的影響
分析兩組試驗結果可知:當參數γ=1時,分類精度都很低,隨著γ的減小分類正確率顯著提升。對于樣本集I而言,在γ=0.007 8時,分類準確率達到最大且為97.5%;對于樣本集Ⅱ,在γ=0.02時,分類準確率達到最大且為95.0%。對于本文算法和自建紅外樣本集而言,在L=1、C=127、γ=0.007 8時,可取得最佳分辨率,經樣本集I測試的電氣設備類型及其故障狀態識別率高達97.5%。
為方便實際應用操作,依據FastPCA和PHOG特征加權融合的識別算法建立分類識別系統,用戶可以通過運行界面快速判斷電氣設備類型及故障狀態。圖6、圖7為FLUKE TI400熱成像儀對應的圖像分析軟件Smartview和搭建的識別系統的運行界面。

圖6 Smartview軟件界面

圖7 識別系統運行界面
本文提出一種基于FastPCA和PHOG特征加權融合的電氣設備類型及其故障狀態識別算法,并建立分類識別系統。該算法融合了PHOG和FastPCA特征的優點,增強了對圖像的整體和局部的信息描述能力,加權融合特征能很好地區分各類設備及其故障狀態。試驗結果表明,本文提出的算法對于巡檢目標電氣設備及其故障狀態識別率較高,準確率也有明顯提升(達97.5%),而且對于變電站的復雜背景也具有良好的穩定性和魯棒性。另外,通過自建紅外圖像樣本集測試,發現該算法特別適合小樣本的數據集,并且在現場運行條件和環境改變時,能快速地添加訓練的新樣本,提高識別準確率。