汪 洋, 黎恒烜, 鄂士平, 王成智, 張侃君
(國網湖北省電力有限公司 a.設備管理部, b. 電力科學研究院, 武漢 430000)
隨著電網的大規模建設,變電站也在不斷進行升級、改造,但電網的調度與控制安全仍面臨著巨大挑戰[1].為了避免誤調度和誤操作的發生,一鍵順控作為一種新的智能變電運檢技術正在逐漸推廣應用[2-3].
變電站為了實現設備狀態的切換,使用倒閘操作將設備切換至檢修、熱備用、冷備用和運行四種狀態[4].但變電站通常存在較高的電壓,在倒閘操作中出現誤操作不僅會危害人身與設備安全,嚴重的更會導致電力系統的崩潰[5].一鍵順控即操作人員在一體化信息平臺下達任務,可按順序一次性實現操作項目軟件預制、任務模塊搭建、設備狀態識別和操作步驟一鍵啟動與執行的指令[6].傳統的一鍵順控系統使用遙信采集的信號來判斷設備的運行狀態,并使用智能防護系統來判斷程序化操作是否到位.然而,在實際變電站的一鍵順控停、送電操作中,由于操作不當,容易出現錯誤的投退操作.而傳統的信號監測方法,難以及時發現這些錯誤[7].
基于深度學習的數據分析方法作為人工智能的重要研究領域,正廣泛應用于工程的各個方面.如文獻[8]提出使用深度學習算法自動分析變電站設備的周圍環境,實現防火、防盜以及變電站的無人值守;文獻[9]使用深度學習算法設計目標檢測網絡,實現輸變電設備異常發熱點紅外圖片的檢測;文獻[10]使用基于深度學習的分類算法,實現發電機故障狀態的挖掘;文獻[11]使用長短時記憶(LSTM)網絡、門循環單元(GRU)神經網絡和棧式自編碼器(SAE)實現電力負荷預測.
為了解決一鍵順控系統中不能精確判斷目標設備工作的狀態及硬壓板狀態監視可靠性低的問題,本文提出了一種基于圖像識別的“雙確認”方式.該方法使用監控系統采集的目標設備圖像信息進行判別處理,使用一個多任務神經網絡同時完成硬壓板位置檢測、投切狀態檢測和硬壓板標識檢測三個任務.
為了有效檢測與識別出不同的硬壓板,本文提出一個多任務學習網絡.該網絡不僅需要檢測出硬壓板區域,且需要根據硬壓板下面的唯一文字描述對硬壓板進行標識區分.圖1為本文方法的整體框架,對于給定的輸入圖片,該網絡首先使用一個共享卷積層提取出共享特征;然后使用一個文字檢測網絡檢測并識別出文字,采用一個識別框檢測出硬壓板區域,并對其投切狀態進行分類識別.

圖1 硬壓板檢測與識別整體框架Fig.1 Overall framework of detection and recognition of hard platens
由于硬壓板與其下面的文字標識位置上存在關聯關系,因此本文基于多任務學習的硬壓板檢測與識別網絡,使用一個特征共享網絡提取表達能力更強的特征,其具體架構如圖2所示.圖2中,f表示特征,conv block 64,/2表示含有64個通道的卷積層,并進行2倍下采樣;up sampling表示上采樣,×2為2倍上采樣層;3×3表示卷積核大小為3×3;concat表示數組合并.

圖2 特征共享網絡架構Fig.2 Architecture of feature sharing network
特征共享網絡使用ResNet-50作為基礎網絡,并使用特征金字塔結構(FPN)融合高、低分辨率的特征來整合全局與局部信息.特征融合過程滿足
(1)
(2)
式中:gi與hi分別為待融合特征圖和融合后的特征圖;unpool為上采樣操作;conv為卷積層操作.在特征融合時為了保證特征圖的大小一致,將最后一個階段的特征圖進行上采樣操作,增加一倍的尺寸;隨后,將其與當前層的特征進行串接,并使用一個1×1卷積層來減小特征通道數;最后,使用一個3×3卷積操作得到融合的結果.
進行上述特征提取與特征融合操作后,將提取出的共享特征分別送入硬壓板檢測網絡與文字檢測網絡進行硬壓板和文字的檢測與識別.
本文使用EAST網絡進行文字的檢測,該網絡可以準確、有效地檢測各種場景下的文字目標.EAST網絡消除了不必要的網絡操作,能夠直接預測任意方向的文本行.
圖3為本文檢測分支網絡的具體架構.該分支使用FPN提取的特征作為輸入,使用一個1×1卷積層將輸出分支劃分為一個得分通道和預測通道.得分通道用來預測每一個文字框中的特征是正樣本的可能性,預測通道用來指示檢測框的相對橫、縱坐標值.得到每個檢測框的得分與相對坐標后,即可使用非極大值抑制來搜索出局部極大值,再抑制非極大值結果,最終保留一個最理想的檢測框.因此,文本檢測網絡的目標函數可以表示為
Ldt=λsLs+λregLreg
(3)
式中:Ls與Lreg分別為得分通道和預測通道的損失;λs與λreg分別為兩損失的權重,本文將其值直接設為1.

圖3 EAST檢測分支架構Fig.3 Architecture of EAST detection branch
得分通道的損失函數為交叉熵損失,其表達式為
(4)

(5)
式中,Y∈Y*為隨機采樣樣本.

(6)

為了便于對文字進行識別,本文首先使用放射變換層對檢測出的文字區域進行變換,以得到軸對稱的檢測結果.這一操作需要保證輸出高度固定,且檢測結果的長寬比不變.放射變換主要包括兩個步驟:1)使用檢測框的預測坐標來計算放射參數;2)對所有特征區域進行放射變換,以得到標準水平的特征.其中,第1)步的計算操作為
(7)
式中:M為要求的放射變換矩陣;ht、wt為變換后輸出的高和寬;(t,b,l,r)為文本框左上、左下、右上和右下四個坐標;θ為文本方向角度.
使用變換矩陣M,即可實現所有區域的放射變換,即
(8)

對文本區域進行放射變換后,本文使用文字識別分支對檢測框中的文本進行識別.考慮到文字識別分支檢測的文本框中包含的文字長度不同,本文使用LSTM網絡沿著原始圖像的共享特征進行識別.文中文字識別網絡包含一個雙向LSTM層、一個全連接層和一個CTC解碼層.

(9)
式中,B為所有可能帶有空格的標簽到e*的多對一映射.
文字識別網絡的目的是最大化式(9)求和的對數概率,損失函數可表示為
(10)
本文使用Faster R-CNN構建硬壓板的檢測和分類網絡,并直接將硬壓板的投切狀態作為硬壓板的類別信息.
硬壓板檢測與識別網絡的輸入為特征共享層提取的特征,輸出為硬壓板的坐標值.對于給定的共享特征,首先采用3×3的滑動操作得到9個錨框,這9個錨框具有3種不同的面積:1 282、2 562和5 122.得到錨框特征后,該網絡再使用1×1×256×18和1×1×256×36兩個卷積層分別得到一個18維的向量和一個36維的向量,進而得到硬壓板的類別與坐標值,檢測與識別網絡架構如圖4所示.

圖4 硬壓板檢測與識別網絡架構Fig.4 Network architecture of detection and recognition of hard platens
為了優化硬壓板檢測與識別網絡,本文對候選檢測框及其類別進行Softmax二分類,并設計了目標函數為
(11)

(12)
(13)
本文使用手工標注的9 000張硬壓板目標屏圖片訓練所提出的檢測與識別網絡.在標注圖片中,每一個硬壓板下面包含一段文字框來描述硬壓板的具體信息.同時,每個硬壓板根據其投切狀態標記為1(開)、0(合)兩個狀態.圖5為本文采集的硬壓板圖片,本文從9 000張圖片中隨機選擇7 200張作為訓練數據集,剩下的1 800張作為測試集.文中使用Pytorch框架實現所提出的網絡,并使用Adam進行網絡優化.設置初始學習率為0.001,每個訓練Batch的大小為1,共訓練50個周期.

圖5 硬壓板圖片Fig.5 Images of hard platens
為了評估所提出方法的性能,本文使用精確度P、召回率R和平均性能F三個指標來表示網絡性能.其中,精確度與召回率從漏檢和誤檢的角度對性能進行評估,而平均性能是對精確度與召回率的加權平均,即從總體性能上對算法進行評估.三個指標的具體定義為
(14)
式中:q為檢測值;G為真實硬壓板/文本框的集合;D為網絡輸出結果的集合.檢測結果與真實目標的匹配規則為
(15)
式中:σij=(Gi∩Dj)/Gi;τij=(Gi∩Dj)/Dj.根據多次試驗結果設置T1=0.8,T2=0.2.
本文使用上述采集的數據集對所提出的算法進行性能評估,表1為不同算法對硬壓板檢測與定位的精度比較結果.CTPN結合CNN與LSTM深度網絡,能有效檢測復雜場景的橫向分布的文字,SSTD為二值圖像數字水印算法.從表1中可以看出,所提出的算法相對于其他單獨的檢測算法具有更高的精度.

表1 不同算法在測試集上的檢測與識別精度Tab.1 Detection and recognition accuracy on test set with different algorithms %
圖6為本文硬壓板二次確認具體實現效果圖.從圖6中可以看出,使用本方法能夠有效地對硬壓板位置進行檢測,并實現硬壓板投切狀態的識別,提升了一鍵順控的操作精度.

圖6 硬壓板二次確認具體實現效果圖Fig.6 Actual implementation effect diagram of secondary confirmation of hard platens
本文提出了一種基于深度學習的變電站硬壓板狀態檢測與識別算法.該算法采用一個多任務學習網絡,同時完成了硬壓板位置、投切狀態和硬壓板標識檢測.其中,硬壓板位置檢測用于確定并提取出硬壓板坐標;硬壓板標識識別采用基于文字檢測與識別算法對硬壓板進行區分;投切狀態檢測用于對檢測出的硬壓板狀態進行分類,即開或合.測試結果表明,所提出的方法能夠提升硬壓板狀態識別精度,同時也保證了一鍵順控操作的安全性.