楊豐萍,彭云帆,李遠征
(華東交通大學電氣與自動化工程學院,江西 南昌 330013)
在輸電線路中, 絕緣子長期暴露在自然界復雜環境中,易受氣候、溫度等自然因素的影響,極易發生自爆導致整片區域的供電中斷造成巨大損失,及時檢測絕緣子狀態十分必要。 目前利用無人機航拍獲取巡檢圖像, 再利用圖像識別技術從海量圖像中自動識別故障已成為主流的檢測方式。然而,由于無人機獲取圖像的效率極高,傳統的圖像識別方式已力不從心, 在實際應用中難以達到理想的效果[1-2]。 近年來“深度學習”的提出為解決該問題提供了新的思路, 通過深層神經網絡自動學習數據的深層特征, 不僅避免了困難的人工特征提取工作, 而且所提取出的深層特征適用性也更強。 近年來,陸續有人研究利用深度學習方式檢測電氣設備, 如黃文琦等探索了利用Faster RCNN 對巡檢圖片中的絕緣子進行定位[3];王勛等通過利用深度學習算法對電氣設備進行故障檢測[4];侯春萍等利用由VGG 分類器和Faster R-CNN 檢測器組成的級聯網絡識別絕緣子的自爆缺陷,提高了識別效果[5]。
然而, 利用深度學習方法檢測絕緣子自爆面臨兩個問題:一是通常采集到的圖片數據集中缺陷樣本的數量少, 檢測器很難學習到缺陷樣本的特征;二是缺陷塊目標尺寸過小,直接對其定位難度較大。 所以目前基于深度學習的絕緣子自爆檢測法大多仍需通過級聯網絡進行, 即先通過深度學習方法在圖像中定位出絕緣子, 在此基礎上再進一步利用傳統方法在絕緣子上識別出自爆部分,這同樣需要進行繁瑣的特征工程,且算法的適用范圍有限。
為此提出一種基于深度學習的小樣本絕緣子自爆檢測策略。 通過生成對抗網絡(generative adversarial networks,GAN)擴充自爆樣本數量,解決樣本數量不足的問題; 并對Faster R-CNN 檢測器使用特征融合策略增強,將多個卷積層所得到的淺層特征與深層特征融合,增強其對小尺寸目標的定位能力,使其能直接將缺陷塊作為識別目標。 改進后能使用單級檢測網絡直接在圖片上檢測出自爆缺陷塊。 通過實驗,驗證了該策略的有效性。
在航拍絕緣子圖像數據集中,絕大多數樣本都為正常樣本,含自爆缺陷的樣本只占極少數,屬于典型的不平衡數據集,需擴充少數類樣本以對數據集進行增強。 傳統的數據擴充方式為隨機過采樣,即從數據集中隨機復制一定的少數類樣本,或者在此過程中進行旋轉、拉伸、裁剪、亮度變化等簡單變化。 但這種方式擴充出的樣本和原始樣本的實際特性很相近,尤其是在高層特征中幾乎全盤保留了原始圖像的特性,多樣性不足,極易造成過擬合問題。
GAN 是2014年由Goodfellow 等設計出的一種框架,其首次提供了一種通過無監督學習得到數據深層次特征的方式, 為生成算法開啟了新的思路[6]。經典GAN的模型結構如圖1 所示。 GAN 讓生成器(generator,G)和判別器(discriminator,D)兩個網絡互相對抗進行學習:G 隨機從噪聲分布中采樣作為輸入,輸出合成樣本,意圖盡可能地生成與訓練集中真實樣本非常相似,又不完全相同的人工樣本;D的輸入為真實樣本或G 所生成的合成樣本,輸出一個介于0~1 的判別概率值, 意圖區分出人工樣本與真實樣本。 雙方以相互博弈的方式不斷提升自身性能,當最終達到納什均衡狀態,即D 的判別概率值一直為0.5 時, 這表明G 生成的樣本已經令D 難以與真實樣本區分,訓練結束。

圖1 GAN 模型結構Fig.1 GAN model structure
2015 年,Radford 等在經典GAN 框架的基礎上提出改進, 設計出深度卷積生成對抗網絡(deep convolution generative adversarial networks,DCGAN),專門用于生成圖像樣本[7]。 DCGAN 使用卷積神經網絡(CNN)取代了經典GAN 中的多層感知機來作為基本的特征提取器,并在G 與D 中都進行了批量規范化(batch normalization)處理,取消了池化層和全連接層并選用了更合適的激活函數,提升了訓練的穩定性以及生成樣本的質量。
1.3.1 模型改進
從數學上可證明GAN 在D 訓練到最優時G 同時取得最優,即達到納什均衡狀態[8]。 但在實際調試過程中, 發現原始的DCGAN 在訓練時經常出現梯度消失問題,使模型不能得到穩定訓練,生成樣本質量很差。 這是因為經典GAN 的損失函數相當于在D 取極限值時最小化真實分布和生成分布之間的JS 散度值,JS 散度值是KL 散度的一種對稱形式的變形。 對于兩個離散隨機變量f(x)與g(x),散度定義分別為

從推導可知,G 的目的是將生成分布與真實分布間的JS 散度最小化, 而D 的目的是測出生成分布與真實分布之間的JS 散度,GAN 的工作流程可理解為:先通過D 算出生成分布與真實分布之間的JS 散度,再依此令G 生成新的分布以降低兩者間的JS 散度。
但是, 由于JS 散度在兩分布無重疊或重疊部分可忽略時恒為零,所以并不適合衡量具有不相交部分的分布間的距離。 在現實中,真實分布和生成分布幾乎不可能有不可忽略的重疊,所以它們之間的JS 散度常恒為lg2,最終導致G 的梯度幾乎為0,D 性能很強時G 完全無法得到梯度信息。 針對此問題進行改進, 使用平滑的EM 距離 (earth mover′s distance)代替JS 散度。EM 距離衡量了將分布P1移動成分布P2時所需移動的平均距離的最小值,用來表示兩分布的相似程度。 在兩分布P1與P2所有可能的聯合分布中,采樣(x,y)于每一個可能的分布γ,計算出這對樣本的距離的期望值的下界,相當于分布P1到分布P2所需的最小距離。EM 距離的數學定義為


式中:D∈1-Lipschitz 為約束條件,即D 被更新后的值限制在常數值(-c,c)之間,使D 的目標函數平滑變化。
1.3.2 實驗過程
使用的改進版DCGAN 由輸入層、5 個反卷積層以及輸出層組成。 反卷積層包含反卷積、批量歸一化、激活函數3 個單元。 G 使用反卷積操作擴大數據維度,再通過批量歸一化以提高效率;前幾層的激活函數使用ReLU 函數, 最后一層則使用tanh函數控制輸出范圍以生成圖像樣本。對D 結構進行了一定改變, 由于使用了EM 距離代替了JS 散度,D 的功能轉變為近似擬合EM 距離, 屬于回歸任務而不是分類任務, 所以輸出層的激活函數被剔除。但這會使得D 的輸出可以到無限大,為了解決此問題,每次在D 參數更新后對其進行截斷處理,使其絕對值不超過某個固定常數值,使用卷積操作替代池化下采樣,所有層均使用斜率為0.2 的LeakyRe-LU 作為激活函數。
主要硬件配置為:Inter Core(TM) i7- 9700HQ@3.00 GHz CPU,內存32 GB,顯卡為NVIDIA Ge Force RTX 2060。使用Tensorflow(1.7.0)框架對算法模型進行訓練和測試, Python 版本為3.7。 此外,使用Matlab2020b 來輔助進行實驗。 所用數據集由國家電網公開絕緣子圖像數據集和網絡數據集兩部分組成[9]。共有587 張自爆絕緣子圖像,含600 個缺陷塊和817 個絕緣子;1 878 張正常絕緣子圖像,含2 445 個絕緣子。 將含自爆絕緣子的圖像定為正樣本,僅含正常絕緣子的圖像定為負樣本。 由于部分樣本圖像過亮或過暗, 利用直方圖均衡對這部分樣本進行亮度調節以突出目標特征,如圖2 所示,圖2(a)為亮度調節前,圖2(b)亮度調節后。

圖2 樣本圖像亮度調節對比Fig.2 Contrast of sample image brightness adjustment
將原圖中含有自爆區域的絕緣子區域裁剪后統一調整大小為256*256,作為“種子”送入改進型DCGAN 進行訓練以生成新的缺陷樣本。 為使得網絡更快達到納什均衡狀態,采用雙時間尺度更新策略,生成器的學習率設置為0.000 1,而判別器的學習率設置為0.000 4;使用Adam 優化器來更新參數, 但為避免動量值太高導致訓練動蕩,動量值由原始論文中建議的0.9 調整為0.5, 迭代14 000 次。圖3 是迭代部分生成圖像。可以看出,迭代12 000 次時生成的圖像已經基本滿足需求。

圖3 部分生成效果圖Fig.3 Partial generation effect picture
Faster R-CNN 檢測器由用于目標檢測的Fast R-CNN 和用于生成候選區域的區域建議網絡(RPN)構成,兩網絡相互獨立,但共用提取特征的CNN 網絡[10-11],結構如圖4 所示。 Faster R-CNN 工作時, 特征提取網絡通過卷積提取輸入圖片的特征并將所得的特征圖分別輸入給RPN 與感興趣區域池化(ROI Pooling)層;RPN 在特征圖上生成建議區域并將其輸入到ROI Pooling 層,ROI Pooling層對建議區域生成固定尺寸的特征圖并送入兩個全連接層中實現目標分類和邊界框回歸, 以確定目標類別與精準位置。

圖4 Faster R-CNN 檢測器結構Fig.4 Faster R-CNN detection process
Faster R-CNN 為單尺度特征檢測器, 檢測時只用到頂層特征[12],淺層特征會被拋棄。 這對于大尺寸目標的檢測來說影響較小, 因為大尺寸目標僅依靠富含語義信息的深層特征就足以實現檢測; 但小尺寸目標需要利用大量細節信息來進行定位,而細節信息則多體現于淺層特征之中,所以傳統CNN 檢測器在檢測小尺寸目標時往往難以實現良好的效果。
為更全面利用不同尺度特征以增強對小尺寸目標的檢測效果,利用特征金字塔(FPN)策略[13-14]改進檢測器, 自頂層向底層進行多尺度特征融合,將不同層的特征配合使用再分別進行預測。 由于僅需檢測自爆絕緣子這一類目標,在傳統的FPN 的基礎上進行簡化。 使用VGG-16 為Faster R-CNN 的骨架網絡,將5 個卷積單元輸出的特征圖定位為M1~M5。M1 含參數過多,故將其放棄;M2~M5 為不同尺寸與通道數的二維矩陣,進行特征融合之前需先統一通道數, 所以均先進行一次1*1*256 的卷積,將通道數統一為256。
M2 與M3 為淺層特征圖,M4 與M5 則為深層特征圖,選擇對M2 與M4 進行融合,M3 與M5 進行融合。 先對M4 與M5 進行四倍雙線性插值上采樣統一尺寸, 再使用加性融合函數分別與M2 和M3進行融合。 融合后都再進行一次3*3 的卷積消除混疊效應,得到新的特征圖P2 與P3。 將P2 與P3 都輸入其對應的RPN 與ROI Pooling,以檢測小尺寸的自爆缺陷塊,將候選區域轉換成維度一致的特征向量,然后輸入全連接層。 結構如圖5 所示。

圖5 特征融合的Faster R-CNNFig.5 Faster R-CNN based on feature fusion
實驗前需要先對圖片進行處理, 原圖大小為1 152*864,將含關鍵信息極少的邊緣部分裁剪后,再統一調整大小為500*750。 將每張大圖片裁剪為6 張,大小為256*256。 裁剪后,得到了含自爆缺陷的圖片共572 張,定為正樣本,將其作為“種子”送入DCGAN 生成更多的合成正樣本。 為詳細研究不同改進策略的改進效果,單級網絡的缺陷檢測實驗一共6 組進行對比,實驗設置如表1 所示。

表1 實驗設置Tab.1 Experimental setting
第1 組為原始組,不進行加強;第2 組和第3 組利用傳統的Faster R-CNN 檢測器, 但對訓練集進行了增強,加入了945 張人工生成樣本,其中第2 組利用傳統方式進行生成, 第3 組則使用E-DCGAN進行生成; 第4 組~第6 組使用特征融合的Faster R-CNN 檢測器,其中第4 組不對數據集進行增強,第5 組使用傳統方式對訓練集進行增強, 第6 組利用E-DCGAN 對數據集進行增強,加入的樣本數量同樣為945 張。 而為模擬真實情況, 所有測試集均由100 張原始正樣本和100 張原始負樣本組成,且每張圖像僅含有一個自爆缺陷塊。傳統方式選擇銳化、翻轉和逆時針旋轉90° 共3 種,生成的數量各占1/3。
使用已通過Imageage 數據集預訓練好的Faster R-CNN 網絡, 在此基礎上進行微調。 使用“end to end”的訓練方式,共迭代100 000 次,初始學習率設置為0.000 1,迭代50 000 次后調整為0.000 05,迭代動量設置為0.9。 實驗結果如表2 所示。

表2 實驗結果Tab.2 Experimental results
再使用傳統級聯網絡進行檢測, 其中使用文獻[15]的方式對定位出的絕緣子進行缺陷檢測,結果為識別數87,虛警數為5,訓練時間約8 h,而第6組訓練時間約3 h。
第1 組的實驗結果證明,在數據不足加上目標尺寸過小的情況下, 利用傳統的Faster R-CNN 檢測自爆缺陷塊的效果很不理想, 不僅識別率不高,半數以上的目標被漏檢, 還出現了大量的 “虛警數”,甚至很多負樣本上面也都出現了目標框,部分實驗結果如圖6 所示。

圖6 第1 組的部分檢測結果Fig.6 Partial test results of the first group
而第2 組和第3 組實驗說明,增強訓練集能明顯提高檢測效果, 尤其是虛警數得到極大的下降。第3 組的效果比第2 組更加明顯,其正檢數目增加了8 個,虛警數目下降了27 個,但是總體效果仍然難以滿足要求。 第4 組實驗結果證明,使用特征融合策略也能增強對小尺寸目標的檢測能力,尤其在降低漏檢數方面效果更明顯;同時使用兩種改進策略的第5 組和第6 組實驗效果最佳,漏檢率和虛警率都得到大幅下降,其中第6 組的效果明顯好于第5 組,正檢數目增加了8 個,漏檢數目減少了21 個,其部分結果如圖7 所示。

圖7 第6 組的部分檢測結果Fig.7 Partial test results of the sixth group
實驗結果表明,利用生成對抗網絡對數據集進行增強, 并利用特征融合策略加強Faster R-CNN檢測器對小尺寸目標的檢測能力。 利用本文提出的單級檢測網絡直接檢測自爆缺陷塊時也能起到足以媲美傳統的級聯網絡的效果,而且檢測速度明顯加快,訓練時間減少了5 h,且工作的繁瑣程度大大降低。
1) 在絕緣子數據集不平衡,自爆樣本數量不足時,擴充自爆樣本數量對數據集進行增強能提高檢測器對少數類目標的檢測效果,使得虛警數量大大降低。 通過使用以EM 距離取代JS 散度的改進型DCGAN 增強數據集, 效果明顯好于利用傳統圖像增強方式增強數據集;
2) 利用深淺層特征融合策略改進Faster RCNN 檢測器,能有效解決檢測器難以檢測自爆缺陷塊的問題。