許 揚,凌德泉,嚴 鋒,陳曉建,張一辰,籍天明
(1.國網南通供電公司,江蘇南通 226000;2.南京土星視界科技有限公司,江蘇南京 210019)
隨著人工智能技術的發展與應用,自動識別出無人機巡檢所采集到圖像數據中的線路缺陷與目標已成為了可能[1-3],并進一步提高了輸電線路無人機巡檢的智能化水平。而防振錘作為輸電設備中的重要部件,在防止輸電線路因風力振動而引起導線斷股、金具損壞方面起著重要作用[4-6]。防振錘因自然老化、風雨侵蝕、雷擊或人為破壞會有一定比例的破損,需要定期檢修更換[7-8]。為此,基于無人機圖像的破損防振錘目標識別將成為線路自動化巡檢的重要一環。
相比于圖像處理方法,機器學習方法具有高魯棒性和高擴展性的特點。在圖像檢測領域中,研究人員逐漸放棄圖像處理方法轉而使用機器學習方法進行研究[9-11]。同時,隨著深度學習圖像檢測的快速發展,更優秀的新算法不斷被提出。因此,該文采用物體檢測算法EfficientDet 對圖像中的防振錘進行識別定位,并取得了良好的識別效果。實驗結果表明,相較于Faster-RCNN 與SSD-512 深度學習模型,EfficientDet-D7 模型在防振錘檢測中的準確率、召回率與運算效率均有較大優勢。
EfficientDet 是谷歌團隊于2019 年提出的新型深度學習模型,其提出了一種新的模型縮放算法,旨在不犧牲精確度的前提下提升效率,與傳統方法對各個維度進行排列組合不同,EfficientDet 通過神經結構搜索技術獲得最優的復合系數[12]。當融合具有不同分辨率的特征時,常用的方法是先將其調整至相同的分辨率,然后再對其進行融合。由于不同的輸入特征具有不同的分辨率,且其通常對輸出特征的貢獻是不相等的[14-16]。為了解決這一問題,EfficientDet 提出為每個輸入特征增加一個額外的權重,并使網絡學習每個輸入特性的重要信息,即雙向特征金字塔網絡BiFPN?;谶@一思想,模型考慮了3 種加權融合方法:
1)無界限融合(Unbounded Fusion)

式中,wi是學習的權重,該權重既可以針對特征,也可以針對通道,還可以針對像素。但是由于權值不受限,可能會造成訓練的不穩定。因此,可以采用權值歸一化的方式限定每個權重的范圍。
2)基于Softmax 函數融合

上述方式實際上是通過Softmax 函數的方式對權重值的范圍進行限定,但Softmax 函數操作對硬件GPU 的兼容性較差,會降低運算速度。
3)快速歸一化融合

快速歸一化融合方式在某種程度上是為了避免Softmax 操作的資源消耗,權重wi使用ReLu 激活函數,以保證wi≥0,從而避免數值不穩定。
BiFPN 集成了雙向跨尺度連接與快速歸一化融合,例如其在Level 6 中兩個融合特征的加權操作為:

EfficientDet 網絡結構采用了階段目標檢測器的設計,以EfficientNet 作為骨干網絡,BiFPN 作為特征網絡,將從骨干網絡提取出來的特征{P_3,P_4,P_5,P_6,P_7}反復使用BiFPN 進行自上而下和自下而上的特征融合。融合的特征通過類別預測網絡和框預測網絡,分別對檢測類別與檢測框進行預測。
為了實現速度與精度的平衡,EfficientDet 在不同等級的(d0~d7)骨干網絡上選擇了不同個數的組件。其中,BiFPN 特征網絡的寬度(通道數)與深度(層數)采用以下的縮放系數:

檢測類別和檢測框的預測網絡寬度與BiFPN 保持一致,采用以下方法線性增加網絡深度:

由于BiFPN 主要使用第3~7 特征層,所以輸入圖片的分辨率線性增加為:

總體而言,EfficientDet 同時提升了模型的精確度和效率,其準確率優于之前的階段目標檢測器。已有學者將EfficientDet 應用于實際的目標檢測任務當中,并取得了良好的效果。
該文采用EfficientDet-D7 模型識別無人機巡檢圖片中的防振錘目標,其包括正常防振錘與破損防振錘,目標識別流程如圖1 所示。

圖1 防振錘識別流程
首先使用優化的EfficientDet 目標檢測模型對圖像進行檢測,在檢測結果中剔除線夾、遮擋防振錘、連接件和其他類型干擾,僅保留識別出的防振錘類型。然后使用VGG19 分類網絡模型,對第一步結果進行綜合分析與分類判定。當第一步識別出的防振錘置信度大于閾值時,則使用較低閾值對分類網絡提取出的目標特征進行過濾。若未能識別目標細節特征,則判定為非防振錘。當識別到防振錘目標的細節特征不完整時,則判定為破損防振錘;否則,判定為正常防振錘。
被遮擋是物體檢測中常見的難點之一,遮擋會帶來物體信息的缺失,從而造成檢測器的漏檢和誤檢。在破損防振錘的檢測任務中,通常表現為將正常防振錘識別為破損防振錘。防振錘的遮擋也分為兩種情況:1)只拍攝了局部的防振錘(圖像邊緣切割);2)防振錘的局部被如桿塔等其他設備設施或異物所遮擋。
模型中對于這兩種遮擋情況分別采用不同方式進行處理。只拍攝局部的防振錘被圖片的邊緣切割,所以在判別某個防振錘為破損后,需要額外計算此防振錘的寬度與距邊界最近距離的比值。當這一比值大于設定閾值時,則認定防振錘的破損由畫面切割引起,予以過濾。對于第二種類型,被異物遮擋的防振錘與破損防振錘之間存在明顯的特征差異,破損防振錘通常在小錘掉落后漏出半截橫擔。為此,在目標檢測網絡的訓練中標注被異物遮擋的防振錘,與破損防振錘作為兩個不同的類型進行訓練,并在檢測結果中進行分類,剔除分類為遮擋的防振錘。
EfficientDet模型基于PPN和PANet提出了BiFPN方法,對不同層之間進行特征融合,增加了小目標的檢測能力。但EfficientDet 的輸入圖片大小是有限制的,檢測前需要對輸入圖像進行重采樣,原先超過6 000×4 000 像素(常見的無人機精細化巡檢所拍攝圖片的尺寸)的圖像會被壓縮到1 536×1 536 像素(EfficientDet-D7)。為了進一步增加對小防振錘的檢測能力,該文使用切割-檢測-融合的方式對檢測流程進行優化?;诖藘灮椒ǎ壳翱蓪崿F最小約50 像素的防振錘目標識別,如圖2 所示。

圖2 切割-檢測前后結果對比
3.1.1 訓練數據
該文模型訓練和驗證數據均來源于無人機航拍的高清圖片,原始數據大小為6 000×4 000,使用LabelImg 軟件進行標注。在訓練中,對圖片進行剪切、旋轉、翻轉、縮放、增加高斯噪聲等方式實現訓練圖片的在線增強。在實際運行的輸電線路上,破損防振錘數量遠少于正常防振錘,所以破損防振錘的樣本數據更難以獲取,為此該文只使用少量破損防振錘數據驗證模型的性能。防振錘數據集詳細分布如表1 所示。

表1 防振錘數據集詳細分布
3.1.2 訓練配置
實驗采用EfficientDet-D7 模型,平臺系統為Ubuntu 20.04。硬件上使用的GPU 包括Nvidia RTX 2080Ti 與Tesla P100,采用PyTorch 深度學習框架,損失函數采用聚焦損失函數(Focal Loss),神經網絡訓練次數為10 萬次。根據以往的訓練經驗,首先采用Adam 優化器進行訓練,其使用了梯度的一階矩估計和二階矩估計來自適應地調整每個參數的學習步長。等訓練擬合后,改用SGD 優化器繼續訓練,Adam 優化器的學習率設置為1×10-4,SGD 優化器動量設置為0.9,學習率設置為1×10-4。
為了更優地評估EfficientDet-D7 模型的性能,該文在目標檢測中選取Faster-RCNN 與SSD-512 模型使用相同的數據進行訓練,并與EfficientDet-D7模型作性能對比。
防振錘目標檢測需要返回目標框位置信息和二分類置信度,評估指標主要由準確率P(Precision)、召回率R(Recall)以及平均準確率mAP(mean Average Precision)來評價測試的結果。mAP是一種常用、科學的評價指標,其中:

式中,Q指測試集個數,AP為每次測試的平均精度。
實驗結果表明,雖然EfficientDet-D7 模型在訓練時長和模型大小方面均不占優勢,但準確率與召回率均高于其他兩個模型。由表2 可知,采用改進EfficientDet-D7 目標檢測模型的準確率與召回率分別為93.3%和91.8%,mAP為51.16%,其中漏檢以過小的防振錘和模糊的防振錘目標為主,誤檢多出現在有復雜背景的圖像中,總體表現較優。

表2 防振錘目標檢測實驗結果
由圖3 可知,當檢測圖片中出現目標較多且背景復雜并具有相似特征金具的情況下,EfficientDet-D7 模型比Faster-RCNN 模型和SSD-512 模型表現更為優秀,其具備更理想的抗干擾能力與識別速度。

圖3 3種方案的識別情況對比
由表3 可知,第二步分類網絡中對于破損防振錘的判斷正確率與召回率分別為85.4%和81.7%,正常防振錘正確率與召回率分別為97.8%、89.9%,已接近實用性能。綜上所述,使用基于改進EfficientDet目標檢測網絡的破損檢測方法,先檢測再分類判別目標,結合對小目標防振錘、被遮擋防振錘、傾斜角度防振錘和雜物干擾的優化方案,能夠較好地識別防振錘并判斷其是否破損。

表3 破損防振錘分類檢測結果
基于人工智能技術,該文深入研究了破損防振錘的檢測模型。對于實際檢測中遇到的防振錘目標過小、拍攝角度歪斜、防振錘部分被遮擋等問題,采用多種優化方法提高了目標識別與分類的準確性。實驗結果表明,該文所提出的防振錘檢測方法具有良好的實用性,其中第一步改進的EfficientDet 防振錘目標檢測網絡,顯示出了優于Faster-RCNN 與SSD-512 目標檢測模型的性能;第二步中破損防振錘分類網絡的正確率和召回率也較為理想,具有良好的工程應用價值。