廖承就,張磊,張惠榮,陳華超,鄭路銘
(1.廣東電網有限責任公司惠州供電局,廣東 惠州 516000;2.廣州中科智巡科技有限公司,廣東 廣州 510623)
輸電線路鐵塔大多分布在荒野地帶,線路分布廣、由于線路“無圍墻”容易導致線路周邊第三方施工、人為破壞、重車碾壓等隱患,因此需要投入很大成本在輸電線路巡檢等安全防護上。現在主要采用人工徒步巡線、無人機巡線、人工監控攝像頭等判斷是否存在外力破壞危險的手段。
近年來,智能圖像視頻監控技術被廣泛應用于輸電線路場景下的施工機械入侵報警任務中,但是,其對小目標及遮擋目標的識別效果有待提升。本文通過引入CBAM 模塊,添加了注意力機制方法,設計了Fusion-CBAM 用于增強算法實現,為輸電線路安全隱患分析提供基礎。
YOLOv5 包含3 個不同尺度的yolo head,每個yolo head 上預設了3 種錨框比例,在同類型算法上具有速度以及精度的優勢。
CBAM 是一種混合注意力機制方法,是網絡的一種構型,當輸入是一組長度可能會發生變化的向量時,實際訓練的時候無法充分發揮這些輸入之間的關系而導致模型訓練結果效果極差,可以嵌入任何主干網絡中,以提高算法的性能。
YOLOv5 整體模型結構如圖1 所示,具備以下的優點:(1)基于CSPDarknet53 網絡的干網絡結構設計。(2)對特征金字塔網絡(FPN)進行了改進,結合了路徑聚合網絡(PANet)。(3)檢測頭網絡進行特征映射,這一步主要對融合后的特征圖進行,輸出圖像中缺陷目標的位置信息和類別信息。如圖1 所示。

圖1 網絡主體結構
為了充分利用網絡的注意力,更好地檢測出被遮擋的施工機械防外破隱患,通過設計一種融合的CBAM 模塊并將其添加進添加進網絡中,如圖2。

圖2 CBAM 注意力機制
Fusion-CBAM 分別由融合空間注意力模塊以及融合通道注意力模塊的計算公式可表示為:
在YOLOv5 在訓練時對錨框進行相應的計算,其主要方法如下所示:
(1)計算數據集中所有樣本的寬和高。(2)對圖片進行壓縮,根據預設好的壓縮尺寸進行處理。(3)修改框的坐標,由相對坐標改為絕對坐標。(4)篩選符合一定像素值的標注框,過濾像素值不足的部分。(5)使用k 均值聚類三方得到錨框的計算結果。
2.4.1 定位損失
定位損失函數如下式:
回歸殘差定義如下:
2.4.2 分類損失
分類損失(Focal loss)通過添加不同的權重給到不同標注數據的Loss,來解決對分類算法問題中的類別不平衡,分類難度相差異較大的情況。交叉熵函數可表示為:
通過采集監控數據,標注的信息包含類別名稱和位置信息Xmin、Ymin、Zmin、Xmax、Ymax、Zmax。將數據按照3∶1∶1 的數量比例劃分。
配置4 核以上處理器CPU 設備,使用Tesla T4 顯卡設備進行試驗。
算法實驗結果,如表1 所示。

表1 算法實驗結果
如圖3 所示,對目標物體進行檢測。

圖3 算法檢測圖示
針對復雜場景下的目標遮擋問題,設計Fusion-CBAM 注意力模塊改進YoloV5 算法。通過改進的方法提升了算法對遮擋目標的識別檢測的性能。該算法相比改進前的分析方法大大提高了召回率。對視頻監控的智能化算法具有很好的實用價值。結合該算法的日常巡檢系統,已經部署使用,提升了日常巡視的效率。