俞賢文,郝紅衛(wèi),馬永奎
(國網(wǎng)寧夏電力有限公司中衛(wèi)供電公司,寧夏中衛(wèi),755000)
紅外檢測技術(shù)已經(jīng)在電網(wǎng)中得到了大量應用,是當前電力設(shè)備狀態(tài)檢測的重要手段之一[1]。傳統(tǒng)的紅外檢測技術(shù),主要依賴于人工檢查,對技術(shù)人員專業(yè)背景和經(jīng)驗知識要求較高,需要耗費大量人力物力。因此,采用高效的目標檢測方法對紅外電力設(shè)備圖像進行快速分類和精準定位具有重要意義。
YOLOv3[2]算法使用深度神經(jīng)網(wǎng)絡提取深層特征和淺層特征,利用更具鑒別性的深層特征提高檢測的精確度,在兼顧速度的同時具有較高的精度。本文基于YOLOv3算法提出了改進算法。將注意力機制,多尺度檢測層,Involution算子等與YOLOv3結(jié)合,實現(xiàn)紅外電力設(shè)備圖像的檢測。本文所提方法在自制紅外電力設(shè)備數(shù)據(jù)集上的實驗結(jié)果表明,與傳統(tǒng)方法相比,能在精度較高的同時,減少模型參數(shù)量,并達到實時檢測的速度。
當前注意力機制在計算機視覺領(lǐng)域中受到了研究者的廣泛關(guān)注,常常被應用到圖像分類、檢測和分割等視覺子任務當中。
陳琳琳[3]等人針對傳統(tǒng)的圖像分類方法精度低的問題,在卷積神經(jīng)網(wǎng)絡的圖像分類模型中加入了注意力機制,給出了一種基于注意力機制的特征提取模塊,利用該模塊可提取不同尺度下圖像的重要特征并對其進行精確分類。王翔[4]等人根據(jù)電磁數(shù)據(jù)的時空特征,通過引入通道注意力機制與空間注意力機制實現(xiàn)對關(guān)鍵特征的表示,實現(xiàn)時間序列異常檢測。儲珺[5]等人針對現(xiàn)有目標檢測器特征金字塔無法充分利用不同尺度特征圖的特征信息,不適用于低分辨率圖像的目標和小目標的檢測。將通道注意力機制和殘差學習塊相結(jié)合,構(gòu)造新的目標檢測器。該檢測器通過在不同通道中使用注意力機制學習其通道權(quán)重,有效增強了特征的全局表示能力。郭寧[6]等人將注意力機制引入卷及神經(jīng)網(wǎng)絡的解碼部分,通過增大關(guān)鍵信息權(quán)重以突出目標區(qū)域抑制背景像素干擾,給出了一種融合注意力機制和密集空洞卷積的具有編碼—解碼模式的卷積神經(jīng)網(wǎng)絡,進行肺部分割。
為了解決當前應用中YOLOv3算法存在的不足之處,使其更適用于自制紅外電力設(shè)備目標檢測數(shù)據(jù)集,本文針對YOLOv3算法進行了以下改進:首先,進行k-means聚類分析重新確定Anchor的尺寸并增加YOLOv3算法檢測層的尺度,提升變電站復雜環(huán)境中電力設(shè)備小目標的檢測效果;隨后,將YOLOv3的特征提取網(wǎng)絡由Darknet53替換為CSPDarknet53結(jié)構(gòu),并使用了Involution卷積進行對CSPDarknet53中的卷積操作進行優(yōu)化在保證性能略有提升的情況下大幅度降低計算復雜度,最后,將一種輕量級局部空間嵌入通道注意力模塊引入到Y(jié)OLOv3算法中,能夠在僅僅增加少量計算復雜度的情況下,使算法獲得較大的精度提升。
針對紅外電力設(shè)備圖像尺度及形態(tài)的多樣性導致目標檢測器性能下降的問題,利用YOLOv3算法思想,選擇將低層特征和中層特征進行融合,構(gòu)成包含多尺度位置信息和語義信息的特征融合層。在原有網(wǎng)絡的基礎(chǔ)上將深層特征通過上采樣操作將其特征圖尺寸放大到與低層特征相同,然后進行Concat操作構(gòu)建160×160尺度的新檢測層,可以將圖像劃分為更加小的單元格,檢測出更小尺度的物體,提高對小目標的檢測效果。
本文中提出的殘差融合模塊,設(shè)計思想是受殘差網(wǎng)絡的啟發(fā)而來,殘差模塊實際上可以當作通用函數(shù)逼近器,將特征提取網(wǎng)絡的學習目標由擬合普通卷積的恒等映射函數(shù)H(x)=x轉(zhuǎn)換為學習殘差網(wǎng)絡中的殘差函數(shù)F(x)=H(x)-x,通過這種結(jié)構(gòu)可以在消除部分冗余特征的同時突出各層中特征的微小變化,并且可以實現(xiàn)不同通道信息的融合。
具體包括:1)本文所提出的殘差融合塊是用于獲取局部空間信息,優(yōu)化局部通道信息,最后進行多個通道信息的融和。2)為了保存兩組分別沿著兩個空間方向聚合的空間信息嵌入特征,本文調(diào)整了殘差融合模塊中各卷積層的通道數(shù),使其輸入通道數(shù)和輸出通道數(shù)與聚合后的特征相同,對聚合后的輸入特征進行優(yōu)化。
局部空間嵌入通道注意力模塊中空間嵌入通道注意力的網(wǎng)絡結(jié)構(gòu)中直接使用全局平均池化和全局最大池化獲取通道注意力的全局空間信息,會將所有空間信息壓縮到單一通道當中,導致空間信息的丟失。為了解決這一問題,本文對兩個全局池化操作進行了拆解,變成兩對一維特征編碼操作,實現(xiàn)全局空間信息的嵌入。全局池化的計算方式公式(1)所示:
其中Fgp(xn)為與第n個輸出通道關(guān)聯(lián)的輸出特征。進行分解后,對于輸入特征,分別對全局平局池化和全局最大池化使用尺寸為(H,1)或(1,W)的池化核沿著水平坐標和垂直坐標對所有通道進行編碼。所以,高度為h的第n通道的輸出可以分別表示為:


寬度為w的第c通道的輸出可以表示為:

上述兩對變換,分別沿著空間中的兩個方向聚合特征,得到兩對嵌入空間信息的特征圖,具體來說,沿著其中一個方向獲取長程依賴關(guān)系信息,沿著另一個方向保留精確的空間依賴信息,從而獲取全局感受野并精準的編碼空間位置信息,幫助網(wǎng)絡更精準的定位感興趣的目標區(qū)域。
通過嵌入空間位置信息的變換之后,將利用上述特征信息進行空間嵌入通道注意力的生成,這一過程必須滿足以下兩個標準,首先,它能夠充分利用到獲取的精確位置信息,精確地定位感興趣的目標區(qū)域。其次,可以有效的進行跨通道的信息融合,精準的捕捉到不同通道之間的關(guān)系。
為了驗證本文算法那的檢測效果,在自制紅外電力設(shè)備數(shù)據(jù)集上進行了實驗,并與當前主流檢測算法進行對比實驗。使用平均準確率(mean average precision,mAP)和檢測幀率(frame per second,F(xiàn)PS),作為評價指標。
本文的實驗環(huán)境如下:windows 7操作系統(tǒng),32GB內(nèi)存,Intel i7-9700K CPU,NVIDA GeForce GTX 2080TI (11GB顯存) GPU,使用pytorch深度學習框架,版本為pytorch 1.7,并配置CUDA10.1+CUDNN7.6實現(xiàn)GPU加速運算。
本文利用收集到的某變電站各類可見光和紅外圖像樣本8475張,使用LabelImg工具按照2種電壓等級(500kV、220kV)、8大類設(shè)備(變壓器、斷路器、CT、PT、GIS、高抗、電抗、避雷器)、各類型號、各種部位對搜集到的紅外圖像進行分類、整理、標注,最終篩選出7903張質(zhì)量較好的紅外圖像并制作成PASCAL VOC格式的紅外電力設(shè)備數(shù)據(jù)集。圖1和圖2分別為紅外電力設(shè)備數(shù)據(jù)集的樣例和檢測結(jié)果。

圖1 紅外電力數(shù)據(jù)集的樣本圖像

圖2 紅外電力數(shù)據(jù)集的樣本圖像檢測結(jié)果
從圖2可以看出,本文給出的算法其檢測框位置與原始標定框位置重合度高,效果好。
表 1為 Faster-RCNN、YOLOv3、Ad-YOLO-SENet、Ad-YOLO-SECANet等算法檢測結(jié)果的對比,通過實驗結(jié)果可以發(fā)現(xiàn)本文所提Ad-YOLO-SECANet算法相比于YOLOv3算法精度提高了1.5個百分點,相對于Ad-YOLO-SENet算法提高了0.6個百分點,且檢測速度更快,實驗結(jié)果表明,本文中的方法可以有效提升檢測的精度并具有實時檢測的能力。

表1 在紅外電力圖像數(shù)據(jù)集上的檢測結(jié)果
針對紅外電力設(shè)備檢測中存在的多尺度和多形態(tài)的問題,本文在YOLOv3算法的基礎(chǔ)上,通過添加160×160尺度檢測層增加網(wǎng)絡對小目標檢測的敏感性,然后使用Involution算子對Backbone的結(jié)構(gòu)進行改進,在減小參數(shù)量的同時,獲得了精度的提升,最后,提出新的輕量級注意力機制對特征進行。實驗結(jié)果證明,本文給出的算法在測試集上的精確度為83.1%,同其它網(wǎng)絡模型比較,具有較好的檢測性能和魯棒性,證明了本文所提出方法的有效性,為變電站設(shè)備紅外檢測提供了更加精準高效的檢測思路。