






關鍵詞:電力巡檢;深度學習;YOLOv7;CBAM;DeepSORT
中圖分類號:TP391.4 文獻標志碼:A
0 引言(Introduction)
近年來,我國電力行業迅猛發展,但輸電線路通常完全暴露在外界環境中,使得大量工作器件易被損壞,因此定期巡檢工作尤為重要[1]。為了解放人力、提高巡檢效率和安全性,針對真實情景下的電網器件,智能化巡檢技術的研究與應用尤為迫切和重要。
當前,盡管已有眾多基于機器學習技術的檢測算法,但普遍面臨識別效率低、精度差的問題[2]。在電力巡檢工作中,由于存在大量被遮擋的待測目標,導致識別精度進一步降低,甚至出現誤檢、漏檢等情況[3]。綜合考慮上述問題,本文使用YOLOv7深度學習算法作為基礎識別模型,加入CBAM 注意力模塊,強調通道軸和空間軸這兩個重要維度上的意義和特征,同時將其檢測結果作為DeepSORT目標追蹤算法的輸入。實驗數據證明,相較于原始算法,改進后的算法模型可實現更精準的故障點位檢測、追蹤。
1 檢測算法及改進(Detection algorithm andimprovement)
目標檢測算法可分為單階段(One-Stage)和雙階段(Tow-Stage)兩大類。電力巡檢中,保證該項工作的準確性與實時性至關重要,而雙階段目標檢測算法會先生成所有可能存在的候選框,再進行下一步篩選,這一過程影響了巡檢作業的效率。YOLO(Only Look You Once)[4]是一款典型的單階段目標檢測算法,因為能在實現快速檢測的同時對目標進行較好的處理,所以已成為眾多領域的核心實時檢測系統。
1.1 YOLO算法
2016年,YOLOv1的發布標志著一種全新的目標檢測方法的誕生,它利用卷積對輸入圖片進行特征提取,相較于雙階段目標檢測算法,其識別效率得到大幅提升,版本可達45 FPS(Fast YOLO版本已達到155 FPS)。但是,由于每一個網格僅有兩個預測框,所以當存在多物體密集相鄰或小目標時,檢測精度較低。盡管如此,YOLOv1仍然奠定了整個YOLO系列的基礎。為了進一步提升性能,后續版本在損失函數、卷積數量、結構組合形式等方面進行了諸多改進。
1.2 YOLOv7
相較于其前幾個版本,YOLOv7主要針對模型結構重參化和動態標簽分配問題進行了優化[5];通過改進ELAN 結構(Efficient Layer Aggregation Networks),提出了E-ELAN(Extended Efficient Layer Aggregation Networks),這是一種適用于具有無限量疊加計算塊的高效聚合模型,它能在不破壞原始梯度路徑的同時,有效地增強網絡學習。v7版本以引導頭的預測結果作為指導頭,生成不同層次的標簽,并將這些標簽用于輔助頭和引導頭的學習[5]。
YOLOv7系列按照模型大小,可分為以下6 個模型:YOLOv7、YOLOv7-X、YOLOv7-W6、YOLOv7-E6、YOLOv7-D6、YOLOv7-E6E,官方為這些模型提供的性能參數如表1所示。
上述6個模型的主要組件如輸入層(Input)、主干網絡(Backbone)、頭部網絡(Head)都是相同的[6]。不同之處在于,每個模型的深度和寬度存在較大的差異。YOLOv7的識別速度最快,但在識別精度方面低于其他5個模型;YOLOv7-E6E雖然達到了較高的識別精度,但是識別速度最慢。綜合考慮電力巡檢作業的特點,本文選擇YOLOv7-X作為基礎模型。
1.3CBAM 注意力機制
注意力機制是一種在深度學習模型中嵌入的特殊結構。在訓練過程中,由于輸入的權重繁多,且注意力機制理論上能夠增強識別目標的權重,提高對圖像中關鍵信息的關注度,過濾無關或不重要的信息,本文新增CBAM 注意力機制,以期在算力有限的情況下,將計算資源分配給更重要的任務。
CBAM 是一種簡單且有效的前饋卷積神經網絡注意模塊[7],其整體結構如圖1所示。由于卷積運算是通過混合通道和空間信息提取特征,因此CBAM 結合了通道注意力模塊(Channel Attention Module)和空間注意力模塊(SpatialAttention Module)[7],旨在強調通道軸和空間軸這兩個重要維度上的意義和特征。
1.4CBAM-YOLOv7改進算法
CBAM-YOLOv7是指將CBAM 注意模塊嵌入YOLOv7Fig.3 Schematic diagram of spatial attention module structure中Backbone與Head的連接處,以此強化電力巡檢作業過程中待測目標的特征,提高模型的識別精度。YOLOv7 中Backbone層包含4個CBS(Convolutional Block Set)卷積層,將輸入特征圖尺寸變為160×160×128 的大小,然后經過MPConv1+ELAN 模塊提取大量特征。文中分別在3 個ELAN模塊處添加CBAM 注意力模塊,在將所提取的特征向上傳遞的同時,經過CBAM注意力模塊傳輸至Head層。改進后的CBAM-YOLOv7算法結構圖如圖4所示。
2 目標追蹤(Target tracking)
電力巡檢作業的識別目標涉及絕緣子、防震錘、參照標識等大量類別,單純依賴目標追蹤技術已無法滿足復雜的巡檢工作需求。為此,本文選擇DeepSORT[11]作為目標追蹤算法,并將其與改進后的CBAM-YOLOv7模型融合,以期實現更高效的巡檢作業。
2.1 DeepSORT
DeepSORT算法是在經典目標追蹤算法SORT(SimpleOnline and Realtime Tracking)的基礎上引入了深度學習(DeepLearning)思想[12],即引入了一個低復雜度的輕量級卷積模塊CNN來提取待檢測目標的外觀特征,在每次檢測+追蹤后進行一次物體外觀特征的提取操作并保存。在后續的每一步中,均需執行一次當前幀被檢測目標的外觀特征與之前存儲的外觀特征之間的相似度計算,并將其計算結果作為一個重要的判別依據。
在目標追蹤過程中,目標的位置、狀態等信息在不同時刻存在差異,但需要讓每個待測目標保持同一個ID。DeepSORT中引入匈牙利算法(Hungarian Algorithm),結合Re-ID(Re-Identification)特征提取模型和馬氏距離,基于Hall定理中充分性證明的思想,利用增廣路徑求二分圖最大匹配的方式實現將卡爾曼濾波(Kalman Filter)得到的預測框與目標檢測得到的檢測框進行級聯匹配(Matching Cascade)和IoU 匹配(IoUMatch)[11],實現在含有不確定因素的情況下,通過傳入的數據預測下一幀中標注框的位置,完成對每個目標的追蹤,并且對其賦予一個單獨的ID編號。
2.2CBAM-YOLOv7 amp; DeepSORT模型
本文將改進后的CBAM-YOLOv7模型結合DeepSORT算法完成針對電力巡檢作業檢測+追蹤的整體功能,具體步驟如下。
如圖5所示,CBAM-YOLOv7作為檢測模型,對輸入視頻中每一幀所包含的待識別目標進行檢測,并輸出其所對應的檢測框信息。同時,將所得信息作為觀測值(Detection)輸入DeepSORT目標追蹤模塊中,利用卡爾曼濾波判斷是否存在軌跡(Track),若存在,則對其位置信息進行先驗概率預測,得到先驗預測值。這些先驗預測值在匈牙利匹配模塊中依次進行級聯匹配和IoU匹配,最終得到一個匹配結果列表。該列表包含先驗預測值、觀測值,以及沒有匹配到的Track和Detection。在卡爾曼更新模塊中對匹配成功的元素進行后驗預測,得到最終的修正坐標,更新卡爾曼增益、協方差矩陣等參數,至此完成一幀檢測,然后對剩余視頻幀循環執行上述操作直至處理完全部視頻。
3 實驗結果分析(Experimental results analysis)
3.1 實驗環境
本次實驗使用的硬件包括NVIDIA RTX3060顯卡、AMDRyzen 7 5800H處理器;軟件環境包括Windows 10×64操作系統、Anaconda3-4.12.0、Pytorch 1.13.1+cu117、Python 3.7,同時安裝所需依賴庫。
3.2 數據集
由于電力巡檢相關數據集大多未公開,因此本研究使用的原始數據集相對有限,均來自飛槳AI社區、GitHub等公開網絡資源。為減小噪聲、光照、對比度等不利因素對實驗結果產生的影響,本文分別通過MSRCR(Multi-Scale Retinex withColor Restoration)圖像增強算法[13]和雙邊濾波處理[14]兩種方式對原始數據進行了增強和去噪,顯著地提升了數據集的質量。同時,通過尺寸變換、水平/垂直鏡像、平移/增加噪聲、對比度增強、開/并運算、背景變換等方式,大幅擴充了數據量,最終參與實驗的數據集達到了17000張。本文將數據集以4∶1的比例進行劃分,其中訓練集包含13600張圖片,測試集包含3400張圖片。
3.3 目標檢測算法實驗為了驗證
CBAM-YOLOv7模型在電力巡檢作業中目標檢測能力的提升效果,本文引入了精確度(Precision)、召回率(Recall)、平均精度(Average Precision,AP)3個評價指標。原YOLOv7算法與本文提出的CBAM-YOLOv7模型基于上述3個評價指標的性能參數對比如表2所示。
由表2可知,相較于原YOLOv7算法,本文提出的CBAMYOLOv7模型精確度提升了0.79百分點,召回率提升了1.22百分點,平均精度提升了1.71百分點。實驗結果表明,該模型有更好的檢測效果。
圖6、圖7分別為原始YOLOv7算法和改進后CBAMYOLOv7模型針對同一張驗證圖片的檢測結果。圖6中,YOLOv7算法出現了較為明顯的漏檢、誤檢現象,僅檢測出較為明顯的待識別目標且置信度較低。相比而言,CBAMYOLOv7模型可以更好地檢測出較隱蔽和重疊率較高的待識別目標,進一步說明其優勢。
3.4 目標追蹤算法實驗
如圖8所示,DeepSORT算法可較好地鎖定輸入視頻中包含的待識別目標。即使部分待識別目標在視頻中展示得不太明顯,DeepSORT算法仍然完成了目標追蹤。為驗證該模型的穩定性,本文引入多目標跟蹤精度(Multiple Object TrackingAccuracy,MOTA)[15]這一評價指標,選取10段視頻進行測試,并將所得實驗參數進行對比。
所測10段視頻的平均多目標跟蹤精度為87.817%,具體數值如表3所示。這一結果說明本文所提的CBAM-YOLOv7 amp;DeepSORT模型對于輸電線路中所包含待識別的目標具有較好的處理效果。
4 結論(Conclusion)
針對現實復雜情境下,輸電線路待檢測目標識別精度不足、效率低等問題,本文提出了一種新的CBAMYOLOv7amp;DeepSORT算法模型。通過對YOLOv7目標檢測算法進行改進,將CBAM 注意力模塊嵌入Backbone和Head的連接處,引入DeepSORT目標追蹤算法,實現檢測+追蹤的整體功能。實驗結果表明,CBAM-YOLOv7算法為后續目標追蹤任務提供了更好的前件輸入,DeepSORT作為最終處理算法,實現了理想的追蹤效果。因此,本文提出的CBAMYOLOv7amp;DeepSORT模型可以在實現高檢測精度的同時,完成對目標的鎖定追蹤,方便了電力巡檢作業后期數據匯總、維修統計等問題。
當前,模型尚未實現針對電力巡檢內容的全面覆蓋。在未來的研究中,將重點放在進一步豐富檢測類別和提高數據集的數量領域。在涵蓋更多檢測內容的同時,提高檢測精度,更好地適配真實場景下的電力巡檢作業。
作者簡介:
李申陽(2003-),男,本科生。研究領域:深度學習,圖像處理。
喻恒(1981-),男,碩士,副教授。研究領域:視覺物聯網,智能感知。
鄧文帥(2003-),男,本科生。研究領域:目標追蹤,深度學習。
陳曉行(2001-),男,本科生。研究領域:目標檢測,深度學習。
楊宸(2003-),男,本科生。研究領域:機器視覺,目標追蹤。