劉沖沖,張力平,,任錦飛,陳群元
(1.長安大學 工程機械學院,陜西 西安 710064;2.長安大學公路養護裝備國家工程實驗室,陜西 西安 710068)
隨著紅外技術和電力設備的不斷發展,紅外檢測技術已經在電力設備故障診斷領域得到了普遍的應用,是用來檢測電力設備故障的重要手段之一[1]。紅外檢測技術是一種根據物體發熱情況,檢測是否發生過熱(故障)現象的診斷技術。在進行電力設備故障檢測時,具有不需要將檢測設備與電力設備直接接觸、降低了安全事故發生概率和電力設備帶電工作、效率高等優勢。在進行故障診斷過程中,對于不同類別電力設備進行精確的定位與識別,是進行設備是否發生故障和進行報警提示的關鍵[2]。雖然紅外檢測技術具有一定優勢,但是對于電力設備種類精確的定位與識別,還是需要依靠人工來完成,這對技術人員的專業性和經驗性要求極高,目前該方面的技術人員儲備較少。因此,對于紅外圖像數據進行檢測后,自動進行電力設備種類的定位與識別成為電力設備故障紅外診斷研究的重點[3]。
隨著深度學習的發展,該領域的研究人員不斷嘗試將深度學習的目標檢測模型應用到電力設備故障紅外診斷領域中[4-6]。當下比較流行的深度學習的目標檢測算法主要有Two-stage(分兩步進行工作)檢測算法和One-stage(分一步進行工作)檢測算法。由于流程的不同,使得這兩種檢測算法各有各的優點,各有各的缺點。就檢測精度而言,Two-stage優于One-stage;就檢測速度來說,One-stage比Two-stage更快。Two-stage中比較經典的為Faster R-CNN;One-stage中比較具有代表性的有YOLOv3、SSD等[7]。文獻[8]利用Two-stage型目標檢測對電力設備紅外圖像識別與定位,實現了7種電力設備的精準定位和精準識別,但是所消耗的時間較長,不滿足實時性要求。文獻[9]采用改進后One-stage型目標檢測算法對5種復雜背景下電力設備的紅外識別,識別速度較快,但是識別精度沒有太多提升,與改進前精度幾乎相近。
本文在YOLOv4-tiny的基礎上,為了解決在電力設備密集、工作環境復雜不便識別等問題:將水平矩形框變旋轉矩形框機制;用激活函數變Mish代替LeakyReLU,使得梯度在變化過程中平滑度得到提升,防止在小于零的區間范圍時出現梯度消失的現象;在特征提取部分,采用新的網絡進行特征提取,即使用雙重網絡提取特征并進行融合,充分利用多層特征圖的不同信息。最后,由實驗得到的數據證明了新網絡具有一定的實用價值。
YOLOv4-tiny屬于One-stage方法,是一個深度復雜的目標檢測。YOLOv4-tiny模型是YOLOv4的簡化版,其網絡參數量為600萬,只有YOLOv4的十分之一,使得檢測速度大大提高。YOLOv4-tiny網絡總體上可分為三個部分,第一部分主干特征提取網絡CSP Darknet53-tiny(簡化CSP Darknet53):該部分與YOLOv4的相似,都是在原始的Darknet53結構上加入CSPnet結構,不同的是YOLOv4-tiny該部分的殘差網絡不在進行堆疊;第二部分加強特征提取網絡:該部分采用的是FPN結構,相比于YOLOv4的加強提取網絡SPP+PANet結構,YOLOv4-tiny的加強提取網絡更輕量化;第三部分Yolov Head:該部分對提取到的特征進行卷積和預測操作。YOLOv4-tiny結構框圖如圖1所示,當圖片輸入后,在主干特征提取網絡中首先進行卷積和激活函數操作;然后進行殘差操作;之后進行卷積+激活函數操作,最終得到兩個有效特征層即26×26×256特征層和13×13×512特征層;將得到的有效特征層送入加強特征提取網絡,進行一系列卷積和上采樣操作,最終得到兩個帶有更多可靠信息的有效特征層;最后把帶有可靠信息的特征層送入Yolov Head進行預測。

圖1 YOLOv4-tiny的結構框圖
表1展示了YOLOv4-tiny和YOLOv4在同一數據集下進行工作的性能對比。從多組數據分析中可以看出,YOLOv4-tiny的模型為YOLOv4的十分之一左右,但是識別速度卻快了至少七倍。因此,YOLOv4-tiny模型更適合電力設備紅外過熱故障診斷過程中的設備種類識別,實現實時的電力設備種類檢測,為過熱故障識別做好準備。

表1 YOLOv4-tiny與YOLOv4性能對比
YOLOy4-tiny結構簡單使其檢測速度快,能夠適應電力設備紅外故障檢測實時性要求,但也帶來了特征融合不充分、利用率低以及顯著性不突出等缺點,大大降低了檢測精度,影響電力設備紅外故障診斷的結果。
YOLOv4-tiny結構精簡、檢測速度快,但檢測精度不高,無法對復雜場景中的電力設備目標進行精確檢測。針對電力設備紅外診斷的需求,以原始YOLOv4-tiny為基礎對其進行改進:①引入旋轉框機制代替矩形框機制,實現復雜場景下的電氣設備精準定位;②在特征提取網絡引入 Mish 激活函數,使梯度在變化過程中平滑度得到提升,防止在小于零的區間范圍時梯度消散;③使用兩層網絡(FPN+PAN)對主干部分獲得的特征層進行特征提取并進行融合,使多層特征圖的不同信息被充分利用。
在YOLOV4-tiny網絡中,采用的是矩形框機制,為了提高其在電力設備故障診斷領域的檢測精度,在原本的檢測網絡中將需要的旋轉框機制進入,實現在電力設備過大、相互重疊和背景復雜場景下的電力設備紅外目標精細化定位,以達到提高檢測精度的效果。
用來替換矩形框的旋轉矩形框如圖2所示,對于圖中每個旋轉矩形框的兩條相鄰的邊進行定義,分別定義為邊m與邊n:邊m指與坐標x軸正方向成角大于零度小于90度的邊,同時將成角定義為角度θ,并規定其取值范圍為[-π/2,0),圖中-30度和-60度指的就是角度θ;與邊m相鄰的邊就是邊n。通過位置向量(x,y,m,n,θ)表示出旋轉矩形框的位置,旋轉矩形框位置的確定主要依靠中心點與其高度寬度,其中中心點用x、y表示,框的寬度和高度用w、h來表示。

圖2 旋轉矩形框示意圖
旋轉框與水平框定位效果對比如圖3所示,通過對比可以發現,旋轉矩形框將之前框選到的其他設備去除,這有利于檢測精度的提高。

圖3 旋轉框與水平框定位效果對比圖
YOLOv4-tiny使用LeakyReLU作為激活函數(圖4),其表達式為:

圖4 LeakyReLU函數
LeakyReLU函數在小于零的區間范圍內梯度容易消失的,因而導致梯度更新過程的中斷,模型的神經元部分出現神經元死亡現象,針對這一不足之處,可以采用Mish函數(圖5)來替換,其表達式為:

圖5 Mish函數

圖6 FPN+PAN結構
Mish=x*tanh(ln(1+ex))
之所以采用Mish函數來進行替換,是因為Mish函數在小于零的區間范圍內梯度的更新并非完全被中斷,Mish函數允許部分小于零的梯度存在,保證了網絡梯度流的穩定,在進行訓練的過程中,相比較于LeakyReLU函數,提高了梯度下降的效果。Mish函數替代LeakyReLU函數這一舉措可以提高測試的準確率和訓練的穩定性。
在進行預測工作之前,還需要對特征層進一步優化,在原始的YOLOv4-tiny中,使用FPN結構對前一階段獲得的特征層進行進一步的特征提取,經過FPN模塊的處理后深、淺層特征層疊加合并在一起,使得淺層特征層可以傳遞深層特征的目的,但這個過程中存在目標位置信息未傳遞到深層特征層的問題,這個問題將會嚴重影響后期診斷的質量。為了解決這個問題,提出了將PAN結構后添加到FPN,PAN結構信息提取的過程彌補了FPN的不足。FPN結構與PAN結構的合理配合,解決了無法表達多個特征這一不足之處,有利于復雜環境下對電氣設備紅外圖像的充分利用。
實驗平臺的搭建包括計算機硬件、計算機軟件及環境,具體配置如表2和表3所示。

表2 計算機硬件配置表

表3 計算機軟件及環境

表4 紅外圖像數據集各設備數量
實驗所使用的數據集為自建數據集,來源于電網公司巡檢過程中獲得的電力設備紅外圖像以及上網搜集的電力設備紅外圖像,數據集紅外圖像包括變壓器、電壓互感器、隔離開關、電流互感器、絕緣子共5類變電站常見設備,合計2400張紅外圖像。
在進行實驗之前,要進行模型的訓練,需要對紅外相機采集到的紅外圖像進行標注,利用圖像標注的部分設備圖像如圖7所示。

圖7 數據集標注
為了較好地評估模型性能,將標注好的紅外數據按照 3∶1 隨機劃分訓練集和測試集。
為了綜合評估模型性能,采用每個類別的精度的平均值(AP)、AP的均值(mAP)以及檢測到目標物體的速度(Speed)作為衡量模型的評估指標。同時,為了驗證所提方法的有效性,采用YOLOv3、SSD、YOLOv4、YOLOv4-tiny作為對比方法。具體結果如表5和表6所示。

表5 改進算法對不同電力設備的測試結果

表6 不同方法的性能對比
結合表5與表6可以得出:相較于原YOLOv4網絡,所提方法的平均檢測精度均值提高1.89個百分點,表明所提方法在電力設備紅外圖像識別中具備一定應用價值;在檢測速度方面,所提方法的檢測速度略有下降,但相比其他方法,明顯具備優勢。
本文在YOLOv4-tiny檢測模型的基礎上,依照電力設備故障紅外檢測的需求,對該檢測模型進行優化,優化后的模型實現了在進行電力設備紅外診斷過程中的電力設備的識別,為電力設備的故障診斷提供了有利保障。通過引入旋轉框機制、改變激活函數和改進特征提取框架對YOLOV4-tiny進行了優化。實驗結果表明,改進YOLOv4-tiny模型的mAP值比YOLOv4-tiny模型提高了1.89%,具有較好的綜合性能。因此改進YOLOv4-tiny模型有利于電力設備紅外診斷過程中的電力設備的識別,對電力設備的故障診斷具有一定的現實意義。