徐文靜 高云天 陳 晨 葉澤恩(天津工業(yè)大學,天津300387)
絕緣子是輸電線路中常見絕緣器件,需要對其進行故障檢測。利用人工智能技術[1]可以提升絕緣子故障檢測的智能化,而且借助人工智能技術自動識別絕緣子故障已成為一種趨勢。但是,目前智能的識別方法依賴于有標注的樣本庫。
目前圖像標注方法主要有兩種:一種是利用LabelMe、Label Image[2]等標注軟件進行人工手動標注,這種方法在標注大量數(shù)據(jù)集時往往費時耗力。另一種是利用開源數(shù)據(jù)集“外包平臺”和調用API 進行標注,這種方法增加了維護成本。因此,需要研究適合絕緣子檢測的圖像自動標注方法。本文的目的就是設計一種絕緣子圖像自動標注方法。
YOLO(You Only Look Once)是目標檢測領域常用的神經(jīng)網(wǎng)絡模型,直接輸入整張圖片,是端到端的網(wǎng)絡模型。YOLOv5模型是YOLO 模型的版本之一,在v5 發(fā)布前有v1、v2、v3、v4 等版本,其網(wǎng)絡結構不斷強化,模型訓練速度不斷提升。YOLO 官方[3]發(fā)布的YOLOv3 網(wǎng)絡與其它網(wǎng)絡性能對比情況如圖1 所示。

圖1 YOLOv3 與其它網(wǎng)絡性能對比[3]
由圖1 可知,YOLOv3 模型具有高準確率、低耗時等特點。與v3、v4 等版本相比,v5 版本模型訓練速度更快,精確度更高。
使用YOLOv5 模型,只需適當調整模型參數(shù),訓練模型后,便可準確檢測絕緣子圖像。如圖2 所示,絕緣子圖像自動標注的實現(xiàn)流程可分為模型訓練和自動標注兩部分,模型訓練過程包括人工標注、構建數(shù)據(jù)、調整參數(shù)、訓練數(shù)據(jù)、測試數(shù)據(jù)等五步。

圖2 絕緣子圖像自動標注技術流程圖
在整體網(wǎng)絡結構方面,YOLO 模型使用與GoogLeNet 結構相似的神經(jīng)網(wǎng)絡[9],將3×3 的卷積核作為過濾器,使用1×1 的卷積層來減少通道規(guī)模??傮w上說,YOLO 網(wǎng)絡有24 個卷積層,2 個全連接層。輸入圖像經(jīng)該網(wǎng)絡處理后,在輸出端的全連接層輸出一個S×S×(5×b+c) 的張量,其中S×S 為方格個數(shù),b 為預測邊界框個數(shù)。
YOLO 在特征提取方面進行了改進。傳統(tǒng)應用中,目標檢測網(wǎng)絡(如RCNN 和SSD)多為分類問題,YOLO 則將其視為回歸問題,直接輸入整張圖片,不再使用全鏈接層,形成端到端的網(wǎng)絡,使模型的訓練效率大大提高[6]。邊界框回歸(Bounding Box Regression)是其回歸思想的體現(xiàn),使用邊界框回歸算法即可在大量候選框中找到準確的標注框,過程如下:
2.2.1 分割網(wǎng)格
使用滑窗口切割整張圖片為S×S 個網(wǎng)格,若待測物體中心恰好落在網(wǎng)格中,那么該網(wǎng)格就可負責預測該物體,每個網(wǎng)格在目標中心產(chǎn)生多個大小不同的候選框,通過平移和縮放對其回歸如圖3 所示,回歸計算方法[3]為:



圖3 邊界框回歸
在遍歷所有網(wǎng)格后,在網(wǎng)絡輸出端輸出置信度,置信度是候選邊界框和真實邊界框的交并比IoU,計算公式為[5]:

式中:A、B 分別為真實邊框和候選邊框的面積。
YOLOv5 對IoU 進行改進,GIoU[7]便由此產(chǎn)生,其方法是找到一個最小封閉形狀C,讓C 將邊框A 和B 包圍在內,然后計算C 中未覆蓋A 和B 的面積占C 總面積的比例,計算公式為:

在算法求解時,將損失函數(shù)GIoU Loss 與非極大值抑制算法(Non-Maximum Suppression,NMS)結合,搜索局部極大值即可得到準確的標注結果。
使用Python 語言并基于Pycharm 對提出的絕緣子自動標注算法進行編程實現(xiàn)。使用1300 張人工標注的絕緣子圖像對搭建的YOLOv5 網(wǎng)絡模型進行訓練,再用2750 張未標注的絕緣子圖像對訓練的模型進行測試。
由于YOLOv5s 使用的是PASCAL VOC[4]數(shù)據(jù)格式,故這里先將待訓練的絕緣子圖像進行格式化處理,處理過程如圖5 所示。由圖5 可知,在進行網(wǎng)絡訓練之前,將人工標注的xml 格式文件轉化成txt 格式文件,再將txt 文件內容分別寫入Test.txt、Train.txt、Val.txt、Trainval.txt 保存。

圖5 YOLOv5 數(shù)據(jù)格式
在訓練前可設定YOLOv5 模型參數(shù)初值[7],隨后根據(jù)訓練結果調整。經(jīng)多次試驗,學習率為0.0005,訓練次數(shù)epochs 數(shù)值為300,單次訓練圖像數(shù)batch-size 數(shù)值為5,總耗時4h53min,訓練速度較快。
使用插值平均精度方法評估目標檢測的結果,計算準確率P和召回率R 并繪制P-R 曲線[8]。平均準確率AP 和總平均準確率mAP 可作為評價模型的指標,AP 由精確率和召回率求平均得到,mAP 由所有的AP 值求平均得到。

式中:TP 為準確檢測出絕緣子的數(shù)量,F(xiàn)P 為將其它物體檢測為絕緣子的數(shù)量。

式中:FN 為將絕緣子檢測為其它物體的數(shù)量。

使用2750 張未標注的絕緣子圖像進行驗證,圖6 為評價結果,(a)圖中mAP 值為0.951,這說明其精度較高。(b)、(c)圖為絕緣子圖像的物體檢測信息和物體檢測準確率,測試結果良好。

圖6 模型評價結果
選取最優(yōu)模型對新數(shù)據(jù)集進行預測,在絕緣子圖像中用邊界框標注出待檢測物體。預測邊界框左上角含有信息和準確率,在同名文件夾中生成標注文本,其格式如表1 所示。

表1 絕緣子標注信息
如表1 所示,標注信息文件中包括x、y 坐標和類別序號(0為絕緣子,1 為其他物體)。表中可知該張圖像中含有2 個絕緣子,其序號分別表示為0,橫縱坐標的極值顯示在文件中。
基于YOLOv5 模型的自動標注效果顯著,如圖7 所示,(a)中絕緣子分布均勻,由圖可知標注出3 個絕緣子且準確率分別為0.86、0.93、0.86。另外幾種常見特殊標注情況,準確率均值可達0.80 以上。(b)目標過大/過小、(c)標注框嵌套、(d)邊框重疊。

圖7 預測標注信息
設計了一種基于YOLOv5 的絕緣子圖像自動標注方法,該方法具有高效、準確、輕體量的特點,可在短時間內生成大量帶有標注信息的絕緣子圖像數(shù)據(jù),為絕緣子故障的自動識別提供有力保障。