陳修忻,楊光
(上海地鐵維護保障有限公司工務分公司,上海,200233)
鋼軌扣件是連接鋼軌和軌枕使之形成軌排的部件,在保證軌道穩定性、可靠性方面起著重要作用[1]。鋼軌扣件在軌道線路存在的狀態可分為正常、斷裂、缺失、移位四大類,我國長期以來對鋼軌扣件狀態檢查主要還是以人工和靜態檢測為主。近年來,隨著我國鐵路與城市軌道交通的迅猛發展,信息化、智能化處置軌道線路故障是當前的一大趨勢。
在鋼軌扣件檢測的研究領域,基于圖像處理與機器視覺技術的檢測方法不斷提出,白堂博等[2]提出一種基于改進Faster R-CNN 的深度學習理論方法進行扣件定位;齊勝等[3]提出基于BEMD-IPSO-SVM 的檢測算法對扣件完損狀態進行檢測;許貴陽等[4]提出基于K 均值聚類算法改進掩膜區域卷積神經網絡(Mask R-CNN)實例分割算法中的區域建議網絡方法對普速鐵路有砟軌道2 個扣件數據集和高速鐵路無砟軌道1 個扣件數據集上進行軌道扣件狀態檢測;Giben X 等[5]提出基于深度學習卷積神經網絡的語義分割對扣件進行檢測;以上方法對軌道扣件檢測均能獲得較高精度,但存在內存消耗大、檢測速度慢的缺點,這難以實現快速、高效、高精度 的在線檢測目標。針對這種情況,采用基于YOLOv5 算法的鋼軌扣件檢測方法,分析不同模型在不同參數下的檢測效果,最終得到高效率、高精度的鋼軌扣件檢測算法模型。
在YOLO 算法提出之前,目標檢測主流算法框架為R-CNN 系列的two-stage 算法[6]。隨著近幾年目標檢測算法的快速發展,以YOLO 系列為代表的one-stage 算法被提出,其核心要義是將目標檢測定義為一個線性回歸問題[7]。YOLO 算法是將單個卷積神經網絡應用于整個圖像,將圖像分割成若干個網格并預測每個網格的類概率和邊界框,以此實現目標檢測速度快、精度高的目的。
YOLOv5 算法是在YOLOv4 的基礎上改進而來,其最主要的區別在于對anchors 的處理機制,YOLOv5 作為YOLO 系列最新成員,其強大的目標檢測算法以及輕量級的模型能夠訓練出快速而準確的權重文件。YOLOv5 模型沿用YOLOv3、YOLOv4 的整體布局,主要包含圖像輸入、Backbone、Neck、Head 四個部分[8],其網絡結構如圖1所示。

圖1 YOLOv5網絡結構圖
YOLOv5 采用Mosaic 數據增強操作提升模型的網絡精度與訓練速度,同時提出一種自適應錨框計算與自適應圖片縮放方法。
(1)Mosaic 數據增強
該操作是通過利用四張隨機圖像,對其進行隨機縮放、裁剪、排布后進行拼接且每張圖像都有自己對應的框,最后形成一張新的圖像且該張圖像又具有其對應的框,接著將該張新圖像傳入神經網絡中學習,該方法極大豐富了被檢物體的背景[9]。
(2)自適應錨框計算
針對不同數據集,均需設定特定長寬錨點框。在網絡訓練階段,模型在初始錨點的基礎上輸出對應預測框,隨后計算其與GT 框的差距并執行反向更新操作,進而更新整個網絡參數,YOLOv5 算法可根據數據集的名稱自適應計算出最佳錨框點[10]。
(3)自適應圖片縮放
在傳統目標檢測算法中,不同圖像其長寬不盡相同,因此,在檢測前需將圖像統一縮放到某一標準尺寸,這種方式可能造成大量的信息冗余進而影響整個算法檢測速度。YOLOv5 算法提出一種能夠自適應添加最少黑邊到縮放圖像的方法,這樣可以極大提升算法檢測速度。
(1)Focus 模塊
在YOLOv5 網絡中,第一層即為Focus 模塊,其主要目的是對圖像進行切片操作,具體操作是在一張圖像中每隔一個像素提取一個數值,最后一張圖像形成互補的四張圖像。相較于YOLOv3網絡,Focus可以起到減少層數、參數量、計算量、cuda 內存占用的作用,同時在mAP 影響很小的情況下,提升推理速度和梯度反傳速度。
(2)SPPF 結構
SPPF 結構是輸入多個串行的5×5 大小的MaxPool 層,其結構圖如圖2 所示。

圖2 SPPF 結構圖
Neck 網絡在YOLOv5 中主要用于生成特征金字塔,其目的是增強模型對不同縮放尺度對象的檢測,以便能很好地實現識別不同大小、不同尺度的同一類物體。在YOLOv5 中,Neck 網絡采用了FPN+PAN 結構。其中,FPN 通過融合高低層特征可很好的提升小目標檢測效果,PAN 則在FPN 的基礎上增加了一個自底向上方向的增強,進而提升大目標物體的檢測效果。
目標檢測首先考慮的就是目標識別效果的判別,本文采用測試精度P、召回率R、mAP@.5 和mAP@.5:.95作為評價鋼軌扣件檢測模型的性能。其中,P、R 分別指的是一個檢測模型預測的正樣本的確是正樣本的概率與實際正樣本的個數;AP 為P 對R的積分,而mAP@.5 是將IoU 閾值(IoU 表示檢測框與真實標簽的交集和并集的比值)設為0.5 時,計算每一類的所有圖片的AP,然后所有類別求平均,mAP@.5:.95是不同IoU 閾值(從0.5 到0.95,步長0.05)上的平均mAP,mAP 主要用來評價檢測模型的整體性能。
本文鋼軌扣件圖像是由線陣相機現場采集而來,通過對某些扣件拆檢以及安裝部分斷裂扣件等方式實現制作彈條缺失、彈條斷裂、彈條移位和螺栓缺失四種狀態扣件樣本圖片共計706 張(圖片中彈條斷裂120 處、彈條缺失234 處、彈條移位419 處、螺栓缺失79 處),將其按8:2 分為測試集圖像和訓練集圖像。采集圖像(部分截圖)如圖3 所示。

圖3 現場采集扣件圖
將選好的706 張圖像數據集中每個鋼軌故障扣件進行分類標注最終生成一一對應的*.txt 的labels 文件,隨后將其輸入到 YOLOv5 網絡中,經過算法的訓練得到相應訓練模型并最終將訓練完成的模型輸入到算法網絡中對未知扣件進行預測分析,由此實現對故障扣件的檢測,方法框架如圖4 所示。

圖4 方法框架
本文主要分析了YOLOv5s、YOLOv5m 兩種模型下不同訓練次數(epochs 取50、100 次做對比)對各類故障扣件的識別效果,具體情況如表1 所示。表1 顯示:YOLOv5s模型下訓練得到的鋼軌故障扣件檢測模型大小是YOLOv5m模型下訓練得到的模型大小的三分之一左右;YOLOv5s、YOLOv5s 模型下訓練鋼軌故障扣件時,epochs 取100 時訓練出的檢測模型要優于epochs 取50 時的檢測模型;由于螺栓缺失類別數量最少,在相同模型、相同參數下其訓練出檢測模型質量最差;YOLOv5m 模型下訓練鋼軌故障扣件時,epochs 取100 時各類別鋼軌故障扣件識別精度P、召回率R 和mAP@.5 均超過到0.9 且所有類別故障扣件mAP@.5:.95 也達到0.822。

表1 不同參數下各類扣件狀態識別效果
圖5 所示為epochs 取100、YOLOv5m 模型下訓練得到的鋼軌故障扣件檢測模型推理結果,圖5(a)顯示的是鋼軌彈條缺失QS 與鋼軌彈條移位YW,圖5(b)顯示的是鋼軌彈條斷裂DL,圖5(c)顯示的是鋼軌螺栓缺失LSQS,圖中顯示的數值為在該檢測模型下預測對應鋼軌故障扣件類型的置信度大小,從數值可以看出,該模型對各類狀態鋼軌扣件具有很高的識別精度。

圖5 預測結果
最后,將識別到的鋼軌故障扣件截圖分類保存至對應類別文件夾,結果如圖6 所示。圖6(a)為彈條斷裂截圖,圖6(b)為彈條缺失截圖,圖6(c)為彈條移位截圖,圖6(d)為螺栓缺失截圖。

圖6 故障扣件截圖
本文采用YOLOv5 算法,分析了YOLOv5s、YOLOv5m兩種模型對不同狀態鋼軌扣件樣本訓練50、100 次后的識別效果,結果顯示:針對輕量級鋼軌扣件圖像集分類檢測,采用YOLOv5m 模型、對全部樣本訓練100 次的YOLOv5算法對鋼軌彈條斷裂、缺失、移位、螺栓缺失四種狀態扣件的識別精度P、召回率R、mAP@.5、mAP@.5:.95 分別為0.988、0.967、0.987、0.822,該方法對鋼軌故障扣件分類檢測具有很好的工程應用價值。