王苗 張龍信



摘? 要:鎖緊板偏移故障是貨運列車頻發的典型故障之一,針對其平均識別精確度較低的問題,將目標檢測YOLOv4模型應用于改善貨運列車部位鎖緊板圖像檢測。首先,對鎖緊板偏移、正常圖像進行Mosaic數據增強,以解決數據集樣本較少問題。其次,使用k-means聚類算法,得到更優的初始anchor的位置,以提高故障檢測精確度。最后,通過非極大值抑制獲取得分最高的檢測結果。實驗表明,通過使用目標檢測YOLOv4能夠精確地實現鎖緊板故障的檢測。
關鍵詞:故障檢測;鎖緊板;YOLOv4
中圖分類號:TP391.4? ? ? ? ? ? ? 文獻標識碼:A文章編號:2096-4706(2021)20-0042-03
Image Fault Detection of Train Locking Plate Based on YOLOv4
WANG Miao,? ZHANG Longxin
(Hunan University of Technology, Zhuzhou 412007, China)
Abstract: Locking plate offset fault is one of the typical faults frequently occurring in freight trains. Aiming at the problem of low
average recognition accuracy, the object detection YOLOv4 model is used to improve the image detection of part locking plate of freight trains. Firstly, Mosaic data enhancement is performed on the offset of the locking plate and the normal image to solve the problem of less samples in the data set. Secondly, K-means clustering algorithm is used to obtain a better initial anchor position, so as to improve the accuracy of fault detection. Finally, the detection result with the highest score is obtained by non-maximum suppression. Experiments show that the use of target detection YOLOv4 can accurately detect the fault of locking plate.
Keywords: fault detection; locking plate; YOLOv4
0? 引? 言
隨著經濟的快速發展和鐵路交通領域的飛躍進步,鐵路貨運列車開始轉變為重載、大密度的運行方式,對于列車安全運行來說,列車故障檢測的高效性和準確性的意義至關重要。由于傳統的人工檢測方式隨著貨運列車高速和高頻率的運行而難以適應,為了推進鐵路行業的現代化建設,滿足列車故障快速、準確發現的要求,于是鐵道部推廣了列車運行故障動態檢測系統(Trouble of moving freight car detection system, TFDS)[1]。鎖緊板是貨運列車頻繁發生故障部位之一。一旦鎖緊板偏移,表示螺栓發生了松動。螺栓的松動重則導致脫落,從而影響到列車的安全運行。因此對于列車安全,鎖緊板偏移故障檢測至關重要。孫國棟等人[2]針對列車擋鍵問題設計了一種基于形狀上下文的丟失圖像識別算法,該方法能夠區分列車是否存在擋鍵。雷蕾等人[3]提出了基于HCRD的列車鎖緊板偏轉自動識別方法。該HCRD方法能檢測出鎖緊板的偏轉,且具有一定的魯棒性和抗噪能力。
本文的主要貢獻在于使用目標檢測YOLOv4模型[4]應用于鎖緊板的故障檢測,另外K-means聚類算法[5]生成更合適的先驗框的準確性,采用Mosica數據增強的方式擴展了數據集,以增加模型檢測的魯棒性。
1? 相關工作
1.1? YOLOv4網絡結構
YOLOv4的網絡結構主要有三部分:主干網(Cspdarknet53)、頸部(neck)、頭部(head),頸部包括了特征集成網絡模塊SPP(Spatial Pyramid Pooling)、多尺度特征融合模塊PAN(Path Aggregation Network),頭部主要是以YOLO-Head為主。
主干網Cspdarknet53包含了多個子模塊的堆疊以及一條殘差邊,主要是用于提取圖像特征。頸部用于融合特征,SPP模塊增加了感受野,用于集成最優價值的特征信息。PAN模塊在FPN的基礎上額外增加了一組自上而下的特征提取路徑,主要在P3、P4、P5層使用了PAN結構,使得能夠得到更加有效的特征信息。YOLO-Head主要用于解碼和預測,利用了非極大值抑制得到得分最高的預測框。
在YOLOv4模型中使用的損失函數是CIOU-Loss,CIOU考慮了將目標與anchor之前的距離、重疊率、尺度、以及懲罰項等因素,使其在計算目標框和預測框之間的回歸損失更加小。
IOU的計算表達式如所示:
式中,prediction表示預測框,ground-truth表示預測框,Intersection表示兩個框之間的交集,Union表示兩個框之間的并集。
CIOU-Loss的計算表達式如所示:
式中,ρ2(A,B)分別表示代表A和B點的歐式距離,b表示預測框的位置,bgt表示真實框的位置,c表示能夠同時包含預測框和真實框的最小閉包區域的對角線距離,α表示權重參數以及υ表示衡量長寬比一致性的參數。
1.2? 聚類算法
K-means聚類算法自研發以來廣泛應用于不同的學科領域,但本文主要應用于生成最優的anchor位置。K-means聚類算法主要是通過遞歸的思想來選取距離最近的中心。第一步,將數據集劃分為K類別,然后依次把數據放置在不同的類別中。第二步,當確定好類別之后,計算整個類別的所有數據到該聚類中心點的距離。找出離該類別距離最近的一個聚類中心,計算所有類別聚類中心的平均值作為新的聚類中心。第三步,返回至上一步重新計算。直到聚類中心不再發生變化,停止計算。此時,便成功獲取一個適合數據集的聚類中心。
K-means算法雖然具有思想簡單、良好的聚類效果、速度快等優點。然而該算法對于初始K值敏感和容易陷入局部優化的缺點。因此,算法中初始K值的選取、初始聚類中心點的選取對于該算法來說是至關重要的,在本論文中分類為2類,所以K值為2。原YOLOv4模型生成錨點聚類中心為16、89、19、43、53、50、61、88、67、93、67、88、68、85、71、72、75、87,后K-means生成的錨點聚類中心為15、97、18、44、22、85、54、49、62、89、67、94、68、90、68、86、72、73。
2? 實驗
2.1? 試驗配置與數據集
首先,使用LabelImg軟件制作貨運列車VOC格式數據集,鎖緊板圖像總共531張。當數據量比較小時,可以使用9:1訓練數據和測試數據。訓練集:478張;測試集:鎖緊板53。因為實驗的數據樣本較少,Mosaic數據增強會利用四張圖片進行計算,從而增加數據樣本的多樣性。因此,在本論文中使用了Mosaic數據增強方式來增強數據集。Mosaic數據增強具體步驟如下。第一步,導入4張圖片。第二步,分別使用翻轉、縮放、色域變化等數據增強方法處理四張圖片,并且按照左上、左下、右上、右下等四個方向,忽略圖片原來的位置,任意擺放。第三步,組合第二步通過數據增強的方法得到的圖片,將組合好的圖片合成一張新的圖片。
本文的實驗基于Pytorch實現。實驗使用的操作系統為Ubuntu20.0.0和一塊單獨的GTX1080Ti GPU。數據處理使用了Python:3.6、OpenCV庫,Torch:1.2.0,Torchvision:0.4.0。GPU加速庫為Cuda:10.0和Cudnn:7.4.1.5。
當使用YOLOv4模型獲取圖像特征時,應考慮影響mAP值變化的因素,例如不同學習率(learning rate)和迭代次數(iteration),通過對比實驗表明,當設置學習率為10-3時,AP值較大。另外,迭代次數設置為100次,批大小設置為2。
2.2? 實驗參數與性能指標
如果鎖緊板的正常和故障圖像分別視為正樣本和負樣本。那么TP(True Positive)表示當分類器把正常圖像分類為正常標簽時的次數;TN(True Negative)表示當分類器把故障圖像分類為故障標簽時的次數;FP(False Positive)表示當分類器把故障圖像分類為正常標簽時的次數;FN(False Negative)表示當分類器把正常圖像分類為故障標簽時的次數。召回率(Recall)、精確率(Precision)分別為:
2.3? 實驗結果
本文主要針對典型部件的貨運列車故障圖像的鎖緊板偏移故障以及正常圖像,識別并分類。在圖1中,鎖緊板正常如(a)所示。當列車處于運行條件下,列車不斷的運動會造成交叉端部螺栓的松動,導致鎖緊板偏移。鎖緊板偏移故障如(b)所示。
3? 結? 論
本文提出了一種基于YOLOv4算法貨運列車鎖緊板圖像故障檢測方法,使用K-means聚類算法先驗框和聚類中心的位置作為參數對貨運列車數據進行聚類得到先驗框,獲取更多的細節特征信息。通過使用Mosaic數據增強方式來解決數據集樣本少的問題,實驗結果表明,YOLOv4模型具有較好的檢測效果,mAP達到了84.22%。改進后的YOLOv4網絡檢測準確度有所提高。
參考文獻:
[1] 黃東林.關于提高TFDS動態檢查質量的探討 [J].鐵道車輛,2018,56(11):37-39+6.
[2] 孫國棟,徐威,梁永強,等.基于形狀上下文的列車擋鍵丟失圖像識別算法 [J].鐵道科學與工程學報,2014,11(6):127-131.
[3] 雷蕾,宋冬利,張衛華,等.基于HCRD的列車鎖緊板偏轉自動識別方法 [J].鐵道科學與工程學報,2021,18(7):1895-1902.
[4] BOCHKOVSKIY A,WANG C Y,LIAO H Y M. YOLOv4:Optimal Speed and Accuracy of Object Detection [J/OL].arXiv:2004.10934 [cs.CV].[2021-08-27].https://arxiv.org/abs/2004.10934.
[5] 張雨金,楊凌帆,葛雙冶,等.基于Kmeans-SVM的短期光伏發電功率預測 [J].電力系統保護與控制,2018,46(21):118-124.
作者簡介:王苗(1998—),女,漢族,湖南耒陽人,碩士在讀,研究方向:深度學習和故障檢測;
張龍信(1983—),男,漢族,湖南瀏陽人,博士,副教授,CCF會員(34915M),研究方向:深度學習和大數據分析。