北京縱橫機電科技有限公司 中國鐵道科學研究院集團有限公司機車車輛研究所 / 韓彥青 中車長春軌道客車股份有限公司 / 王超
關鍵字:城軌車輛;受電弓;接觸網;深度神經網絡;目標檢測
工業生產現場的監控視頻對安全預警提供重要的數據支持。以現代高速列車系統為例,架空接觸網 (OCL)是向列車供電的接口,是電力列車運行的動力來源。然而,由于接觸網的物理特性和安裝結構,系統易受到環境和機電效應的干擾,這些干擾影響列車電力的質量。在時速超過 200km/h 的高速列車上,由于運行過程中受電弓和接觸網的相互摩擦作用,導致接觸點附近溫度過高,震動劇烈,接觸不良等問題,因此必須嚴格對 OCL的各個參數進行評估,在眾多的測試參數中,接觸網的物理結構,電學參數及力學參數等可以在測試平臺中完成檢測,但是運行過程中的動態偏移值,受電弓高度等數據需要通過接觸點相對于受電弓中心的位移來測量,運行過程中接觸網接通高壓,因此,動態偏移值和高度只能通過非接觸式的受電弓和接觸網圖像測量得出。
目前基于深度學習的圖像物體檢測算法相比基于人為設計特征的傳統檢測算法取得了巨大進步,但是對于工業圖像,通用物體的檢測算法不能良好地移植到特定領域,比如列車受電弓監控圖像是在高速運行的條件下拍攝,存在物體運動模糊、拍攝焦距失調、物體部分遮擋等情況,直接應用通用物體檢測算法難以獲得較為準確的結果。本系統主要針對列車架空接觸網和受電弓的圖像監控數據,利用深度學習方法進行受電弓接觸點檢測。
為提高電氣化鐵路牽引供電系統的安全性和可靠性,鐵路部門構建電氣化鐵路供電安全檢測監測系統,列車車載接觸網運行狀態檢測裝置是其中的一部分,安裝在運營列車上,實現對接觸網的動態檢測,檢測結果用于指導接觸網運行維修。在車輛行駛的過程中,為了保證持續供電,受電弓滑板必須與上方的接觸網持續接觸,如圖1所示,這會帶來劇烈地摩擦,鐵軌上空的高壓線為“之”字形架設,使得接觸網可以與受電弓上的所有位置接觸摩擦,避免在一處長時間摩擦導致受電弓過熱和持續磨損。

圖1 受電弓接觸網示意圖
目前在列車裝有監控攝像頭實時采集受電弓和接觸網的運行視頻,通過弓網監測視覺模塊,采用工業相機、智能分析主機對受電弓導高拉出值(超界自動報警)、燃弧(大小、頻次)、受電弓狀態等進行識別,并將計算結果在圖像上展示。

圖2 弓網視覺監測原理
檢測網絡使用單階段物體檢測模型,工業圖像檢測算法流程如圖3所示,主要包括:第一步數據預處理,得到網絡訓練時輸入的圖像及對應的標注;第二步通過 卷積神經網絡(CNN)提取圖像的特征得到特征圖;第三步在得到的特征圖上生成候選邊框,并對候選區域進行分類和邊框回歸,得到當前圖像中目標的預測結果。

圖3 工業圖像檢測算法流程圖
YOLO[5-9]算法是人工智能深度學習領域目標檢測和跟蹤最先進的算法,其速度快、精度高,在工業檢測領域得到了廣泛的應用。
YOLO算法采用 “全卷積模型”同時實現分類和回歸“端到端”的“單階段”目標檢測算法,將工業目標檢測物體當做回歸問題來處理,實現了一步快速算法。
YOLO算法的思想(如下圖所示):將圖像平均分成n個格子,每個格子代表原圖的一個區域,每個區域都相當于一次組合卷積(無重疊);每個格子負責預測中心落在格子里的物體,預測類型和整個框。
本文采用YOLO第五代算法(簡稱yolo1v5)算法,實現弓網特征提取、目標檢測,從而實現導高、拉出值和燃弧的檢測。導高拉出值:通過目標檢測提取弓網接觸點目標框(中心點為弓網接觸點)、滑板目標框(長度為滑板長度,高度為弓網接觸點距車頂的距離)、受電弓目標框、燃弧目標框,然后根據滑板中線與車頂水平線計算導高、拉出值的像素距離,最后通過相機位置、角度將像素距離轉換成實際距離,從而求得導高拉出值。

圖4 目標檢測

圖5 目標框轉成導高拉出值像素距離
導高拉出值的計算公式如下所示。B為受電弓滑板中點,C為弓網接觸點,A、D分別為受電弓滑板左右端點,E為車頂水平線的中點。

式中:L為拉出值,mm;L1為相機與滑板的距離,mm;L2為滑板長度,mm;H為導高,mm;H1為鋼軌與車頂的距離,mm。
燃弧檢測:通過目標檢測直接在圖像上進行特征提取,對燃弧進行實時檢測與定位。

圖5 受電弓燃弧檢測
本文的數據集包括 4 臺列車的14個監控設備的數據。采集到的圖像像素為 1920 × 1080。原始圖像過大,在高速運動的列車上,采集的圖像存在運動模糊、光照變化、視頻失焦、部分遮擋等問題。所獲得的受電弓監控圖像如圖6。

圖6 受電弓接觸點圖像
由于安裝位置角度的問題,在圖像上存在無關背景區域,首先對圖像進行裁剪,減少無關區域的影響,如在受電弓監控圖像中,我們只關注受電弓及接觸網,且受電弓相對攝像頭的位置固定,以圖像中心向四周裁剪包含受電弓和接觸網的區域。在選定待檢測圖像之后,使用labelImg工具對圖像中物體進行標注,labelImg是一個圖形圖像注釋工具,在標注的同時labelImg將標注信息自動以 XML 格式的文件,在訓練的過程中解析圖像對應的標注文件即可。圖7展示了labelImg工具及數據標注方法。

圖7 labelImg 工具
生成的標注文件如圖8所示,folder、path、filename標簽代表文件路徑,size 標簽代表圖像的像素,其中的 3 個屬性分別是圖像的寬 (width),高 (height) 和深度 (depth),object 標簽表示圖像中物體屬性,其中 name 屬性代表物體的類別,bndbox屬性代表物體在圖像中的位置。在物體檢測問題中,每張圖像的標注對應圖像上所有物體的類別和位置,物體的位置由中心點坐標和物體的長寬表示,所以一張圖像的標注是一個 m×5維向量,m表示圖像中物體的個數,5 維向量表示為 (class, x, y, w, h),其中class是類別的索引,x代表邊框中心點的橫坐標,y代表邊框中心點的縱坐標,w是邊框的長度,h 是邊框的高度。

圖8 xml文件格式
本次訓練過程中圖像單邊的尺寸為 {320, 352,...,608},最小的尺寸是 320 × 320,最大的是 608 × 608。在圖像縮放的時候保持圖像長寬比不變,這樣就需要判斷原圖像的長邊和短邊,短邊在等比例縮放之后小于設定的長度,對空余位置進行補零操作。
采用數據增強和多尺度訓練的方法對訓練數據進行訓練。數據增強方法是對輸入圖像進行隨機旋轉,裁剪,翻轉等操作,獲得豐富的數據,提升模型的魯棒性。多尺度訓練方法,將每10個批次隨機將圖像調整到一個新的尺寸,為了將輸入圖像組成包含多張圖像的一個批次進入網絡中訓練,所有圖像需要保持同樣的大小,這樣在網絡中才能表示為張量的形式進行統一的處理。
由于特征提取網絡是 32 倍下采樣,將圖像尺寸調整到 32 的倍數,圖像大小通常調整到適中,如果圖像過大,會明顯增加顯存和計算量,從而增加訓練時間,如果顯存超出顯卡的顯存容量則會導致內存溢出錯誤,如果圖像過小,經過 32 倍下采樣之后,小物體可能會在特征圖的中沒有對應的像素,導致后續的邊框分類和回歸不準確。當輸入圖像被調整到對應尺寸的時候,圖像標簽的數值也要進行相應的調整。這樣網絡在各個尺度上都能得到較好的預測,當輸入尺寸小的情況下,檢測速度快,輸入尺度大的情況下,檢測效果好,這樣網絡可以在速度和精度之間權衡。
調用模型訓練器,對模型進行訓練(不斷迭代、模型不斷收斂)。訓練過程中訓練集、測試集的召回率(recall)、精度(precision)、平均精度均值(mAP)以及分類損失(cls_loss)、IOU損失(giou_loss)、對象損失(obj_loss)各個指標的變化如圖9所示。

圖9 模型訓練指標變化及權重分布
當召回率、精度、平均精度均值不在上升,損失基本趨近于0,表明模型已經收斂。

圖10 不同場景下的測試結果
將訓練好的模型進行測試(天津地鐵6號線采集的數據測試):拉出值的準確率為96%,導高的準確率為95%,燃弧的準確率為91%。
模型分別在出庫運行、進入隧道、正線運行、反線運行、入庫等不同情況下進行了測試,不同場景下的測試效果如下如所示(圖像上的參數解釋:拉出值:“-”表示在左邊,“+”表示右邊,絕對值大小表示偏移距離;導高:車頂距鋼軌的距離+受電弓距接觸線的距離;燃弧:“0”表示無燃弧,“1”表示有燃弧)。受電弓滑板的長度為910mm,拉出值的上下邊界為±455mm。
本文介紹了軌道車輛在行駛過程中,對于受電弓和接觸網的正常運行的多種檢測方式,當列車在行駛中,弓網出現異常情況后迅速進行定位跟蹤,有效避免了列車的受電弓接觸網在運行過程中出現突發意外卻缺少定向的解決方案,對軌道車輛的運營安全管控具有重大意義,也為我國軌道交通事業再添一份新力。