于博軒
(中車工業研究院有限公司,北京 100070)
作為一種大運量、經濟型交通工具,鐵路在我國的經濟生活中占有重要的地位,為我國經濟社會發展做出了巨大貢獻。2019年我國鐵路營業里程超過13.9萬 km,其中電氣化里程10.0萬km,電氣化率為71.9%。電氣化鐵路的快速發展對接觸網檢測提出了更高要求。
電器化鐵路接觸網由接觸懸掛、定位裝置、支持裝置、支柱等部分組成,是電氣化鐵路的重要組成部分。其中,接觸網定位裝置由定位管、定位器、定位線夾及其連接零件組成,用于將接觸網懸掛定位在設計的空間范圍內,使其滿足受電弓取流的幾何要求。接觸網的露天架設,導致接觸網定位裝置在外部環境以及自身壽命的影響下出現部件松動、斷裂、小部件缺失等問題,而一旦定位器底座開口銷缺失,將帶來重大安全隱患,因此,如何及時發現定位器底座開口銷缺失是急需解決的技術難題。
接觸網懸掛狀態檢測系統是一種包含了圖像處理技術、動態拍攝技術、激光攝像技術、數據庫技術的成像檢測系統。該系統搭載于接觸網作業車或專用車輛上,隨車輛行駛過程自動識別接觸網支持裝置并通過圖像抓拍技術獲得接觸網懸掛狀態圖像,所拍攝的圖像能夠有效呈現接觸網支持裝置、附加懸掛、接觸懸掛及吊柱座區域零部件的技術狀態。數據處理分析模塊采用圖像穩定技術對高清相機采集的圖片進行處理,得到高分辨率圖像。該高分辨率的圖像一方面可以分辨出懸掛裝置出現的松動、脫落、斷裂等故障,另一方面可以提供公里標、桿號、站區等綜合信息用于定位。
本文采用的接觸網懸掛狀態檢測系統硬件結構由剛性接觸網成像模塊(包括定位點剛性懸掛成像模塊、剛性懸掛高位吊柱座成像模塊、連續視頻錄像模塊)、柔性接觸網成像模塊(包括定位裝置及支持裝置成像模塊、附加懸掛成像模塊、桿號成像模塊、接觸懸掛成像模塊)、嵌入式觸發控制模塊、時空同步定位模塊、支吊柱/定位點識別模塊、補償光源模塊、車地傳輸模塊、顯示與操作模塊、數據處理分析模塊等組成,如圖 1所示。

圖1 接觸網檢測系統構成
在每張接觸網檢測圖像中,接觸網定位器底座區域圖像只占到接觸網檢測圖像中2 900萬像素圖像的很小一塊面積,為準確定位并獲得定位器底座區域圖像數據,提高定位器底座開口銷缺失檢測效率,本文采用歸一化互相關模板匹配(NCC)算法,該算法既支持線陣連續圖像數據,也支持面陣圖像數據。
NCC算法是一種基于統計學且取值范圍在[-1,1]之間的算法,常被用來比較2幅圖像的相似程度,也就是圖像的相關性。對圖像來說,每個像素點都可以看作是1個樣本數據子集,這樣整幅圖像就構成了1個樣本數據合集。如果該合集中的1個子集與另外1個樣本數據中的某個子集出現匹配的情況,則它的NCC值為1,表示相似度極高,反之,如果NCC的值為-1,則表示完全不相關。基于該理論,NCC算法可以表示如下:

式(1)中,W為在待匹配像素位置構建的鄰域窗口;I1(x,y)為模板圖像像素值;I2(x,y)為搜索子圖像素值。
NCC算法優點是抗白噪聲干擾能力強,且在灰度變化及幾何畸變不大的情況下精度很高,計算結果有固定的范圍[-1,1],方便設置檢測閾值。
采用NCC算法定位出定位器底座區域后,本文通過遞進式的銷釘區域識別和開口銷識別實現開口銷缺失的智能判別,首先從定位器底座圖像中識別出銷釘目標,再根據銷釘區域圖像識別開口銷是否缺失。為使不同場景下的開口銷缺失識別效果最優化,需要事先通過自編碼器(AE)進行定位器開口銷區域數據采集,采集不同場景、不同光照、不同尺寸條件下的定位器底座圖像、開口銷圖像和銷釘圖像。其中,不同場景指白天和野外,不同光照指圖像曝光偏暗、圖像過曝等,不同尺寸涵蓋接觸網檢測常見的1 600萬像素、2 000萬像素、2 900萬像素圖像。本文最終目的是智能識別開口銷是否缺失,對于開口銷銷釘狀態圖像采集需要盡量滿足多樣性,如果采集的銷釘狀態圖像多樣性過少,識別正確率會降低。因此,銷釘狀態圖像需要涵蓋銷釘掰開的不同程度、銷釘的不同朝向、銷釘的不同新舊程度等。
自編碼器是一類在半監督學習和非監督學習中使用的人工神經網絡,其功能是通過將輸入信息作為學習目標,對輸入信息進行表征學習。令輸入層向量為x,通過自編碼器后的輸出層向量為x',但輸出層向量x'和自身輸入層向量x之間仍然存在一定的差異。自編碼器也是一種有損壓縮,可通過損失函數最小來實現x'近似于x的值。基本的自編碼器是一種包含數據輸入層、隱藏層、輸出層3層的神經網絡模型。自編碼器包含編碼過程和解碼過程,從輸入層到隱藏層為編碼過程,從隱藏層到輸出層為解碼過程。自編碼器就是將原始數據進行編碼,降低維度,發現數據之間規律的過程。3層自編碼神經網絡的模型如圖2所示。

圖2 3層自編碼神經網絡模型
自編碼器特征提取算法包括2個過程,輸入層—隱藏層h的編碼過程,如式(2)所示:

式(2)中,δe為編碼函數,W1,b1為編碼的權重和偏置。
隱藏層—輸出層的解碼過程,如式(3)所示:

式(3)中,δd為解碼函數,W2、b2為解碼的權重和偏置。
編碼、解碼之間的壓縮損失JE( W,b)是:

式(4)中, W、b為整個自編碼器網絡的權重和偏置,r表示訓練集中的樣本序號,m表示訓練集的樣本總數。
由于開口銷狀態各異,且采集圖像背景復雜多變,實踐中發現采用灰度梯度直方圖特征(HOG)、局部二值模式特征(LBP)等傳統方法提取圖像特征的識別效果不夠理想。因此,采用自編碼器自動提取圖像特征,使用BP神經網絡算法進行訓練,使其輸入值等于輸出值,對輸入的定位裝置底座區域圖像進行降維處理。實際網絡中,網絡輸入層L1為圖像數據,考慮到開口銷銷釘的尺寸特點,輸入層L1采用70×70的神經元數量,隱藏層L2神經元數量設置為 1 000,輸出層神經元數量和輸入層L1一樣也為70×70。
具體做法是,首先收集5~10萬各種場景下不同形態的開口銷樣本圖像,并縮放圖像尺寸為70×70;然后采用開口銷樣本圖像訓練自編碼器網絡;最后輸入待識別的定位裝置底座區域圖像至訓練好的自編碼器,提取隱藏層的1 000維數據作為開口銷特征,送入支持向量機(SVM)進行開口銷缺失識別。
定位器底座開口銷缺失識別可通過支持向量機SVM實現。對于已經得到了的帶標簽的訓練數據(即其 中為自編碼器提取的1 000維特征,yi為開口銷是否缺失類別標簽,i= 1~M),現在需要1個超平面將這些特征數據分為正常開口銷和開口銷缺失2類,假設該超平面函數為為M維向量的轉置,b為實數),當 0 時,x位于超平面上,的點對應yi= +1的數據點,的點對應yi= -1的數據點,為此設:

根據支持向量機(SVM)的推導過程,可得到如下模型公式:

式(6)對于線性可分的任務通常有較好的效果,但是用于開口銷缺失分類的特征數據較為復雜,該線性模型已經不能適應。因此,根據支持向量機(SVM)理論,將輸入數據映射到高維空間,使其在該空間中盡量線性可分,故上述模型的約束條件可寫為:

式(7)中,φ是輸入數據映射到高維空間的映射函數。
該模型直接求解非常困難,目前基本都是通過優化其對偶問題來求解,其對偶問題可通過拉格朗日乘子和對偶定理進行推導,這里不做詳細闡述。在其對偶模型中,涉及到的向量內積計算為另一輸入數據映射至高緯空間的向量,j= 1~M),而映射后的特征空間維數通常很高,甚至是無窮維,因此直接計算是非常困難的。為解決這個問題,可通過引入核函數,將高維空間內積轉化為求原始空間中核函數值的方式求解,即:

式(8)中, 是引入的核函數。本文采用的是高斯核函數,其具有如下形式:

式(9)中, 為高斯核函數的寬度參數。上述推導的理論目標不允許任何數據分錯,要求所有點都在分類間隔外,這通常都會導致嚴重的過擬合問題。為防止過擬合,增強模型泛化能力,可以引入松弛變量,進而模型可寫為:

引入松弛變量后,其物理意義在于訓練時可通過參數C來控制分類間隔,允許部分點分錯,這樣就可以在訓練時很大程度地抑制過擬合,提升模型的泛化能力,以適應新的分類數據。對于新輸入的定位器底座圖像,即可先輸入訓練好的自編碼器網絡提取降維圖像特征,再將降維圖像特征送入支持向量機(SVM)進行分類,識別是否存在開口銷缺失異常。實際應用時,可先采用上述方法識別定位器底座開口銷圖像中的銷釘區域,再在銷釘區域判定開口銷是否缺失。
為檢驗本文提出的定位器底座開口銷缺失識別方法的有效性,在現場設置3處平腕臂底座橫向開口銷缺失和8處斜腕臂底座縱向開口銷缺失,采用本文提出的開口銷缺失識別方法進行開口銷缺失在線識別,識別效果如圖2、圖3所示,識別結果如表1所示。

圖2 平腕臂底座橫向開口銷缺失

圖3 斜腕臂底座縱向開口銷缺失
由表1可知,現場設置的10處平腕臂底座橫向開口銷缺失均實現了正確識別,11處斜腕臂底座縱向開口銷缺失中有1處未識別,其原因在于部件邊緣污垢較多造成區域特征難以與背景圖像區分。

表1 開口銷缺失識別結果統計
為高效準確地對接觸網定位器底座開口銷缺失進行識別,針對開口銷形態小、分布廣的特點,采用歸一化互相關模板匹配(NCC)算法進行定位器底座區域定位,同時采用無監督學習的自編碼器(AE)提取圖像的降維特征,再通過支持向量機(SVM)對開口銷進行識別分類,有效解決了開口銷缺失識別問題。現場試驗結果表明,本文提出的算法能夠對復雜線路環境圖像中的定位器底座開口銷缺失進行準確識別和有效檢出,檢出率高,具有較高的技術推廣價值。