于惠鈞, 張錦圣, 劉建華*, 彭慈兵, 劉麗麗, 龔事引
(1.湖南工業大學軌道交通學院, 株洲 412007; 2.湖南鐵道職業技術學院智能控制學院, 株洲 412012;3.湖南鐵路科技職業技術學院鐵道供電與電氣學院, 株洲 412000)
軌道交通列車的牽引/制動控制性能取決于輪軌接觸行為,而軌面狀態是影響輪軌接觸行為的關鍵因素,通過有效識別軌面狀態可為列車高性能控制提供關鍵依據[1-4]。目前,軌面狀態識別方法主要以人工經驗判斷為主,效率低、實時性差等問題長期存在,難以滿足高性能控制需要。傳統深度學習方法的引入有望提高軌面狀態識別精度,但需要平衡數據支撐,受天氣情況復雜多變等因素制約,部分軌面狀態樣本量偏少,導致軌面狀態樣本存在類別分布非均衡現象。非均衡分布的軌面狀態數據會造成模型偏向學習多數類別的特征,而對少數類樣本學習不足,進而導致顯著的識別誤差[5]。
目前,針對非均衡數據的分類方法主要有數據層面和算法層面兩種[6-7]。前者通過對抗網絡[8-9]合成樣本或重采樣(欠采樣、過采樣)[10-11]方法改變類別數據分布,降低各類別樣本的數量差距,但對抗網絡或過采樣方法可能導致模型對合成的重復樣本過擬合,欠采樣又可能丟失潛在的價值特征信息[12-13];后者通過修改學習過程提高分類器對少數類的敏感性,保留樣本的全部初始特征信息,其中包含集成學習和代價敏感學習等。集成學習方法根據非均衡數據構建多個具有差異性的分類器,并按照一定方式整合分類器的識別結果以提高總體準確率,但該方法存在多個分類器訓練時間長、基分類器類型和數量選擇困難等缺陷[14]。代價敏感學習通過引入代價敏感系數,增大訓練過程中對少數類別錯分的懲罰代價,提高分類器對少數類的分類精度[15-18]。例如,Zhang等[19]通過自適應差分進化算法優化訓練數據集上的誤分類成本,得到總代價最小的進化代價敏感深度置信網絡;Peng等[20]提出一種新型雙向門控循環單元,并將其與代價敏感主動學習策略相結合,應用于非均衡數據分類。但上述方法較少考慮同類別中每個樣本重要性對分類結果的影響,且易犧牲多數類別的分類精度,整體效果提升有限。
為此,現提出一種基于注意力網絡和代價敏感學習的模型來解決非均衡數據下的軌面狀態識別問題。借助遷移學習將均衡數據的特征遷移到非均衡數據,緩解數據非均衡引起的學習偏倚問題[21-22],減少訓練時間;針對軌面狀態存在區域小、分散以及特征提取網絡提取特征信息不充分的問題,在骨干網絡ResNet18中添加卷積注意力機制(convolutional block attention module,CBAM)[23],加強網絡對軌面有效特征區域的注意力,提高軌面狀態識別精度;針對軌面狀態樣本類別分布非均衡問題,采用改進的影響平衡損失函數(influence-balanced loss,IB Loss),根據每個樣本對決策邊界的影響自適應地為樣本分配不同的權重,減輕困難樣本中多數類樣本對決策邊界的影響。最后在不同的非均衡比下對所提方法進行驗證與分析。
結合株洲車輛段鐵路線紅旗路段軌面狀態數據的實際情況,將軌面分為干燥、潮濕、油污3種狀態。重點針對非均衡軌面狀態數據,構造基于注意力網絡和代價敏感學習的軌面狀態識別模型,如圖1所示。

圖1 模型結構框圖
在圖1所示的模型框圖中,遷移學習模塊通過預訓練模型在目標任務中進行優化,實現均衡數據集的特征轉移。特征提取模塊由骨干網絡ResNet18與CBAM機制組成,通過在通道和空間維度上加強網絡對有效特征的學習能力,減少特征提取中產生的冗余特征信息,以輸出更具全局信息的特征;軌面狀態識別模塊采用改進的IB損失函數,通過每個樣本對決策邊界影響大小的反比重新加權損失實現反向傳播,以更好地指導網絡學習軌面狀態特征,得到更精確平滑的決策曲線。
在軌面狀態數據集中,非均衡的樣本分布導致特征提取網絡對少數類樣本特征學習不充分,甚至偏向學習多數類特征。為緩解這一負面影響,引入遷移學習方法,即首先在平衡數據集上對特征提取網絡ResNet18進行預訓練,在準確率收斂且學得平衡樣本特征分布后,保存預訓練模型參數。然后創建一個目標網絡CBAM-ResNet18,該目標網絡復制預訓練模型中除輸出層以外的模型設計和參數,以作為軌面狀態圖像特征提取器。其次為目標網絡添加輸出大小為軌面狀態數據集類別數3的輸出層,并隨機初始化該層的參數。最后,將目標數據集即非均衡軌面狀態數據輸入目標網絡中,并通過調節特征提取網絡的參數獲取數據底層特征,以保證模型能夠有效遷移,從而提高模型的準確率和泛化能力[24]。
考慮到軌面狀態分類任務規模較小且實時性要求高的需求,選取可平衡訓練效率和網絡深度的ResNet18作基礎骨干網絡,以保證軌面狀態特征提取能力及較快的網絡訓練速度。ResNet18網絡處理軌面狀態圖像時,未對各特征通道進行權重區分,使得無關的特征繼續傳遞,造成特征信息提取不準確。因此,在網絡結構中引入CBAM機制,通過為各特征通道添加權重信息,充分利用特征圖的通道信息和空間信息,在捕獲整體特征的基礎上重點關注軌面狀態區域的顯著性特征,抑制無用特征的傳遞,輸出更具軌面狀態圖像全局信息的精細特征圖。針對軌面狀態有效區域存在分散和面積較小的問題,CBAM可加強網絡對軌面狀態特征區域的注意力,有效提取不同大小的軌面狀態區域特征,進一步提升模型性能。

(1)
(2)
(3)
F1=Mc?F
(4)
式中:σ為Sigmoid激活函數;?為點乘操作。

(5)
(6)
(7)
F2=Ms?F1
(8)
式中:f7×7為大小為7×7的卷積核。
CBAM模塊內部結構特點可避免卷積乘法帶來的高計算量,具有通用性強和可移植性高的優勢,該模塊能夠直接嵌入卷積操作后或殘差塊中,與卷積神經網絡一起進行端到端訓練[25-26]。由于所提出的方法采用預訓練模型,為了不改變ResNet18的網絡結構以便使用預訓練參數,CBAM模塊不能加在殘差塊中,而是加在網絡的第一層卷積和最后一層卷積之后。
代價敏感學習的優化目標在于最小化分類器分類錯誤的總代價,而非簡單的減少分類錯誤率。傳統代價敏感方法對同類樣本賦予相同權重,但一些關鍵樣本對模型參數確定貢獻更大,對決策邊界形成更具有影響力。針對這一問題,研究者提出根據樣本分類難度重新加權樣本的方法[27],該類方法降低了易分類樣本的權重,并為困難樣本分配更多的權重。但由于軌面狀態數據集較小,ResNet18的高容量足以記憶整個訓練數據,根據樣本分類難度或損失重加權的方法會導致網絡對位于多數類和少數類重疊區域的困難樣本過擬合。Park等[28]提出一種新的影響平衡損失函數(IB損失函數),根據每個樣本對決策邊界的影響自適應地為樣本分配不同的權重,以減輕決策邊界對多數類的過擬合,創建更平滑的決策曲線。衡量樣本重要性的影響函數IB(x;ω)表達式為
IB(x;ω)=‖f(x,ω)-y‖1‖h‖1
(9)
式(9)中:f(x,ω)為模型;y為標簽值;h=[h1,h2,…,hL]T為隱藏特征向量,為全連接層的輸入。
結合式(9)得到IB損失函數為
(10)

在非均衡軌面狀態數據集中,多數類樣本入侵到少數類中,并在困難樣本中占據主導地位,致使決策邊界復雜化并向少數類區域移動。通過調整困難樣本的權重有助于形成更加平滑準確的決策邊界,但權重調整效果受到數據集特性、模型結構以及具體實現方式等多種因素的影響。采用的軌面狀態數據集呈現非均衡分布的特點,并且樣本數量相對較少,不宜采用類加權項λk。為更有效地利用IB損失重加權軌面狀態樣本訓練損失,提出一種新的類加權項βk,βk表達式為
(11)
新的類加權項βk通過調整軌面狀態圖像標簽頻率對損失權重的影響,增加軌面樣本的整體權重,以此避免過度降低邊界樣本中多數類的權重。同時,βk通過減緩多數類別損失最小化的速度來進一步緩解樣本總體非均衡分布引起的決策邊界偏差問題,從而減輕非均衡軌面狀態數據集對模型性能的影響,提高決策邊界的準確性和穩定性。
2.1.1 數據集介紹
實驗使用的數據集來源于株洲車輛段鐵路線紅旗路段,包括油污、潮濕、干燥3種軌面狀態圖像141張。由于CCD相機采集的原始圖像包含大量背景信息和噪聲干擾,增加了模型識別的難度,為此針對軌面狀態數據集進行預處理操作,其中包括中值去噪、幾何校正、軌面區域圖像提取等,從而提高網絡的魯棒性和識別精度。為解決訓練樣本過少的問題,采用隨機上下翻轉、隨機左右翻轉、隨機調整亮度、隨機調整對比度等數據增強方法擴充數據集,得到1 454張軌面狀態圖像,圖像增強效果如圖2所示。為便于網絡訓練、測試,將圖像重構為256×256像素大小。最后,以4∶1的比例對自建數據集進行近似劃分,得到訓練集1 154張,測試集300張,軌面狀態數據集如表1所示。

表1 軌面狀態數據集分布

圖2 數據集增強效果
2.1.2 實驗配置
實驗基于 Windows10 操作系統,運行環境配置如下。
(1)處理器:AMD Ryzen 5 5600H Six-Core Processor。
(2)運行內存:16 G。
(3)顯卡:NVIDIA GeForce RTX 3050。
(4)CUDA版本:cuda = 11.1。
(5)代碼運行環境:python3.7,torch = 1.8.1,torchvision= 0.9.1,scikit-learn= 1.0.2。優化器采用SGD;衰減系數(weight decay)為0.000 2;動量系數(momentum)為0.9;批次大小(batchsize)為8;訓練迭代次數(epoch)為200次;開始時的學習率設置為0.1,在50和100個epoch后下降0.1倍;隨機種子為42;超參數α為1 000。
2.1.3 評估指標
為合理評估所提方法的分類性能,實驗采用準確率(accuracy, Acc)和召回率(recall,R)兩個指標。其中,準確率表示所有預測正確的樣本數占總樣本數量的比例,召回率表示正確被模型預測為正例的樣本數占全部實例為正樣本的比例。兩個指標計算公式分別為
(12)
(13)
式中:TP為真陽性(true positive),表示將正類預測為正類數;FN為假陰性(false negative),表示將正類預測為負類數;FP為假陽性(false positive),表示將負類預測為正類數;TN為真陰性(true negative),表示將負類預測為負類數。
為驗證本文方法解決非均衡軌面狀態識別的性能,需要對建立的數據集進行非均衡處理,即每個類的訓練樣本數量從最大的多數類到最小的少數類呈指數下降。將第k類中所選樣本的數量設為nkμk,其中μ∈(0,1),nk為第k類樣本的原始數量,μ為非平衡比的倒數,而非平衡比ρ定義為ρ=maxk{nk}/mink{nk}。最后,通過實驗評估提出的方法在不同的非均衡比率下(ρ=50、100、200)的分類性能。
訓練過程分為兩個階段:標準訓練和微調訓練。在標準訓練階段,采用標準交叉熵損失函數CE形成初始決策邊界。微調訓練階段使用改進的IB損失函數降低困難樣本中多數類樣本的權重,減輕其對決策邊界的過擬合,以平滑分類器。兩個階段的過渡時間設置為模型訓練損失開始收斂時期,即總訓練輪數的一半,100 epoch。
2.3.1 消融實驗
為驗證不同改進措施對網絡ResNet18識別性能的影響,在相同的實驗環境和軌面狀態數據集下設計4組實驗,結果如表2所示。由于測試集每類樣本數一致,樣本總體召回率在數值上與準確率相等。

表2 消融實驗
由表2可知,改進1使用ResNet18預訓練模型,以緩解非均衡軌面狀態數據帶來的模型性能下降問題,相對于原模型,改進1準確率、召回率提升了9.33%。改進2在此基礎上引入CBAM機制,增強網絡的特征提取能力和全局信息感知能力,對比改進1準確率、召回率提升4.00%。改進3更進一步引入改進的IB損失函數,實現自適應分配樣本的誤分類代價,進一步提升網絡處理非均衡數據的性能,相較于改進2準確率、召回率提升了3.34%。因此,在原始ResNet18模型中添加的每一項策略都可發揮積極作用,表明所提出的網絡結構設計是合理有效的。
2.3.2 召回率實驗
在非均衡分類問題中少數類具有更高的分類價值,為驗證所提方法在提高少數類別召回率方面的優越性,同時可不過多犧牲多數類別召回率,在3種非均衡比(P為50、100、200)下進行實驗,結果如圖3所示。

圖3 召回率
圖3中,CE作為基線,是指標準交叉熵損失函數;IB+CB[29]是指損失函數的權重部分使用CB損失函數中的有效樣本數,而非IB損失函數中的類重加權項λk。分析圖3可知,在3種不同的非均衡比條件下,基線方法CE在少數類別的召回率最低,識別效果最差,表現出嚴重的學習偏移問題,而其他的三個對比方法IB[28]、Focal[30]、IB+CB在少數類別的召回率雖有不同程度的提升,但相比之下,本文方法提升程度最高,優于其他方法。同時,本文方法未改變訓練樣本的初始分布,可以保留樣本全部特征信息,因此可以有效維持多數類的分類召回率,整體軌面狀態識別效果得到顯著提高。
2.3.3 對比實驗
為驗證本文方法在非均衡軌面狀態識別任務中的分類性能,基于自建軌面狀態數據集,在3種不同的非均衡比下將所提方法與CE、IB、Focal、IB+CB 4種對比方法進行總體性能對比實驗,實驗結果如表3所示,同時繪制訓練過程中各方法的損失函數值變化曲線如圖4所示 (以非均衡比100為例)。

表3 對比試驗(準確率/召回率)

圖4 損失值變化曲線圖
由表3可知,在3種不同的非均衡比例下,本文方法在軌面狀態數據集上的分類準確率(召回率) 均優于其他對比方法,分別為96.00%、90.67%、86.33%。具體來說,非均衡比為50時,與CE、Focal、IB、IB+CB方法相比,所提方法的準確率(召回率)分別提高10.67%、7.00%、2.00%、2.67%;非均衡比為100時,所提方法的指標分別提高10.00%、2.34%、7.34%、3.34%;非均衡比為200時,所提方法的指標分別提高13.33%、3.00%、7.00%、7.33%。上述實驗結果證明了所提方法在不同的非均衡比場景下的適用性和優越性。
由圖4可知,本文方法在訓練過程中表現出損失起始值最小和收斂速度最快的特點,表明本文方法可節約大量的時間成本,并減輕計算機的硬件壓力,提高模型訓練效率。
聚焦于非均衡樣本下的軌面狀態識別問題,提出一種基于注意力網絡和代價敏感學習的識別方法,并通過實驗對所提方法進行驗證,得到結論如下。
(1)為緩解非均衡軌面狀態樣本訓練給特征提取網絡造成的學習偏見問題,該方法結合遷移學習思想,在均衡樣本特征分布后,將非均衡樣本輸入目標網絡進行微調以獲得軌面狀態底層特征;使用ResNet18為骨干網絡,引入CBAM機制進行雙維度的自適應特征優化,在提升模型運行效率的同時強化網絡對軌面狀態區域的注意力。
(2)為解決軌面狀態數據非均衡分布問題,改進IB代價敏感損失函數,根據每個樣本對決策邊界的影響自適應地分配不同的樣本權重,創建更加平滑的決策曲線。
(3)實驗結果表明,與Focal等方法相比,所提方法在軌面狀態識別準確率、訓練速度等方面均表現出了優越性。