劉瑞軍,司 瑾,史紅梅
(1 神華鐵路裝備有限責任公司, 北京 100120;2 北京交通大學 機械與電子控制工程學院, 北京 100044)
中國鐵路貨車的檢修制度以“日常檢查、定期檢修”的計劃預防修為主,現有檢修規程的更新相對滯后于車輛技術水平的發展,普遍存在過度檢修的現象,實現貨運列車狀態修(CBM)已成為列車維修模式的必然發展趨勢。一般而言,CBM 的主要目標是對設備狀況進行實時評估,以便做出維修決策,從而減少不必要的維修和相關費用[1],提高維修效率。
軸承是承受最高載荷的鐵路車輛的組成部分[2],其健康狀況直接影響列車的安全。然而目前在對車輛軸承進行日常檢查時,工人工作量大且沒有針對性,難以準確發現具有安全隱患的軸承。現有的軸承監測系統由于沒有分析零部件故障的發展過程和趨勢,缺少熱軸的提前預警,因熱軸報警造成的停機和扣修會對生產指揮產生很大影響。因此,對軸承進行健康狀態檢測和評估,提前發現含有安全隱患的軸承,實現對異常軸承開展針對性檢查和維修,在故障發生前對軸承進行檢查,并在熱軸報警前將其更換,是實現鐵路貨車狀態修的重要部分。
軸承的狀態監測數據包括單值類型的溫度數據、波形類型的振動、聲學數據。大多文獻都是基于振動數據分析對軸承進行故障診斷[3-5]。溫度數據常被應用在故障識別和監測,例如MA 等[6]對于高速列車車軸,通過逐步回歸分析法預測軸溫,反映軸溫的變化趨勢。
文中將歷史溫度數據視為時間序列進行分析并進行異常檢測。時間序列分析技術已被廣泛應用到工業、互聯網、金融等領域[7-8]。然而,對軸承溫度進行時間序列分析和狀態評估還沒有相關研究。文中針對軸承歷史溫度數據組成的時間序列進行分析,進行健康狀態評價和熱軸預警。采用滑動時間窗方式截取歷史數據,針對鐵路貨車軸溫數據的特點,構建基于時間序列異常檢測技術的熱軸預警模型,將軸承在歷史趨勢以及貨車同輛、同側、同列等多個維度上,識別在同維度內與正常軸承溫度有偏離的異常溫度,在各維度內構建多個數值特征,通過檢查特征來識別溫度異常情況,量化并分級表示其健康狀態,提前發現含有安全隱患的軸承,實現對檢修的針對性指導,從而節省計劃外的維護成本,提高檢修效率。
鐵路貨車紅外軸溫探測系統(THDS)的應用為軸承狀態監測和實現列車狀態修提供技術保障和數據支撐。軸溫異常檢測可以幫助檢測異常情況,保障列車運行安全。然而,現有監測系統沒有分析熱軸的發展過程和趨勢,缺少提前預警,不利于對檢修內容提供指導。
軸承在故障前的檢測數據大多都有一些異常情況,文中將THDS 監測數據作為算法輸入,對歷史監測數據和報警事件進行縱向規律分析,研究數據在運行里程維度的發展趨勢并進行預判。對軸承的健康狀態量化表示,按等級設置健康指標,評估軸承的劣化程度,實現對狀態不良軸承的多級提前預警,有助于做出狀態維護決策,防止事故隱患。
軸承預警算法需收集熱軸的事件數據和狀態監測數據:事件數據包括故障時間、故障發生的探測站、故障車輛及軸位信息;狀態監測數據包括列車所有軸承的歷史溫度數據以及歷次探測的環境溫度。
車輛在每次探測中會生成8 個軸承的內探與外探共16 個數據。文中以滑窗的方式對軸承歷史溫度數據截取,形成時間序列,將每個窗口內16 個數值的時間序列作為一組診斷數據,對各序列進行異常檢測、趨勢分析和統計學分析。
通過分析典型熱軸樣本的溫升曲線,可得到以下體現在時間和空間維度上的熱軸溫升趨勢類型:
(1)報警前在短期內呈上升趨勢,溫升明顯高于其他軸承,最終出現異常高溫值,如圖1 所示。

圖1 短期內溫升上升趨勢
(2)溫升出現驟升情況,并且高溫持續若干站,如圖2 所示。

圖2 短期內溫升驟升
(3)溫升無異常高溫值或異常溫升趨勢,但長時間高于其他軸承,即處于第一大值、第二大值,如圖3 所示。

圖3 長期第一大值、第二大值
(4)溫升長期或階段性明顯高于其他軸承,如圖4 所示。

圖4 溫升長期或階段性明顯高于其他軸承
文中將根據各類熱軸溫升趨勢的數據特點,構造數據特征作為異常溫升的診斷指標。
構建基于時間序列異常檢測技術的鐵路貨車熱軸預警模型,對THDS 歷史數據進行全過程縱向規律分析。模型流程如圖5 所示。

圖5 模型流程圖
軸承運轉熱溫度與環境溫度、車速等外界因素有關,需要盡可能地對各影響因素做修正。
(1)軸承的溫度會因環境溫度變化而有較大變化。由于溫升受環境溫度的影響較小,所以文中采用溫升表示運轉熱溫度。溫升是指軸承的表面溫度減去其所在的環境溫度,為式(1):

(2)為消除噪聲和缺陷數據,減小數據波動,需利用統計學方法進行平滑。文中采用的指數加權移動平均方法(EWMA)是一種趨向類指標,是以指數式遞減加權的移動平均,為式(2):

式中:X(t)為t時刻估計值;Y(t)為t時刻的測量值;n為總數據點數;a(0<a<1)為對于歷史測量值權重系數。加權系數a隨著時間而指數式遞減,表示為a=2/(n+1)。
EWMA 具有吸收瞬間突發的能力,相比于其他平滑方式更加穩定。移動平均線周期長度需根據輸入歷史數據窗口的寬度進行適當的選擇,參數過小則無法消除噪聲、減少數據波動,參數過大則丟失了異常數據的數據特征,如圖6 所示。

圖6 EWMA 結果
(3)通過將數據進行對數變換進一步減小數據的振動幅度,使其數據更加平穩,線性規律更加明顯,并增加數值小的數據的敏感程度。數據平滑和對數變換可削弱外界因素對軸溫的影響。
取當前探測站的前M次探測歷史數據,經過預處理后組成長度為M+1 的時間序列,即為式(3):

歷史數據共包含16 個傳感器的數據信息。將Tdata按照時間窗為K,步長為L切割成若干時間片段組成診斷 窗 口每個時間片段均包括其時間窗內的所有傳感器數據信息。
模型需特別定義“異常值”的概念。根據鐵路貨車多軸的特點,THDS 數據時間序列異常檢測可以視為經典異常值檢測的推廣,即異常溫度的概念是與同列車、同側軸承或同輛車中的其他軸承顯著不同的數據和趨勢。目標軸承在歷史趨勢以及貨車同輛、同側、同列等多個維度上構建多個數值特征,通過檢查特征來識別在同維度內與其他序列有偏離的異常模式。
結合THDS 監測原理和專家知識,在每個時間步內,從滑窗內數據中提取異常特征。通過檢查特征來識別出序列中的偏離點、變化點、異常行為等。
構造特征的過程包括特征提取與特征選擇。特征提取,即通過對軸承歷史溫升數據進行多維度分析,發現更有意義的潛在變量,幫助對數據產生更深入的了解。特征選擇是為了降低模型復雜度,提高模型的可解釋性,對數據特征進行主成分分析和相關性分析,選擇與熱軸判別結果相關性大的特征。最終選擇出幾個特征,見表1。

表1 特征參數名稱
各個特征指標的計算方法如下:
(1)異常值特征:當軸承溫升偏離所在車輛、車列一側或車列所有軸承的溫升平均值特定個標準差時,將其定義為異常值。對于發生故障或有潛在故障的軸承,其溫升曲線常常與車輛、該側、車列的其他正常軸承的溫升大小、趨勢不同,甚至產生極大偏離,歪曲實際情況,因此,在計算數據組的標準差、平均值時,首先剔除一次探測數據中的第一大值、第二大值。根據溫升數據分布范圍和對多個樣本的統計分析,設定數據偏離平均值2.7 個標準差為判斷數據是否異常的閾值,并統計出現次數。
設一次探測的特征值結果為x,一次探測的數據集為TqW,分別取車輛、車列一側或車列軸承探測數據,并去掉第一大值、第二大值組成異常值特征計算數據集,計算平均值和標準差為式(4):

(2)第一大值、第二大值特征:根據故障軸承的歷史數據分析,故障軸的溫升常處于同一輛車中或車列同一側中的第一和第二大值;另外,根據統計,TADS 中報警的故障軸承在其報警后的數據中多次出現前2 大值的情況,因此,統計軸承出現在前2 大值的頻率和次數,可以反映軸承的性能狀態。當車列兩側的第一大值和第二大值出現在同一輛車中時,判斷為疑似抱閘車,避免將抱閘作為熱軸進行預報影響了車輛狀態的準確判別,并預警車輛制動故障。
(3)異常大值特征:在軸承的一定時間窗口內的歷史溫升序列中,當軸承溫升偏離其歷史溫升平均值特定個標準差時,將其定義為異常大值。故障軸承會有一定概率出現異常大的溫升值,根據多個樣本的分析,設定數據偏離平均值2.85 個標準差為判斷數據是否為異常大的閾值,并統計出現次數。
設軸承一個探測位置的歷史數據序列為TiW(i∈[1,k]),計 算 平 均 值和 標 準 差SiW,為式(5):

(4)驟升值特征:當軸承發生突發故障,溫升會在短期內急劇升高。根據專家系統和故障機理,不同程度的溫升變化表征故障的不同嚴重程度,因此,在模型中設定多個驟升值特征閾值:30、50 ℃,利用原始溫升判斷是否屬于驟升值特征,并統計出現次數。
(5)離群點特征:為了采用不同的方法提取點異常,在模型中加入了離群點特征。模型中的離群點是采用K-means 聚類算法提取的點異常。聚類結束后分別計算各樣本到聚類中心的距離,設置合適的距離閾值,當距離大于設置的閾值時將該值視為離群點,同時,存在自為一類的點,也將其視為離群點。
為避免數據波動對預測結果的影響,采用滑動時間窗算法對歷史時間序列進行分析。通過計算多次滑窗累加扣分值表征軸承的健康狀況,進而對軸承的潛在故障進行預判。文中以當前及歷史探測站共19 組探測數據作為輸入,設置滑窗窗口長度為15,如圖7 所示。提取當前指標診斷窗口的特征,得到特征矩陣。將滑動步長設為1,構建5個特征矩陣,特征矩陣中的每個特征乘以對應的特征系數,計算5 次滑窗累加值。

圖7 滑動窗口示意圖
對每個診斷窗口內的時間片段進行特征指標計算,所以每一時間片段的特征值向量為fi=(x1,x2,…,xn)。經過滑窗診斷后,將形成對車輛中8 個軸承的滑窗特征值向量,進而形成車列中各車輛軸承的滑窗特征值向量,為式(6):

根據各特征與軸承性能狀態的相關程度設置特征系數。通過統計故障軸承和正常軸承具有特征參數的次數與對應健康狀態的相關性,作為計算特征系數的依據之一。本算法通過Pearson 相關系數法計算特征系數λ,并結合經驗進行調整。
目標軸承狀態滑窗累計扣分值,即軸承狀態扣分d為式(7):

根據累計扣分值的大小,設置不同的扣分值閾值,閾值可以通過收集分數分布的統計數據并假定分數的分布是正常的來確定。進而實現對軸承健康狀態預警的進一步細分,即一級預警、二級預警,見表2。

表2 劃分預警等級
文中算法在神華鐵路2017 年8 月~2018 年11月、2020 年11 月~2021 年2 月 的44 個 熱 軸 報 警 軸承上進行驗證。將提前24 h 以上的預警視為準確預警。驗證結果見表3,預警算法的準確率為

表3 提前預警結果
93.18%。
試驗結果表明,算法可以實現熱軸的提前預警,典型實例如圖8~圖10 所示。

圖8 預警實例1

圖10 預警實例3
(1)某密封罩突發故障,軸承經過明顯的溫升上升階段,直到異常高溫值,觸發激熱報警。
(2)車輛由于軸承卡滯有異音發生微熱及強熱報警。
(3)溫升長期或間歇性明顯高于其他軸承,體現在空間維度上的趨勢異常。
實例中發生漏報的3 個樣本均為由軸承突發故障造成的熱軸,溫升如圖11 所示。

圖11 漏報樣本
此外,由于模型的預警等級閾值是決定準確率與誤報率的關鍵因素,因此,可根據列車實際運行情況和檢修需求調整預警閾值,在保證較高準確率的同時減小誤報率。通過實例驗證,目前設定的閾值下,預警算法在205 個THDS 未發生報警的軸承中,有27 個進行了預警,從數據上分析,部分誤報軸承的溫升變化與車輛其他軸承相比確實存在異常,如圖12、圖13 所示,可以在檢修時對該軸承進行重點檢查,避免發生熱軸。

圖12 THDS 未報但預警樣本1

圖13 THDS 未報但預警樣本2

圖9 預警實例2
文中構建了基于時間序列異常檢測技術的鐵路貨車熱軸預警模型,通過提取時間、空間維度下的多個數據特征,并計算健康狀態得分來識別含有故障隱患的軸承。數據特征的構建不僅是對目標本身時間序列的趨勢分析,更將重點放在同輛比、同側比、同列比上,這種方法能夠有效地減小外生變量,如運行速度、運載重量對軸溫的影響,因此,本模型的泛化性強,適合所有類型和大多數工況的多軸車輛。
對于神華鐵路THDS 系統的44 個熱軸數據,有超過93%的樣本實現了提前不同程度的預警,從而有效地實現了對軸承的狀態監測。同時,如果以THDS 目前探測結果為依據,還是存在一定的誤報,下一步也會進一步跟蹤這些軸承和分析誤報的軸承溫度異常原因。模型的應用可以有效地做到軸承部分故障的提前預警,幫助做出科學的維護決策,使車輛在列檢中進行有針對性地檢查和修理,大幅提高檢修效率,有效防止事故隱患,減少因故障造成的停機。