程 亮,王少華
高鐵因其安全、快速、準時的特性,成為了現代社會不可或缺的出行方式,我國全路每天運行3 000 多列動車組。動車組司機操控信息分析系統(EMU Engineer Operation Analysis System,EOAS)車載設備作為動車組重要行車設備,其運用狀態直接影響車輛運用效率,然而現有維護手段已逐漸無法滿足高標準、嚴要求的車載設備運用保障要求。
故障預測與健康管理(Prognostics Health Management,PHM)是為了滿足設備自主保障、自主診斷提出的重要理念,相關技術的發展也較為成熟,因此在EOAS 系統的維護管理中引入PHM技術,建立安全狀態診斷和預測系統,提升EOAS設備的可靠性,對提高設備維修維護效率、降低成本起到了關鍵作用[1]。
隨著EOAS 車載設備數量的快速增長,以及部分EOAS 車載設備逐漸進入維修周期,僅依靠人力和機務故障報修系統進行設備維護,其及時性、有效性顯然無法保證,具體表現在以下幾方面[2]。
1)無法及時準確掌握故障。電務部門作為電務車載設備的維護單位,主要通過機務故障報修系統獲取車載設備故障信息,而機務故障報修系統存在著大量的重復報修、無效報修,無法準確有效地反映出EOAS 車載設備的故障狀態,并且人工篩選有效信息,時間上相對滯后,不能及時掌握設備的故障狀態,無法有效開展設備維護。
2)缺乏音視頻設備監測手段。EOAS 司機室攝像頭、前置攝像頭、拾音器、線路相機等音視頻設備的狀態檢測依賴于二級修和故障修時人工上車檢測,在單個檢修周期內不能及時發現設備異常,所以無法便捷、有效地進行音視頻設備監測。
3)缺乏轉儲裝置維護手段。隨著動車組開行頻次的增加,EOAS 轉儲裝置的插卡頻次越來越高,造成較高的設備損耗,導致在報修故障中出現的轉儲裝置接觸類問題日漸增多,但目前缺乏轉儲裝置運用趨勢分析和故障預判手段。
為解決電務檢修人員無法及時掌握EOAS 設備故障、缺乏故障檢測和預判手段等痛點問題,基于PHM 技術,通過開發專用檢測設備,運用圖像識別和大數據分析,研制基于PHM 技術的EOAS健康管理和故障預測系統(以下簡稱“系統”),系統設計目標如下。
1)設備狀態實時監測與故障分析。系統應具備EOAS 車載設備各插板、轉儲裝置等部件工作狀態的實時采集、監測功能,并結合機務部門提報的報修單信息,進行數據綜合分析,生成故障報警。
2)視頻設備自動檢測。系統應對EOAS 車載司機室攝像頭、前置攝像頭、線路攝像機等設備的拍攝圖案進行抓圖展示,自動識別出攝像頭圖案的黑屏、白屏、花屏狀態,并基于圖像識別算法進行圖像異常檢測,同時生成報警,提高檢測效率。
3)設備檢修閉環管理。對既有EOAS 車載設備轉儲裝置進行硬件優化:支持掛卡槽插卡次數計數,便于及時掌握掛卡槽的損耗情況;支持無線傳輸通信功能,利用專用的車載設備檢修手持終端進行無接觸式EOAS 車載設備檢測、拍照、檢修記錄回傳以及自動回執報修單,實現設備檢修作業的閉環管理。
4) 設備故障趨勢分析。結合實時采集的EOAS 設備狀態數據以及上車檢修過程的檢測數據,通過大數據分析,實現關鍵部件的性能判斷和趨勢預判[3]。
系統總體架構見圖1,由路局健康管理服務器、電務車間工區數據處理存儲工作站、用戶終端、數據轉儲裝置、手持檢測終端等組成[4]。

圖1 系統總體架構
1)路局健康管理服務器包括應用服務器和數據庫,部署在路局機房,主要實現EOAS 車載設備狀態數據、機務報修單數據的采集抽取、預處理、數據存儲、挖掘分析,同時進行系統基礎數據維護、操作權限控制,實現電務工區數據存儲工作站與用戶終端的交互功能。
2)電務工區數據存儲工作站部署在電務車間工區,主要實現音視頻檢測數據、檢修計劃數據、設備檢修結果數據的存儲和調閱。
3)用戶終端包括健康管理終端和視頻設備監測終端,部署在電務車間工區。其中,健康管理終端用于訪問系統采集的監測數據、報警數據和檢修作業數據;視頻設備檢測終端用于訪問車載各攝像頭視頻圖片數據和圖像異常報警數據。
4)手持終端用于電務檢修工區人員上車進行EOAS設備檢測、檢修和數據下載。
系統的軟件設計采用B/S 架構,自下而上劃分為數據采集層、數據存儲層、數據分析層、健康管理運用層4層[5],軟件架構見圖2。

圖2 軟件架構
1)數據采集層。通過系統間數據自動接入和人工錄入等方式,獲取系統所需的車載設備狀態、音視頻數據、報修單數據、EOAS交路數據等。數據采集層適配了不同類型的采集接口,通過車地傳輸通道發送至地面設備;通過接入機務故障報修系統,定時采集機務提報的報修數據,包括報修車號、故障時間、故障類型等信息;通過標準化模板支持檢修任務單數據的導入。
2)數據存儲層。將采集數據根據業務運用特性,進行格式分類、組織,形成符合要求的數據,并按類別存儲。對于調閱頻繁的熱數據,使用非關系型數據庫Redis 存儲;對于分析后的結果數據采用關系型數據庫存儲。
3)數據分析層。采用多種分析模型和PHM分析結構對各類數據進行挖掘及應用。對車載設備狀態數據、機務報修單數據,通過關聯規則、多維分析、模型可視化的方式進行處理,能夠將車載設備的原始狀態信息與報修單中的設備故障匹配,呈現設備故障的規律和趨勢。
4)健康管理運用層。按照運用業務劃分為不同的功能模塊,在既有列控車載動態監測及傳輸系統(Dynamic Monitoring System,DMS)客戶端軟件上進行健康管理功能模塊開發,并通過DMS 客戶端訪問系統,方便電務管理和設備維護人員的使用。
系統主要具備故障報警自動分析、音視頻設備檢測、實時監測設備狀態、設備檢修閉環管理、故障預測分析等功能[4],見圖3。

圖3 系統功能
系統通過列控車載動態監測及傳輸系統的車地實時傳輸通道,采集EOAS車載主機CPU板、EOASCOMM 插板、DUMP 插板、WTD/DRWTD 插板、CIR 插板、轉儲裝置、司機室攝像頭、前置攝像頭、線路攝像機、拾音器等設備狀態以及板卡間的通信狀態,結合動車組的行車場景,自動對設備狀態數據進行設備故障判斷、分析,形成實時故障報警[6]。同時系統從EOAS 故障報修系統同步機務部門提報的EOAS 報修單,將報修單內車載設備故障結合實時設備檢測狀態進行關聯分析。把機務提報的問題主要分為設備故障、外部數據異常、數據邏輯處理3 類。其中,設備故障需由電務檢修人員使用手持終端,按計劃車載設備故障處理,任務下發時系統會給出故障處置建議,可為檢修人員提供參考;外部數據異常一般為接口設備類問題,可反饋至相關設備維護單位協同處理;數據邏輯處理為EOAS設備車、地軟件類問題,電務檢修人員無需上車進行硬件設備故障處理。
系統通過列控車載動態監測及傳輸系統周期性采集各類攝像機圖像,并把圖像數據傳輸至健康管理服務器。系統采用圖像識別技術對圖像黑屏、白屏、花屏等進行自動識別并報警[7]。電務工作人員可通過視頻設備監測終端篩選日期、車號、攝像頭類型等條件,查詢到圖像報警列表詳情以及報警頻次。系統支持圖像異常時刻和最新圖像同屏對比顯示,便于工作人員分析判斷。
系統能夠查看EOAS 車載主機設備各板卡和音視頻設備的實時狀態,并以示意圖形式動態展示,便于維護人員及時、直觀地掌握各設備的工作狀態,為及時安排故障設備檢修作業提供依據。
系統可生成車載設備類故障檢修計劃,及檢修問題的排查建議,維護工區工作人員通過手持終端按設備檢修流程進行任務領取和上車檢修,作業完成后通過手持終端將檢修數回傳,實現檢修作業閉環管理。
手持終端采用便攜式設計,內置專用無線模塊及APP 軟件,在司機室附近,可以自動連接升級版EOAS 車載轉儲裝置的內置專用無線網絡,實現無接觸式設備檢測、數據下載等功能。
利用EOAS 實時監測所采集的狀態數據、機務故障報修數據及無接觸檢測終端采集的檢測數據,根據故障類別、故障所屬范圍(動車組車端、動車所、電務段)等維度,進行設備故障數據的統計和趨勢分析。
1)設備故障統計。統計設定時間段內各部門配屬車輛的EOAS 設備故障情況,根據設備故障類型查看分布情況,并支持按照車端故障數量統計排序。
2)故障增長率統計。可對一段時間內的車載設備類故障按照最近12 月的月度環比增長率進行分析和比較,并統計最近2 年的月度同比增長率,方便管理人員掌握車載設備故障的整體發展趨勢。
3)作業情況統計。可統計設定時間段內車載設備類故障的處置情況,方便管理人員及時掌握故障的檢修維護處理情況。
4)故障趨勢預判。結合EOAS 各插板、部件狀態和使用情況,通過大數據計算,對EOAS 轉儲裝置卡槽壽命到期進行預警。并且系統可對EOAS車載設備故障進行趨勢分析,識別故障頻次較高車端、故障頻率較高類型,提前進行故障預警[8]。
利用圖像識別技術,對司機室攝像機、前置攝像機、線路攝像機等的圖像進行識別和異常報警。基于Sobel 算子的邊緣檢測,對圖像模糊度進行計算,同時結合閾值和邏輯判斷進行圖像黑屏、白屏、花屏的識別[9]。
Sobel 算子作為一種在圖像處理中廣泛使用的邊緣檢測算法,通過計算圖像灰度函數在橫向和縱向上的梯度大小來檢測圖像的邊緣。邊緣是圖像中灰度值快速變化的區域,這些變化通常對應于物體與背景之間、不同物體之間或物體結構的細節。對圖像中邊緣線的檢測是圖像分割與特征提取的基礎,通過計算像素灰度值的變化速度,可以確定該像素是否位于邊緣上。
Sobel算子使用橫向和縱向兩個方向的卷積核,分別計算像素灰度值在橫向和縱向上的梯度大小,根據梯度大小反映了該像素所處位置的邊緣強度。將圖像中每個像素的梯度大小與預先設定的閾值進行比較,確定該像素是否位于邊緣上。在實際應用中,通常使用一些邏輯判斷方法來確定圖像的邊緣。例如,將相鄰像素的梯度大小進行比較,如果相差較大,則認為它們構成邊緣,否則不構成邊緣[10]。
原圖像素點的橫向梯度Gx為
原圖像素點的縱向梯度Gy為
式中:A為原始圖像。
通過Gx和Gy可以得到圖像的整體梯度幅值G為
式3可以簡化為
根據式4,計算出每個像素點的G值,最后對整個圖像的全部G值求和作為整張圖像的模糊度M。M值越大,說明圖像的邊緣信息越少,圖像越模糊;M值越小,說明圖像的邊緣信息越多,圖像越清晰。系統識別的黑屏、白屏和花屏均為模糊度較高的圖像。將樣本圖像分為正常和非正常兩大類,分別計算出兩類圖像的M均值M1和M2,將M1和M2作為兩類的分界線,可區分出正常圖像和非正常圖像,再根據非正常圖像的RGB 值可進一步分辨出黑屏、白屏和花屏。
系統周期性采集攝像機視頻圖片,利用配置了GPU 運算能力的服務器進行輔助圖像識別,識別結果顯示在視頻設備檢測終端。如圖4 所示根據當前登錄用戶所在組織的配屬車輛信息進行默認車輛展示,如果用戶設置有關注車輛,則默認顯示關注車輛的當天抓圖信息,否則按照左側車輛列表展示最新3 個車端數據。左側車號列表顏色顯示規則:最近24 h 存在抓圖信息的標注綠色,超過30 天無圖片信息的標注紅色。如圖5 所示,系統可有效識別黑屏、白屏、花屏異常,形成報警數據,并按照車號、時間、相機類型、報警類型、運行端進行關聯查詢。

圖4 圖像抓拍識別

圖5 報警車輛
系統采用風險矩陣分析法定量計算風險項的風險值,評估EOAS 設備故障的安全風險等級。風險矩陣法是一種常用的風險評估方法,它通過比較項目的各個風險因素,從而確定各因素的風險等級,最后計算得出項目的總風險值。基于此,科學劃分風險等級,分析風險發生的可能性與嚴重程度的關系,權衡風險可接受尺度,流程如下。
Step 1識別風險。首先,需要識別出可能造成事故后果的風險因素:整機風險、板卡風險、模塊風險、人員風險、操作風險等。
Step 2確定風險級別。風險等級從高到低劃分為重大安全風險、較大安全風險、中等安全風險、一般安全風險,分別用紅、橙、黃、藍4 種顏色標示。
Step 3評估事故發生的概率。對于每個風險因素,評估其發生的概率,采用5 種等級標識:很可能、可能但不經常、可能性很小/完全意外、很不可能/可以設想、極不可能。
Step 4定量計算風險值。建立風險矩陣,計算每個風險因素的風險值。矩陣的行表示風險的概率,列表示風險的嚴重程度。
Step 5計算總風險值。將所有風險因素按照其風險值進行排序,可使用加權平均等方法計算所有風險的數值總和,即為項目的總風險值。
系統于2022 年12 月在南京電務段南京動車所投入應用。系統支持對列控車載動態監測及傳輸系統車載設備的檢測,可一機多用,故僅需購置一套系統即可替代傳統檢修方式中電務檢修車間分別采購的EOAS 綜合測試臺和DMS 綜合測試臺,兼顧了對EOAS、DMS 車載設備的檢測,采購成本可減少約50%。同時,利用系統具備的實時監測、自動診斷等功能,檢修人員遠程操控即可完成設備的功能檢測,取代了傳統人工攜帶檢測工裝上車的方式,提高了檢測效率,降低人工作業成本和檢測耗時。
基于PHM 技術的EOAS 健康管理和故障預測系統提升了電務部門對EOAS 車載設備維護效能,進一步豐富了EOAS車載設備檢維手段,為EOAS車載設備狀態監測提供了解決方案,可以有效提高設備異常情況從發現到處置的及時性、準確性,助力保障設備運行的可靠性和安全性。接下來,將繼續挖掘既有數據利用深度,通過AI 學習訓練,建立更多種不同故障類型的故障模型,提升系統診斷與預判的精準度和及時性。