何曄 陳健 楊楠 陳翔 鄭少彬

摘要:針對列車三取二邏輯控制單元產品采用控制器局域網絡進行內部、外部通信,產生大量通信過程數據的情況,分析了CAN總線質量對通信數據可能造成的干擾,提出一種更高效的CAN通信智能監測方法。目前經過測試,該三取二LCU系統已示范應用于廣州市軌道交通二十一號線兩列車,應用情況良好。
關鍵詞:城軌列車;三取二邏輯控制單元;CAN通信數據測試技術;機器學習
0 ? ?引言
城軌列車三取二LCU為實時同步控制系統,各模塊間通過控制器局域網絡(CAN)進行數據共享,這些數據的通信質量直接關系到LCU系統運行的正確性和穩定性。LCU的存儲模塊,由于存儲空間限制,只能記錄LCU輸入、輸出、故障等關鍵數據,不能對系統整體協議做出符合性檢測。人工分析雖然能夠在明確目標時針對性找出錯誤,但針對海量報文會耗費大量人力和時間。同時,LCU在不同配置下會產生不同報文,人工分析不具備經濟可行性。軟件應能自動、實時監測通信報文,識別出與協議不符的報文、錯包、重包、亂序、篡改等錯誤,解決人工分析重復性、準確性、適應性差,效率低等問題。
1 ? ?通信架構與CAN通信報文設計思想
三取二LCU包含三類通信總線:級聯CAN總線、組間CAN總線、組內CAN總線。級聯CAN總線用于多個LCU間數據通信;組間CAN總線用于單臺LCU內部主控板、IO板、CAN板、MVB板不同功能板卡間數據通信;組內CAN總線用于LCU同組功能板卡間通信。
為防止通信報文在通信過程中發生重復、刪除、插入、重排序、損壞、延時錯誤,影響LCU功能和性能,三取二LCU級聯CAN、組間CAN、組內CAN通信協議均采用了序列號、報文校驗、超時識別等防護措施。
2 ? ?通信智能監測軟件架構
三取二LCU CAN通信智能監測軟件按功能分為通信報文采集處理模塊、通信報文智能分析模塊、UI模塊。配合軟件工作的外部設備還包括CAN通信終端。
2.1 ? ?通信報文采集處理模塊
2.1.1 ? ?功能
智能監測軟件可以連接三取二LCU級聯CAN總線、組間CAN總線、組內CAN總線,智能識別和關聯相應CAN總線。連接CAN通信終端后,智能監測軟件根據配置數據,自動采集相應報文,并將采集的報文按照采集到的時間先后順序存儲,供智能分析模塊分析。
2.1.2 ? ?結構
通信報文采集處理模塊分為CAN報文采集、CAN報文存儲。CAN報文采集通過連接到CAN總線的CAN通信終端接收CAN報文,并為CAN報文打時間戳。CAN報文存儲將CAN報文ID、報文數據、報文時間戳存儲到數據庫。
2.2 ? ?通信報文智能分析模塊
2.2.1 ? ?功能
三取二LCU根據應用場景不同,其配置的IO板組數存在差異,不同配置的LCU在級聯CAN、組間CAN、組內CAN的通信報文的時間間隔、報文ID、報文數據量會產生較大差異。三取二LCU CAN通信智能監測軟件通過智能學習,以CAN通信協議為基準,從LCU被測CAN總線采集的訓練報文樣本為輸入,智能生成CAN總線通信模型,比如各報文期望間隔、數據期望內容等,供對應LCU的該CAN總線通信海量數據分析使用。
離線分析:先將采集的通信報文存儲起來,智能分析系統不與LCU聯機的情況下,分析存儲的通信報文。離線模式常用于LCU在地鐵車輛運行、環境試驗等不方便實時監控的時候。
2.2.2 ? ?智能學習模塊
智能學習模塊通過逐條提取CAN報文學習樣本中的CAN ID加數據內容,去除重復部分后,將該條CAN報文ID與CAN通信協議中的ID對比,當ID合法時,產生CAN通信期望周期,并將CAN ID、數據內容、期望周期輸出至智能監測模塊數據期望區。當ID非法時,向UI模塊輸出錯誤。如此循環,直至完成CAN總線報文學習樣本解析。
2.2.3 ? ?數據分析模塊
當數據分析模塊接收到來自智能學習模塊的允許運行通知及開始分析指令后,開始從最舊一個待分析CAN總線數據存儲文件進行分析。分析開始后,首先進行本文件異常ID剔除。對比來自智能學習模塊輸出的數據期望區期望CAN ID與待分析文件所有CAN ID,如果發現不一致,則將存在不一致的CAN ID報文全部內容輸出至UI模塊。
2.3 ? ?UI模塊
監測結果輸出用于持續監測數據分析模塊是否有異常數據報告,這些報告包括:樣本中存在非法ID、被分析文件中CAN ID與期望不一致、被分析文件中數據內容與期望不一致、被分析文件中數據周期與期望不一致等。同時報文CAN ID、接收時間、數據區數據內容將作為唯一特征被一并記錄。這些數據將被實時顯示、刷新,并記錄在一個日志文件中,以備后續數據異常原因排查。
3 ? ?三取二LCU CAN通信智能監測軟件對通信異常驗證測試
根據對CAN通信波形分析,如圖1所示,箭頭處CAN通信差分信號在高電平期間應持續為1,但波形產生了畸變。該幀CAN報文由于數據區與校驗區不一致,導致CRC校驗錯誤,產生重發或丟幀現象。
類似地,下方CRC校驗因波形異常影響采樣點,導致校驗失敗。同樣在監測時發現CAN報文丟幀現象。CAN通信波形異常導致的錯誤,會體現在通信成功率上,若造成校驗錯誤,可能導致CAN通信丟幀。當CAN通信接收終端采樣點處受到的干擾在同一幀報文多個波形處達到一定數量和幅度時,該幀CAN報文可能由于數據區與校驗區同時受干擾,導致CRC校驗異常通過,將產生CAN報文數據跳變,通過監測軟件測試,該異常表現為報文數據異常。
對報文數據異常的設備進行眼圖測試,發現CAN通信上升沿、下降沿散亂,影響采樣點,其表現為CAN通信波形眼圖不收斂,長時間監測仍然離散形態。在較高總線負載下,易導致CAN通信丟幀、數據跳變等問題。
眼圖不收斂的現象經過充分調測,CAN通信波形眼圖可表現為清晰、收斂。相同環境下運行測試,其長時間監測丟包率等于0。同時通過智能監測軟件再次測試,丟幀、數據跳變現象不再出現。
4 ? ?結語
本文針對城軌列車三取二LCU提出一種更高效、更準確的CAN數據監測分析方法——基于軟件智能學習的CAN通信智能監測軟件。通過學習、提取樣本報文,實現快速、低成本的對CAN通信報文的監測,提升了三取二LCU在單板測試、集成測試、裝車聯調、初期運營等不同運用、調測階段定位和排除CAN通信問題的效率。
[參考文獻]
[1] 鄭玄,何曄,蘇釗頤,等.城軌列車三取二邏輯控制單元設計[J].電力機車與城軌車輛,2019,42(6):21-23.
[2] 呂強.地鐵列車LCU系統技術發展與應用[J].科技創新導報,2016,13(28):1-2.
[3] 王肅伏.地鐵車輛無觸點邏輯控制單元的研制[J].中國鐵路,2014(8):109-112.
收稿日期:2020-08-03
作者簡介:何曄(1964—),男,廣東廣州人,教授級高工,研究方向:城市軌道交通車輛技術。