錢 卿,周 文
(1 廣州鐵路(集團)公司 車輛處,廣東廣州510088; 2 廣深鐵路實業發展總公司,廣東廣州518001)
CRH3C型動車組人機接口顯示屏慣性故障分析及整改措施
錢 卿1,周 文2
(1 廣州鐵路(集團)公司 車輛處,廣東廣州510088; 2 廣深鐵路實業發展總公司,廣東廣州518001)
介紹了CRH3C型動車組HMI硬件結構、通訊機制與工作原理等,針對動車組運用過程中發現的4類HMI慣性故障,進行深入的原因分析,提出了有效地整改措施與運用建議。
動車組;CRH3C;人機接口顯示屏;故障
近年來,隨著我國鐵路事業的快速發展,特別是客運專線建設的推進,動車組列車在鐵路客運中承擔著越來越重要的作用,CRH3C型動車組設計時速高,旅客乘坐舒適,承擔了京津、武廣等高鐵線路的客運任務。
由于動車組連續運行時間長、運用環境復雜,CRH3C型動車組作為我國投入使用的第一批高速動車組,在運用初期,動車組設計不能完全適應我國實際運用環境的需求,尤其是作為動車組神經中樞系統的列車網絡控制系統。所有通信、控制、設備狀態監控和處理都依賴于網絡,一旦網絡系統出現問題,很有可能影響列車的正常運輸秩序。
其中列車人機接口顯示屏(Human Machine Interface,簡稱:HMI)作為列車控制網絡系統的重要組成部分,存在黑屏、以太網中斷等慣性故障,既影響司機操控列車,也可能因故障造成晚發、臨停甚至換乘等影響運營秩序的事故,亟需對此進行深入分析,并提出針對性的整改措施。
1.1 列車網絡控制系統基本結構
CRH3C型動車組是動力分散型電動車組,采用8輛編組,分為兩個牽引單元,每個牽引單元由2輛動車和2輛拖車組成。整車采用TCN網絡控制系統,列車級使用WTB總線,車輛級使用MVB總線[1]。CRH3C型動車組的列車網絡系統拓撲結構為一列車兩個MVB車輛網絡,為反對稱結構,每個MVB網絡上均有WTB/MVB網關,兩個MVB網絡經過網關通過WTB進行列車級通信。半列車網絡的拓撲結構如圖1所示。
CRH3C型動車組共裝有5臺HMI,其中4臺是司機HMI,每個頭車司機室內各安裝2臺,采用左右冗余對稱布局;1臺機械師HMI安裝在5車機械師室內。所有HMI均接入MVB總線,通過MVB總線與列車網絡控制系統實現數據交互。HMI的主要功能是幫助司機(機械師)掌握列車當前各子系統的工作狀態、便于司機(機械師)按不同權限對列車施加控制指令,以及實現整車運行情況綜合診斷。
1.2 HMI硬件結構
CRH3C型動車組HMI硬件由嵌入式計算機、環境控制器、MVB控制器、TFT顯示器和各種外圍接口組成,硬件結構如圖2所示。
1.3 HMI通訊機制
CRH3C型動車組HMI主要對外接口是MVB和以太網,其中MVB接口用于接入MVB總線,從而與列車網絡控制系統進行交互;以太網口用于司機HMI左右屏之間的數據同步。
HMI使用的MVB數據包括過程數據和消息數據。過程數據用于獲取網壓、網流、本牽引單元車門、照明等子系統狀態,本牽引單元各關鍵部件溫度等信息。此外,HMI跳動信號也通過過程數據發送。消息數據用于獲取受電弓、主斷路器等子系統狀態,司機(機械師)對空調、照明等系統的指令也通過消息數據發送。不同牽引單元之間的HMI采用私有消息數據協議進行通訊,從控單元的HMI通過WTB網關將本單元的子系統狀態以及本單元的列車故障信息向主控單元HMI發送。
1.4 HMI冗余設計
由于HMI是司機掌握列車狀態,施加控制指令的重要設備,因此CRH3C型動車組對司機HMI采用了主從式冗余設計。每個司機室內配備有2臺司機HMI,采用左右式布局,默認狀態下,右屏為主屏,左屏為從屏。

圖1 半列車網絡拓撲結構

圖2 HMI硬件結構
主屏是列車的診斷中心,負責采集各子系統診斷數據,并對這些數據進行融合,進而實現整車的綜合故障診斷。為了保證列車診斷功能穩定可靠,從屏會始終監測主屏的心跳信號,當主屏故障時,從屏自動重新配置,切換到主屏模式;當主屏故障恢復時,當前工作在主屏模式下的從屏會自動恢復到從屏模式,防止功能沖突。
2.1 HMI黑屏故障
故障現象:動車組正常運行途中,偶發HMI無任何顯示,等同關機狀態,且無法自動恢復,發生該故障后,按照相關操作規程,司機需立即停車處理,并占用一定時間進行恢復操作,極易形成臨停、造成列車晚點。如2015年1月15日,CRH3C-3054車組擔當G6224次交路時,由于HMI黑屏導致列車臨停6分;2014年1月18日,CRH3040C+037C車組擔當D7802次交路時,由于HMI黑屏造成臨停21分。
原因分析:
(1)看門狗失效
HMI設計了硬件看門狗,HMI應用軟件必須定時更新看門狗心跳信號,以表明軟件工作正常。當HMI應用程序出現處理器阻塞,而心跳信號未能及時更新時,看門狗控制器出于對HMI軟件的保護目的,會自動重啟,在連續3次重啟后,需要人工干預進行重新開機,從而發生HMI發生黑屏故障。
(2)環境控制器通訊異常
HMI的顯示器背光由環境控制器控制,環境控制器與HMI內置的嵌入式計算機通過串口進行通訊。如果二者之間的通訊出現異常,環境控制器有可能會自動關閉顯示器背光,造成HMI發生黑屏故障。
2.2 HMI“問號”故障
故障現象:動車組正常運行途中,偶發HMI會出現某子系統(如制動、空調、照明、車門)的狀態無法正常獲取,對應于該子系統的顯示頁面為問號。發生該故障時,司機無法得知該子系統的狀態,尤其是涉及行車相關的制動或車門狀態,在狀態未知時,司機為安全起見,可能會停車進行故障排查,稍有延誤,可能導致列車臨停甚至晚點。
原因分析:
(1)HMI作為列車診斷中心,需要實現整車綜合診斷功能。因此各從控單元主屏,需向主控單元主屏發送本單元的故障信息。此外,各從控單元HMI還需向主控單元HMI發送本單元各子系統的狀態數據。為保證列車運行安全,按照故障導向安全原則,故障信息的處理優先級高于狀態數據。因此,當故障信息較多時,主控單元HMI有可能出現數據通訊擁塞,無法及時更新其他單元的子系統狀態,進而導致子系統狀態無法顯示故障。當列車重聯運行時,由于牽引單元數量增多,網絡通信延時加大,發生該故障的可能性也相應增大。
(2)當從控單元的主屏發生黑屏時,不再向主控單元發送故障信息與狀態數據,也可能導致主控單元無法顯示該單元所采集的子系統數據。
2.3 以太網中斷
故障現象:動車組正常運行途中,偶發司機左屏和右屏之間以太網通信中斷的故障。由于HMI左右屏之間通過以太網進行數據同步,因此以太網通信中斷會導致左右屏之間的協調工作出現問題,給司機操作帶來不便。
原因分析:HMI顯示屏目前采用的以太網控制器型號較為落后,驅動軟件可靠性不高。同時,由于司機室左右屏之間通過以太網進行數據同步,因此當數據吞吐量較大時,可能偶發以太網控制器驅動崩潰或硬件異常,造成以太網通信中斷,甚至觸發HMI操作系統異常退出。
2.4 操作系統崩潰
故障現象:動車組正常運行途中,偶發HMI操作系統崩潰,一旦發生,HMI軟件會退出正常程序與圖形界面模式,無法繼續實現監控功能,影響司機對列車的操控。
原因分析:目前HMI目前采用的操作系統版本為Microsoft Windows 3.11版本,運行可靠性不足。當列車持續運行時間較長,或數據處理負載較大時,有可能由于操作系統自身原因發生系統崩潰,造成HMI應用軟件退出,無法繼續實現功能。
根據上述故障現象及原因分析,結合CRH3C型動車組的運用經驗,制定了如下有針對性的整改措施。
3.1 HMI故障整改措施
(1)操作系統及軟件升級
原有CRH3C型動車組HMI軟件設計中,過多的考慮了設備的自我保護功能,無法適應我國高速鐵路對運營秩序的嚴格要求。因此,改變原有設計思路,采取了延長硬件看門狗激活的時間,降低因未及時喂狗導致HMI關閉的發生幾率;同時,為防止由于操作系統崩潰導致的HMI故障,基于高可靠性的嵌入式實時操作系統QNX[2],重新研發HMI應用軟件中,提高系統軟件的可靠性。
(2)優化通訊機制
為避免由于數據通訊擁塞導致的子系統狀態無法顯示故障,需要優化HMI通訊機制,改變了原有系統各牽引單元間定時完整同步故障的方法,采用故障數據響應式更新機制,僅當本單元故障信息發生變化時,才向主控端HMI發送數據,并且對同步發送的數據采用壓縮機制,從而極大地減小了數據通訊負載,降低了發生數據擁塞的可能性。
(3)研制與使用自主化HMI硬件
采用工業級嵌入式計算機,結合嵌入式實時操作系統,研制自主化的HMI硬件,采用工業控制領域的主流以太網控制芯片,從根本上解決了以太網控制器硬件可靠性低導致的故障,同時解決了HMI硬件的質量保證期結束后維修成本高的問題。
3.2 運用建議
(1)強化現場作業人員應急處理能力
動車組網絡控制系統技術先進、邏輯復雜,HMI是網絡控制系統顯示列車狀態、施加控制指令的重要設備,當HMI發生故障時,對相關技術人員的應急處理能力提出了較高的要求。為防止技術人員在現場采取措施不當,延誤故障應急處理,應依據《CRH3C型動車組應急故障處理手冊》,加強對司機、隨車機械師的培訓,并適當安排故障處理演練。
(2)加強HMI軟件維護管理
動車組HMI作為人機交互的接口,當網絡控制系統有邏輯調整、問題修正或新的功能需求時,都會發生對應的軟件更新。有關軟件管理人員應加強顯示屏軟件維護,及時更新軟件版本,降低軟件故障風險。
(3)加強HMI運用情況跟蹤
在實際運用過程中,為保證應急指揮人員能及時準確掌握故障現場信息,地面檢修人員能完整全面了解列車故障數據,應充分利用高速動車組遠程無線傳輸系統[3]加強對顯示屏的運用情況跟蹤;當某列車HMI出現故障時,應舉一反三,分析故障規律,及時制訂解決方案并推廣,避免同類故障再次發生。
通過對CRH3C型動車組HMI慣性故障現象進行統計與原因分析,制定了有針對性的整改措施。同時,在動車組實際運用過程中,動車組設計、運用和檢修部門還需要密切協作,對運用過程中的各類問題進行深入總結和分析,不斷完善整改措施,才能有效地減少故障發生次數,消除慣性故障,提高動車組運用效率。
[1] IEC 61375-1 Train Communication Network Protocol[S].
[2] 程 斐,苗克堅,王瑞敏,等.QNX與VxWorks的特性分析和實時性能測試[J].計算機工程與設計,2008,18:4734-4735.
[3] 黃志平,趙紅衛,朱廣超,等.高速動車組遠程數據傳輸系統的研究與實現[J].鐵道機車車輛,2011,34(1):33-36.
Failure Analysis and Lmprovement Design of Human Machine Lnterface for CRH3C
QIAN Qing1,ZHOU Wen2
(1 Car Department,Guangzhou Raiway(Group)Corporation,Guangzhou 510088 Guangdong,China; 2 Guangshen Raiway Industrial Development Corporation,Guangzhou 510088 Guangdong,China)
The hardware structure,communication mechanism and working principle of Human Machine Interface(HMI),which is installed on EMU CRH3C,is described in this article.The reason of inertia failures during EMU operating are discussed and analyzed,improvement design is also proposed.
EMU;CRH3C;HMI;failure
U260
A
10.3969/j.issn.1008-7842.2015.02.26
1008-7842(2015)02-0107-03
)男,高級工程師(
2015-01-12)