卡斯柯信號有限公司 鄭重虎 張 彬 董高云
本文介紹一種系統化的硬件檢測平臺,應用于排查TSP軌旁安全平臺的硬件功能故障,以解決TSP平臺機柜的出廠檢驗測試鑒定和排除TSP平臺硬件問題需要。本文描述了TSP平臺需要檢測的硬件及其功能,根據檢測功能需求,設計出合理有效的檢查方法,并對這些方法進行系統化架構,構成一種系統級的檢測平臺,并將其劃分為TSP平臺的功能化測試和老化測試兩大部分,如果需要,可以精簡到單板級測試。該檢測平臺已應用于TSP平臺機柜出廠檢測和自查TSP平臺硬件功能故障,事實證明該檢測平臺可有效、準確定位出未知的硬件問題,防止將隱藏的硬件問題帶到現場應用。
TSP軌旁安全平臺是卡斯柯信號有限公司研發的全自主化軌旁安全計算機平臺,該平臺已產品化應用于區域控制(ZC)、線路控制(LC)和通信服務器(CCS)等地鐵和鐵路的信號系統中,這些軌旁上層應用系統通過平臺提供的接口,實現與外部設備通信,依靠平臺的2乘2取2系統架構、熱備冗余和BIT自檢等重要功能,保證整個信號系統的安全等級達到SIL4級要求。
TSP平臺應用越來越多,其系統硬件架構復雜,若應用于現場開通運營和實驗室開發測試,需事先保證整套機柜的硬件設備功能具備條件,這種要求下,不可能依靠人工去一個個檢查測試每個硬件設備,所以需要設計出一套系統化的測試軟件,達到高效準確的測試出機柜上重要設備的功能具備發往現場和實驗室使用的條件。研發TSP硬件功能測試平臺的目的是為TSP平臺機柜出廠功能測試、設備進貨檢驗、設備維護與硬件故障排查,以及為TSP平臺老化測試提供可用的測試軟件,將TSP平臺做成產品化。TSP硬件功能測試平臺不僅能測試系統部件級功能和系統老化功能,還可以精簡到測試單板級功能,其中,系統老化測試的時間至少得兩天。
TSP硬件功能測試平臺的實現目標是提供一種功能齊全、性能穩定、靈活方便和自動化的測試平臺,具體如下:
(1)功能齊全方面,測試TSP平臺所包含硬件的內部功能和外部功能是否正常,其中,硬件包括MCU前后板、MPU前后板、VPS前后板、串口通信板、維護臺SDMS、切換單元STBY、網關GGW、風扇設備、電源模塊等。
①硬件的內部功能主要是MCU前后板和MPU前后板所包含硬件的自身功能,不需要與外部硬件進行功能交互,MCU模塊包括內存檢測、計數器、FLASH、安全時鐘、LED顯示;MPU模塊包括內存檢測、計數器、FLASH、溫度、電壓。
②硬件的外部功能主要包括設備間的串口通信和網口通信,及其它需要與外部硬件進行交互的功能。
(2)性能穩定方面,大量測試數據包通過網絡或者串口發送和接收不出現丟包、錯誤包現象,數據包有兩種,一種是板級之間的測試數據包,另一種是執行單元測試結果通過網絡向控制單元發送的數據包。
(3)靈活方便方面,測試者根據測試需要,選擇想要測試的模塊,可以是一種硬件設備,也可以是若干種硬件設備組合,或者是設備上的某些特定功能。
(4)自動化方面,測試一旦開始,不需要人為干預,測試完成后自動生成測試報告,測試者通過該報告知道測試結果,成功或者失敗。如果測試失敗,測試者也可通過該報告知道功能測試失敗之處。
測試平臺的系統結構如圖1所示,該系統由外部電腦、測試交換機和TSP平臺三大部分組成,其中,外部電腦上運行測試軟件的界面終端,通過一根RJ45網線連接在交換機上,與TSP平臺相互通信。
整個測試系統設計分為控制單元和執行單元兩部分,控制單元相當于測試監控中心,通過操作界面上的控制按鈕實現相應的測試操作,由執行單元完成。圖1中,外部電腦設計為控制單元,TSP平臺設計為執行單元。

圖1 TSP硬件功能測試平臺系統結構圖
控制單元設計著重使用方便,功能齊全,能夠及時接收顯示測試結果,測試結束后生成測試報告,并且界面上按鈕的圖示含義應直觀明了。根據測試功能的需要,界面上控制按鈕的設計包括“開始握手”、“停止握手”、“開始測試”、“停止測試”、“查詢”、“重啟”和“測試設置”等,如圖2所示。執行單元在測試執行過程中將測試結果報告給控制單元,報告方式分為實時報告和匯總報告兩種,控制單元根據與執行單元事先約定好的通信協議數據格式,對報告內容在后臺進行篩選過濾,對測試不合格的單項進行紅色警告標記,最后生成測試報告,表明測試成功或者測試失敗,并自動保存在本地設定的路徑下。

圖2 控制單元設計圖

圖3 TSP硬件功能測試平臺測試流程圖
執行單元為測試的設備對象,主要依據TSP平臺的系統組成,由多個子系統組成,設計所包含的內容比控制單元多,也較復雜,主要包括:
(1)測試硬件環境,除滿足TSP平臺本身的系統架構外,還需滿足控制單元和執行單元之間的通信環境,如圖1所示。
(2)測試程序和配置文件的存放、讀取和更新方式用起來方便高效,主要是MPU、MCU、維護臺SDMS和網關GGW這四部分。
①MPU的測試程序和配置文件存儲在專用優盤中,優盤插在MPU板卡的USB接口上,優盤的內容可通過PC機直接拷貝或者刪除。
②MCU的測試程序和配置文件存儲在專用小扣板中,小扣板安裝到MCU板卡上,可插拔使用,小扣板的內容可通過燒錄工具拷貝或者刪除。
③維護臺SDMS可通過操作系統界面人工直接操作將測試程序安裝到指定目錄中,將配置文件拷貝到指定目錄中。
④網關GGW可通過專用優盤插入設備專用的USB接口上,將測試程序和配置文件更新到指定目錄中,GGW設備LED屏上顯示“更新完成”后拔出優盤,燒錄完成。
其中,配置文件中包括:各子系統之間網口通信測試IP,和與控制單元通信使用的IP;包括串口通信測試相關的端口對接設置。另外,硬件內部功能的測試無需進行相關配置。
(3)對風扇設備的測試基于HTTP協議,設計一套適用的WEB文件,設置風扇工作的用戶名和IP地址,通過調試線將風扇工作所需的WEB文件上傳到風扇存儲單元中。
(4)系統功能測試設計在一定時間內完成,根據測試內容評估,設計為500秒。
(5)為加快測試進度,測試通信容量大的對象設計在不同測試任務內完成,如串口測試任務和網口測試任務;能夠很快完成測試的對象可直接串行測試。

圖4 TSP硬件功能測試平臺測試報告圖
(6)系統運行老化測試時,下位機測試軟件模擬現場使用應用軟件的運行流程,現場實際用到的所有功能都應被測試到。
(7)設計帶有定位到板級或部件級的故障追蹤功能。
(8)測試結果數據量較大,采用及時上傳和非及時輪轉上傳方式給控制單元顯示,根據測試數據量大小,硬件內部功能測試結果設計采用及時上傳方式;硬件外部功能測試結果設計采用非及時輪轉上傳方式,每隔一段時間上傳幾百包數據,保證執行單元發送不丟包和控制單元接收不丟包。
整個測試為上電自啟動環境,即整個機柜上電,執行單元的測試程序各自完成初始化,監聽控制單元發送的測試指令,執行單元接收到指令后開始執行相應的測試過程,系統功能測試或者系統老化測試,其中,系統老化測試的執行是通過MCU、MPU、SDMS和GGW測試程序加載TSP平臺中各CPU的目標文件和配置文件而實現的。正常測試過程是先進行系統功能測試,確保TSP平臺硬件沒問題后,再進行系統老化測試。
根據第2章節測試平臺的架構設計和TSP平臺系統組成,整個測試平臺的測試實現過程如圖3流程圖。測試之前準備好測試環境,機柜中各子系統鏡像及相應的測試配套應用程序應在測試前分別安裝到各子系統的指定加載區。每次斷電重啟系統,控制單元可不重啟,執行單元需要重啟,重啟完成后需要重新握手才能再測試,待測部件握手成功后進行設置,設置成功后方可開始相應測試。測試結束前,控制單元統計接收到的測試結果數據,生成測試報告,告知用戶本次測試是PASS(如圖4(a))還是FAIL(如圖4(b)),如果是FAIL,報告中顯示對應板卡的測試不通過。其中,圖4(a)和圖4(b)中“部件功能測試”即為“系統功能測試”。
每次關閉測試平臺時,記住檢查是否將所有測試都停止,若沒有停止,很可能在下次打開時再次開始同一次測試,這樣會造成該測試不能正常停止,如果造成這樣的情況可通過測試平臺的重啟功能恢復,或者通過斷電測試機籠的方法硬重啟測試系統。如果測試過程中,因為誤操作造成不可控情況,可嘗試重啟硬件環境和測試平臺,重新開始測試。
結論:TSP硬件功能測試平臺不管是控制單元設計,還是執行單元設計,包含的內容層次都比較清晰,易懂易操作,用戶容易接受使用。實際應用中,測試平臺有效檢測出了TSP平臺硬件在出廠時的各種不符合項,防止了現場應用中硬件隱患的發生,從而保證TSP平臺在現場穩定運營,如北京房山地鐵線TSP機柜SDMS網口新老驅動問題,無需人工審核,通過TSP機柜出廠測試確保SDMS網口安裝的是新驅動,老驅動網絡接收數據效率相對來說較低,甚至有時出現丟包現象;實驗室調試測試過程中,對遇到問題懷疑是TSP平臺某方面硬件引起時,可通過測試平臺進行單板級測試排查,提高解決問題的效率。因系統功能測試的內容較多,一輪測試下來時間較長,測試執行效率有待進一步提高,下一步可通過改進測試策略和測試任務邏輯,進一步找到有待優化提高的空間。