金道源 趙熠 鄺安玄







摘要: 在機電系統中,接口單元模塊承擔著信號采集、傳輸、控制等復雜任務,導致該模塊內部外部接口眾多、軟件規模大、信號種類多樣,故設備運行時故障產生的原因不可預測,發生故障后,對故障的定位與排查也非常不便。本文以搭載TI公司高性能DSP芯片的接口單元為例,闡述了接口單元模塊管理軟件的統一故障管理方式,包括故障數據記錄、故障解析工具設計、文件生成。大大方便了設備以及系統故障的定位與排查,極大降低了設備排障與后期維護的成本。
關鍵詞:故障記錄與解析;NVRAM;DSP
一、系統概述
在復雜機電系統中,接口單元模塊承擔著機電管理任務的執行,需要為系統提供各類接口,如模擬量輸入輸出、離散量輸入輸出、總線接口等,且需要在系統中的不同位置實現不同配置,完成系統的狀態信息采集與上傳,響應上位機輸出控制指令完成對子系統的控制與維護,同時為系統健康管理提供BIT(自測試)信息支持,針對以上特點,接口單元核心處理芯片采用TI公司的高性能DSP芯片。
駐留在其上接口單元管理軟件作為整個接口單元模塊行為的控制核心,為硬件提供資源的配置、檢測、管理與控制功能,與模塊硬件共同完成接口單元任務的執行,相應的,該管理軟件的需求復雜、軟件規模大,所以管理軟件分為三層結構,分別為應用軟件層、協議解析層和驅動程序層,如圖1所示。
接口單元實施并參與系統的功能控制管理、信息管理和健康管理有關的信號采集、信息傳輸、輸出控制和BIT檢測等任務,與系統各設備之間相互交聯、物理、邏輯接口復雜、信號種類繁多,故設備正常運行時,發生故障的時機不定、類型不定、數量不定、位置不定,所以作為接口單元管理軟件的一部分,故障管理功能同軟件三層結構均有交聯關系,如圖1所示,為了故障排查與后期維護的便利,統一的故障記錄與直觀的故障解析十分必要。
二、故障記錄
故障統一管理的目的是故障排查與后期維護的便利,首先需要針對模塊運行中可能出現的不同類型、不同位置、不同發生時機的故障進行格式統一的記錄。
(一)故障類型
故障類型主要分為上電BIT(PuBIT)故障及周期BIT(PBIT)故障,其中上電BIT在模塊上電時對自身控制器相關硬件、供電及部分接口以及周期任務中不能檢測的電路進行快速檢測,以確認是否可以進行最基本的正常控制工作。如果上電檢測出接口故障,置相應故障狀態,向接口本次上電故障記錄NVRAM地址寫入故障值,直到重新上電后再次上電BIT檢測可被新的檢測結果覆蓋。測試接口包括看門狗測試、模擬量輸出接口測試、離散量采集接口測試、電源測試、RS422測試、RAM測試、FLASH測試、NVRAM讀寫測試、FPGA握手測試等。
周期BIT是設備正常周期工作中,在對接口進行控制的同時,以不干擾正常工作的方式,對設備各工作接口的工作狀態進行周期性檢測。如果周期BIT測試接口的故障值有效,則向接口周期故障記錄NVRAM地址寫入故障值。測試接口包括模擬量采集接口測試、離散量采集接口測試、溫度測試、離散量輸出接口測試、供電測試、配置信號測試等。
(二)故障數據記錄
由于故障的不確定性,需要及時將故障發生瞬間的時間、故障現場等相關數據記錄在不易丟失的存儲單元中,以便事后故障分析。NVRAM(Non-Volatile Ram),非易失性隨機訪問儲存器,斷電后仍能保持數據,由于故障的多樣性、不確定性、偶然性,用該儲存器作為故障記錄的介質最為合適。
將NVRAM作為擴展存儲空間外掛至DSP芯片外部儲存的外擴區域,用以儲存故障相關信息,如圖2所示。
為了區分故障種類,便于后續故障解析,預先在NVRAM中定義各類故障區域,當故障發生時,故障可快速寫入到對應的故障記錄內。NVRAM故障記錄包含兩個部分,第一部分為公共部分信息記錄,主要涉及本次上電后整機的全局信息,包含上電測試,各類信號等,這部分內容記錄在NVRAM的最前端;第二部分為各個故障的記錄,包括上電BIT、周期BIT等故障數據信息,依次進行記錄。在進行故障記錄時,為降低開發難度、提升軟件復用性、便于故障解析,將不同類型的故障數據以及相關故障現場數據以相同的數據格式記錄在NVRAM中,首先列出接口單元運行周期中可能出現的所有故障,針對每種故障整理引起該故障的數據或受該故障影響的數據作為故障現場數據。為每個故障在對應類型故障空間中分配地址,故障數據以32字節為記錄單位記錄,記錄內容包括故障發生時間,產品上電次數,故障接口、故障通道號、故障類型、故障發生次數,以及故障現場相關數據,故障數據記錄格式整理如表1所示。
故障數據記錄的流程如下圖3所示。
模塊上電后,首先在設備初始化中對設備上電總時間、上電次數等公共信息進行記錄,其次進行上電BIT檢測并對故障接口進行記錄,最后周期任務中進行周期BIT檢測,并對故障接口進行記錄。
三、故障解析
故障記錄完成之后,需要將NVRAM中記錄的信息進行解析輸出,所以將NVRAM中故障數據下載至本地,并設計分析工具對下載的故障數據進行解析,最后形成故障分析報告文件。
(一)NVRAM數據下載
記錄故障數據的NVRAM掛載在DSP芯片外擴區域之上,故使用芯片提供的串行通信接口(SCI)外設模塊對NVRAM數據進行讀取,通過串口通信傳輸至本地PC,本地應用串口助手接收并捕獲NVRAM下載數據。
(二) NVRAM數據解析
設計NVRAM數據解析工具,對下載的NVRAM故障信息在本地進行解析并形成故障分析報告,解析流程如圖4所示。
將下載至本地PC的數據文件導入解析工具,找到數據起始位置并解析公共信息部分;然后依據故障類型對故障進行區分,依據地址信息對故障定位,依據該故障對故障現場數據的定義解析相關現場數據;解析完成后選擇是否形成解析文件。
(三)解析工具
解析工具使用Microsoft Visual Studio2010開發環境,設計簡單應用界面,實現NVRAM數據文件的導入、解析,解析報告文件的生成。該工具使用MFC開發,集成了接口單元產品型號的選擇,NVRAM數據文件的導入與校驗,NVRAM數據文件解析,部分重要信息與故障的顯示,NVRAM數據解析結果報告的生成。
四、試驗驗證
故障記錄、解析工具設計完成后,進行試驗驗證。通過人工強制在軟件內置故,且使用預先定義好的故障現場進行測試,將記錄數據使用工具解析并導出,若導出結果和與置故現場數據一致,則故障記錄與解析功能正確。
(一)測試環境
在應用軟件中對某些接口進行插樁置故,并設置故障現場數據,將測試軟件固化至接口單元,運行穩定后下載NVRAM數據,導入解析工具中,對NVRAM數據進行解析。在試驗中,使用測試設備對產品進行供電與總線數據通信,測試PC與產品用串口線相連。將置故測試軟件通過串口固化至目標機,上電穩定運行,下電后對目標機模式配置信號進行切換,切換至信息下載模式;PC端打開串口助手,目標機重新上電,應用串口助手捕獲NVRAM下載數據至本地,下載原始數據捕獲;最后依據NVRAM數據解析流程,進行故障解析以及生成故障分析結果。
(二)解析結果
使用工具導入下載NVRAM數據文件,點擊解析,數據結果如圖5所示。
查看故障后,點擊導出將故障信息導出文本,如圖6所示。圖中最上方顯示上電后設備公共信息及重要故障,后方為其他故障信息,包含故障類型、通道、上電次數、故障次數以及故障現場數據。經對比,工具解析結果和報告呈現結果與測試軟件設置的故障完全一致,可以認為故障解析與故障記錄功能正確。
五、結束語
經過上文對不同故障統一的故障記錄以及解析方式,后期維護時,開發維護人員可以很直觀地看到發生故障的接口,故障發生時間,以及發生故障時與該接口相關的現場數據,極大方便了接口單元及系統故障排除以及維護。
作者單位:金道源? ? 趙熠? ? 鄺安玄? ? 航空工業西安航空計算技術研究所
參? 考? 文? 獻
[1] 李寶龍, 陳雪巖. DSP外擴FLASH接口技術實現[J]. 哈爾濱商業大學學報. 2016(03).
[2] 張楠, 張達億. 基于DSP與NAND Flash的大容量存儲器設計[J].工業控制計算機,2018(01).
[3] 郭警濤, 郭建奇. 機載機電管理系統數據下載與分析設備設計[J].信息通信, 2016(10).
[4] 胡寶雷, 韓毅博. 多功能控制面板的設計與實現[J].電腦編程技巧與維護,2019(05).
[5] 劉宗福. 片上FLASH存儲器接口的設計[J]. 電子世界, 2016(03).