張振剛



摘 ?要: MIL?1394B總線在國內外航空電子系統中應用越來越廣泛,而MIL?1394B總線采用菊花鏈的物理層,單個節點的復位故障會導致整個網絡的復位擴散,使整個網絡不能正常通信。針對MIL?1394B總線在綜合化航空電子設備的應用中故障難以隔離,提出一種通過先驗信息隔離故障的方法。首先分析復位故障的原理,從而結合MIL?1394B總線在航空電子系統中預先分配節點號的先驗信息,獲取、分析AS643總線的SELF?ID包建立鏈接的信用值機制,設計一種檢測信用值的方法,并改造節點的硬件設計,使節點鏈接的信用值低于閾值后可關閉錯誤鏈接,從而實現MIL?1394B的網絡故障檢測和隔離。該設計方法和機制通過實物系統進行驗證,可用于高度綜合化的航空電子系統中。
關鍵詞: MIL?1394B總線; 航空電子系統; 錯誤檢測; 故障隔離; 總線網絡; 復位擴散
中圖分類號: TN915.04?34; TP336 ? ? ? ? ? ? ? ? ? ?文獻標識碼: A ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2019)13?0015?04
Research and implementation of MIL?1394B bus fault isolation method
ZHANG Zhengang
(Southwest China Institute of Electronic Technology, Chengdu 610056, China)
Abstract: MIL?1394B bus is widely used in avionics system at home and abroad, but it adopts physical connecting mode of chrysanthemum chain, whose reset fault of a single node will lead to the reset diffusion of the whole network and the communication abnormality of whole network. Since the fault of MIL?1394B bus is difficult to isolate in integrated avionics device, a fault isolation method using prior information is proposed. The principle of reset fault is analyzed, and then the prior information of node number in avionics system is pre?assigned in combination with MIL?1394B bus to acquire and analyze SELF?ID packet of AS643 bus, and establish the mechanism of link credit value. A method of detecting credit value is designed, and the hardware design of node is reformed to close the error link while the credit value is lower than the threshold, which can realize the fault detection and isolation of MIL?1394B network. The designed method and mechanism were verified by a physical system, and can be used in highly?integrated avionics system.
Keywords: MIL?1394B bus; avionics system; fault detect; fault isolation; bus network; reset diffusion
0 ?引 ?言
航空電子系統已經從傳統的聯合式架構逐步演進到先進的綜合化架構、高度綜合化架構。隨著綜合化程度不斷提高以及機載傳感器技術的發展,航空電子系統對作為系統關鍵技術之一的機載總線網絡也提出了新的要求,早期的MIL?STD?1553B,ARINC429等總線技術已經無法完全滿足高帶寬、低延遲和高確定性的應用需求。很多新型商用總線在做了一定修改和限定后開始被應用到軍用航空電子系統,如美軍在F35的航空電子中采用一種基于1394總線改進形成MIL?1394B總線。MIL?1394B總線網絡在1394總線的基礎上增加了應用限定和改進,保留了1394總線即插即用、傳輸帶寬高等特點,又增加了時間確定性等特點,使其更適用于軍用航空領域[1]。
國內也展開了MIL?1394B總線技術在航空電子系統中的研究和應用,并給出幾種節點設計的解決方案和網絡實現方式[2?4]。然而,MIL?1394B總線采用菊花鏈的物理連接方式,節點和鏈路傳輸的不穩定性將會影響整個網絡的傳輸過程,甚至導致機載設備的部分功能失效,文獻[5]提出增加網絡互聯復雜度,文獻[3]提出完全備份網絡的多余度網絡設計來解決高航空航天電子系統中高可靠性的需求。而隨著綜合航空電子技術的發展,以高度綜合化通信導航識別系統[6]為例,系統要求更小的體積、重量來實現原有的功能,并且不能降低可靠性。因此完全備份的方法已經不能滿足此類設備的需求。
本文采用獲取1394總線原生的SELFID報文以及網絡物理連接的先驗信息,通過軟件自動探測、隔離不穩定的節點及鏈路,使網絡中未失效的處理通道正常運行,最大化地提高設備的利用率,在保證可靠性的前提下,提升綜合化后的重量、體積等性能。
1 ?MIL?1394B總線特點
1.1 ?物理鏈路冗余
在IEEE?1394B?2002總線標準中,允許總線網絡中存在物理環路冗余。在MIL?1394B協議標準中利用該特性實現了第一級物理鏈路冗余,很多系統中利用該特性實現網絡冗余。
1.2 ?網絡集中運行控制管理
在MIL?1394B網絡協議中,網絡上的節點分為中央控制節點(CC node)和遠程節點。中央控制節點負責下發時間基準,維護整個網絡的時隙同步。遠程節點接收中央控制節點的時間信息,并按照分配好的時隙發送和接收消息,通過這種機制提高通信的時間確定性。在機載設備中,通常將中央控制節點作為網絡管理單元。
1.3 ?確定性的通道地址
MIL?1394B總線上的節點在初始化過程中實現通道號分配,總線網絡上的每個參與通信的節點通過分配通道號完成地址識別,實現通信傳輸。不同于1394B網絡依靠自標識完成各個節點的識別,不同的識別過程各個節點的ID號存在不一致的可能性,而在航空電子系統中由于確定性的需求,MIL?1394B總線建立時同一節點的通道號是預先分配的,不會動態變化。默認中央控制節點的通道號為0通道。
1.4 ?自標識報文機制
總線上所有節點的物理層都會向網絡上發送自標識報文SELFID,各個節點根據自標識報文的內容以及上報自標識包的順序完成物理連接關系的識別,并建立樹狀拓撲結構。
2 ?故障隔離原理和方案
2.1 ?總線故障現象
由于MIL?1394B總線采用IEEE?1394B?2002總線的物理層,在新的總線節點接入時,通過向總線上發送BUS_RESET,使總線上的所有節點進入總線初始化過程,初始化完成后進入樹標識過程,樹標識過程完成后總線的初始化工作結束,才能進行正常通信。該特性也導致總線上的各個節點如果不斷產生復位,將會影響整個網絡的正常通信。
如圖1所示,當整個網絡中存在一個故障節點,且該節點的故障現象是不穩定的連接,將使整個網絡處于反復的初始化過程,導致整個網絡的通信受到影響。同時,由于整個網絡的時間同步源也受到影響,整個網絡的時間基準將會不斷重復建立和發布,MIL?1394B基于時間的確定性也會受到影響。為了區別一般可恢復的復位,定義這種復位形式為錯誤復位,顯然這種復位對總線網絡是有害的。

2.2 ?故障檢測、隔離方法
2.2.1 ?錯誤復位故障檢測、隔離原理
節點的大部分故障可以通過報文傳遞過程和報文內容進行隔離[7],然而不穩定的連接和節點的反復復位引進的故障失效,通過MIL?1394B網絡協議本身[8]和一般的狀態自檢信息無法檢測和隔離。但根據實際工程經驗和節點的失效模型,為了解決此類問題,可以利用MIL?1394B總線網絡物理連接具有先驗信息的特點。而現有的MIL?1394B軟硬件實現[2?4]通常無法實現錯誤復位故障的檢測與隔離,通過對節點的軟硬件設計和網管程序的改進可以實現。引入總線節點和連接的復位信用模式,判斷復位是正常復位或者是非正常復位,對總線網絡采取不同的處理方式,完成錯誤復位故障的檢測、隔離。
2.2.2 ?故障隔離硬件設計
如圖2所示,在改進后的網絡實現中,不同于一般MIL?1394B的FPGA設計,RN節點和CC節點的邏輯設計不但要完成MIL?1394B協議解析,還增加了端口信用管理組件,每個節點都可以通過CC分發的配置信息記錄各自節點的端口信用度,并通過硬件設計的端口控制線實現端口的開/閉。在端口信用管理組件發現節點失效后也可以完成對物理層芯片的關閉。在物理層芯片關閉后該節點不會重新入網。

2.2.3 ?基于CC節點的故障隔離軟件設計
CC節點的網絡管理程序組成如圖3所示。

網絡管理程序各組成部分中,與本文的研究內容相關的主要有邏輯拓撲生成組件、邏輯樹拓撲登記庫組件、信用管理組件及物理拓撲控制組件。邏輯拓撲生成組件:根據系統中的網絡連接信息生成可能的所有拓撲;邏輯樹拓撲登記庫組件:將邏輯拓撲生成組件中的邏輯樹形成登記并建庫;信用管理組件:計算并記錄各個邏輯拓撲的信用;物理拓撲控制組件:根據邏輯拓撲的信用值釋放和關閉各物理鏈路。
2.2.4 ?故障隔離工作機制
CC節點根據建立的物理連接關系以及通道號的預先配置特性,完成所有可能實現的邏輯拓撲登記,記為logicTree{[n]},其中,[n]的取值范圍為1到所有可能的最大數。logicTree中記錄了包括樹狀結構下當前邏輯連接對應的節點間建立的物理端口連接,例如link.cc2R1=cc.a_R1.B,并記錄了當前物理連接的信用值link.cc2R1.credit。
網絡啟動運行后,如出現錯誤復位故障的節點,導致總線復位次數過多,超過設置的閾值,關閉可復用的端口,形成唯一的logicTree,如果故障復位依然存在,CC節點上的網絡管理程序開始記錄每一次復位后的SELFID值以及SELFID上報的順序,根據logicTree的記錄判斷出每次復位節點的當前網絡復位完成后的物理端口連接關系。由于不穩定節點的連接在不同的復位后存在不能持續出現的現象,一旦某次復位初始化完成后,某個節點的連接未上線,就會被網絡管理程序減少記錄連接的信用值。隨著不穩定的復位反復出現,不穩定的連接信用值不斷降低,當該條連接的信用值降低到設計的規定值后,該條連接對應的物理端口將會被網絡管理程序中的信用管理組件通知端口信用邏輯組件進行關閉。關閉信用值較低的連接后,總線網絡開始在所有的可用物理連接上實現節點的通信,保證正常節點的通信。
3 ?測試與驗證
測試主要驗證發現、隔離錯誤復位故障的能力和整個過程的時間,依靠搭建原型驗證系統,并在節點中通過向邏輯代碼發送復位指令摸擬注入錯誤復位故障。
圖4的測試驗證環境由兩個RN節點及其嵌入式主機、一個CC節點及其嵌入式主機和MIL?1394B總線分析儀組成??偩€分析儀可向主機上報統計總線上的復位數據和顯示拓撲信息。除和總線分析儀的連接外,驗證系統存在3條總線連接,分別為link.cc2R1,link.cc2R2,link.R12R2。link.cc2R1,link.cc2R2構建的是網絡邏輯拓撲logicTree1;link.cc2R1,link.R12R2構建的是網絡邏輯拓撲logicTree2;link.cc2R2,link.R12R2構建的是網絡邏輯拓撲logicTree3。為了測試方法的有效性,在link.cc2R2的連接上不斷注入錯誤復位故障。各連接的信用初值設為11,設置總線閾值為10。

復位故障檢測數據如表1所示。從表1中的數據可以看出,當注入復位故障次數超過一定的數值后,故障連接的信用降低為0,驗證系統將關閉存在故障連接的邏輯樹注冊,僅支持唯一的無故障連接logicTree2,整個網絡不再重復復位,可以進行正常通信。

4 ?結 ?論
針對現有的MIL?1394B總線拓撲識別機制主要是基于1394包的拓撲識別,雖然能夠在一定程度上解決系統設計和驗證工作,但并沒有充分利用MIL?1394B總線的信息,使系統在應用此總線時存在難以識別具體故障節點的問題。本文提出的設計方法通過分析MIL?1394B協議的本身特性以及1394報文的原有信息,可確定上報各節點的邏輯連接關系并能自動檢測非穩定故障節點,完成隔離故障節點并據此實現系統的重構。在某型綜合化通信航空識別系統中應用穩定,支持了該系統的綜合化實現。同時,該技術可應用于系統在線測試過程中,實現系統總線網絡的自檢等功能。
參考文獻
[1] IEEE Computer Society. IEEE?1394B interface requirements for military and aerospace vehicle applications SAE aerospace standard 5643 [S]. US: IEEE Computer Society, 2004.
[2] 趙彬,田澤,楊峰,等.基于AS5643協議的接口模塊設計與實現[J].計算機技術與發展,2013,23(8):100?102.
ZHAO Bin, TIAN Ze, YANG Feng, et al. Design and implementation of MIL?1394 module based on AS5643 protocol [J]. Computer technology and development, 2013, 23(8): 100?102.
[3] 趙彬,易寧寧,鄭斐,等.航電1394總線節點設計實現[J].電子技術應用,2016,42(6):13?16.
ZHAO Bin, YI Ningning, ZHENG Fei, et al. Design and implementation of avionics 1394 node [J]. Application of electronic technique, 2016, 42(6): 13?16.
[4] 馬寧,王宣明,鄭斐.飛機管理系統1394總線AS5643協議的設計與實現[J].航空計算技術,2013,43(6):122?124.
MA Ning, WANG Xuanming, ZHENG Fei. Design and implementation of vehicle management system 1394 bus AS5643 protocol [J]. Aeronautical computing technique, 2013, 43(6): 122?124.
[5] 周慶瑞,孫輝先.IEEE1394網絡拓撲結構的可靠性研究[J].宇航學報,2008,29(4):1403?1408.
ZHOU Qingrui, SUN Huixian. Research on reliability of physical topology for IEEE 1394 [J]. Journal of astronautics, 2008, 29(4): 1403?1408.
[6] 何志強.綜合化航空電子系統發展歷程及重要支撐技術[J].電訊技術,2004,44(4):1?5.
HE Zhiqiang. Development and important supporting technology of integrated avionics system [J]. Telecommunication engineering, 2004, 44(4): 1?5.
[7] 朱良,杜承烈.通用航空總線測試與分析軟件的設計和實現[J].微電子學與計算機,2007,24(7):125?127.
ZHU Liang, DU Chenglie. Design and realization of universal avionics bus testing and analysis software [J]. Microelectrnics & computer, 2007, 24(7): 125?127.
[8] BAI Haowei. Analysis of a SAE MIL?1394B based high speed avionics network architecture for space and defense applications [C]// 2007 IEEE Aerospace Conference. Big Sky: IEEE, 2007: 1344?1352.
[9] 辛永利,田澤,楊峰.機載UMS 系統二余度1394B總線網絡設計[J].計算機技術與發展,2015,25(3):197?201.
XIN Yongli, TIAN Ze, YANG Feng. Design of dual?redundancy 1394B bus network for airborne UMS [J]. Computer technology and development, 2015, 25(3): 197?201.