李健 趙琳
摘要: 隨著航空電子技術的發展及軟硬件技術的進步,飛機對航空電子系統的要求隨之不斷提高。而航空電子系統的架構也由聯合式航空電子系統發展為綜合化模塊化的航空電子系統及分布式綜合化模塊化的航空電子系統。而通信系統是航空電子系統中不可缺少的一部分,各計算資源之間的數據傳遞和數據共享都是由通信系統來完成。因此通信系統的性能直接影響到了航空電子系統的性能。FC網絡具備傳輸速率高、傳輸距離遠、誤碼率低、實時性強、可擴展性好等優點,滿足航空電子系統對網絡的需求。為了提升系統的診斷能力與容錯能力,提出了一種FC網絡的健康管理方法,對整個FC網絡中的終端節點和交換機的健康狀態進行維護管理。
關鍵詞:FC(光纖通道);容錯;故障診斷
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2019)09-0033-02
1 引言
目前的航空電子系統架構,正在朝著稱作為綜合化航空電子系統和分布式綜合化航空電子系統發展。在這種航空電子系統架構中,多使用高性能的計算平臺。該平臺以模塊化的設備搭建,以網絡為通信基礎實現全互聯結構。該平臺具有靈活性高及交互操作性強的特點。交互性允許計算資源的共享,計算數據的交互則是通過網絡來傳遞。
隨著航空電子系統復雜性不斷提高,適用于傳統聯合式航空電子系統的網絡已經不能適應新的需求。高性能計算平臺需要一個靈活、容錯和高速的通信系統來支持模塊間通信,而FC網絡滿足其需求。航空電子系統的發展及提供功能的增加,必然會加重網絡的負擔。網絡的規模會越來越大,網絡配置也會越發復雜,所以管理整個網絡的運行狀態和健康狀態就顯得尤為重要。
2 研制背景
在綜合化模塊化的航空電子系統和分布式綜合化模塊化的航空電子系統中,FC網絡的拓撲結構多以交換網絡拓撲結構為主。網絡結構是以FC網絡交換機為核心,各個FC節點連接至FC網絡交換機。在整個網絡通信過程中,FC網絡交換機對于FC節點來說是透明的。在FC網絡的使用過程中,目前缺乏一個快速獲取且集中處理故障的健康管理機制,導致有時在事后分析FC網絡出現的問題時缺乏支撐數據,給排故帶來較大困難。
3 系統設計
上圖所示的是一個雙余度、交換機式網絡拓撲的FC網絡系統。該系統中包含兩塊FC網絡交換機,多個FC網絡終端,一個故障管理模塊和一個FC網絡監控設備。其中FC網絡終端的個數一般根據系統應用功能需求分配而決定,也受FC網絡交換機端口數目的限制。該FC網絡為一個雙余度的FC網絡,每個FC網絡終端都有兩個FC通道,分別連接至兩個交換機的同一個普通端口(例如兩個FC端口分別連接至交換機1和交換機2的12端口)。FC網絡監控設備同樣具備兩個FC端口,分別連接至兩個交換機的同一個監控端口上。
交換機1和交換機2有一個端口連接在一起,用來進行信息交互。
3.1 FC網絡交換機
該系統中有2個FC網絡交換機,主要負責FC網絡中數據的轉發功能。FC網絡交換機支持單播,組播和廣播功能。其中故障管理模塊作為一個普通的FC網絡終端連接至交換機的普通端口上。FC網絡交換機具備FC監控端口,用來監控FC網絡上的通信數據。
其中FC網絡交換機的組播功能和監控功能需要預先配置。配置完成后如果有組播消息,則交換機會通過查詢預先配置組播表而確定組播消息的成員后,給各個成員一起轉發消息。當FC網絡中有數據通信時,FC網絡交換機會通過查詢預先配置的監控表來確認哪些消息是需要監控的,然后會將需要監控的FC消息通過監控端口轉發出去。
3.2 FC網絡終端
在FC網絡中,FC網絡終端作為網絡的普通節點。承載了整個系統分配的應用功能任務。FC網絡終端包含了計算、控制和網絡接口功能。FC網絡終端的計算和控制(應用功能的運行)功能由CPU單元來執行。FC網絡接口功能由FC接口單元來執行。
其中FC網絡接口由CPU單元進行控制,包括FC網絡接口的初始化,狀態管理,數據收發控制等。
3.3 故障管理模塊
在FC網絡中故障管理模塊主要功能為故障的記錄功能,記錄故障后為后續的故障排查和分析提供依據。故障管理模塊包含了CPU單元和FC網絡接口單元。FC網絡接口由CPU單元進行控制,包括FC網絡接口的初始化,狀態管理,數據收發控制等。
3.4 FC網絡監控設備
在FC網絡中,FC網絡監控設備連接至FC網絡交換機的監控端口,負責FC網絡通信數據的記錄功能,即將交換機監控端口轉發過來的數據保存到本地,為后續數據分析提供支撐。
FC網絡監控設備包含CPU單元及FC網絡監控單元,其中CPU單元功能與FC網絡終端中的CPU功能一致。FC網絡監控單元主要完成FC網絡監控數據的記錄功能。
3.5 健康管理
整個FC網絡的健康管理以FC網絡交換機為核心,交換機進行統一收集FC網絡健康狀態并進行處理,處理完成后會將故障整合并發給故障管理模塊進行記錄保存或顯示。其中重要的故障也會保存在本地的NVRAM中。其中具體的管理方法如下:
(1)FC網絡交換機可以實時檢測到各個端口的狀態機變化(上/下線狀態變化),交換機會將整個網絡的上下線信息及變化的時間保存在本地;如果判斷到交換機邏輯異常或者故障管理模塊異常則將保存的狀態存儲到NVRAM中。每個交換機獲取到FC網絡的上/下狀態后,兩個交換機進行信息交互,綜合判斷某個節點單通道故障還是整個鏈路故障,并保存故障類型;
(2)交換機的邏輯會產生心跳信息由CPU進行判斷處理,如果心跳異常則CPU會將該故障及發生時間保存到本地的NVRAM中。兩個交換機會通過連接的端口互相發送心跳信息,如果某個交換機故障,則另外一個交換機會采到故障狀態并保存故障類型;
(3)交換機會周期廣播各網絡終端(包含FC監控設備)的狀態獲取命令,各網絡終端收到后會提交給CPU,然后由CPU處理完成后給交換機返回狀態。交換機會判斷各FC網絡終端健康狀態,以及接收到的網絡終端的狀態信息,經過兩個交換機信息綜合后保存故障類型;
(4)FC網絡終端會周期判斷FC接口的心跳信息,如果FC接口心跳異常則將該故障的發生時間和故障類型保存在本地的NVRAM中;
(5)FC網絡交換機及FC網絡終端上電后會讀取本地模塊上光收發器的發送光功率的數值,并匯總至交換機進行綜合處理;
(6)FC網絡交換機在進行FC網絡健康信息綜合時,當有狀態變化或系統進入維護模式時,都會將所有的健康信息發送給故障管理模塊進行保存。同時故障管理模塊會監控交換機的心跳信息,如果異常則會將該故障的發生時間和故障類型記錄在本地的NVRAM中。
4 總結評價
本文介紹了一種基于交換式FC網絡拓撲結構的FC網絡的健康管理方法。對FC網絡系統中的各設備在健康管理中所起的作用、涉及管理的內容和方法做了介紹,其中包括FC網絡交換機作為健康管理的核心部件進行管理的具體方法和FC網絡終端、故障管理模塊及FC網絡監控設備需要實現的內容。這套健康管理方法能夠極大的提高FC網絡系統的故障診斷能力,并為FC網絡狀態監控及故障排查提供有力的數據支撐。
參考文獻:
[1] Fibre Channel Framing and Signaling – 3 (FC-FS-3) Rev 0.60, American National Standard for Information Technology 2008-08-15
[2] 黃浩益.光纖通道技術在航電系統中的應用[J].航空電子技術,2005(3).
[3] 周耀榮.航空系統結構發展趨勢[Z].2006.
【通聯編輯:梁書】