李彥華 譚小波 武玉良
[摘 要]衛(wèi)星網(wǎng)絡(luò)的最根本的特征和功能是通信,本文針對衛(wèi)星網(wǎng)絡(luò)的這個特性,展開了衛(wèi)星網(wǎng)絡(luò)故障診斷技術(shù)的研究。設(shè)計了基于動態(tài)管理域劃分的衛(wèi)星網(wǎng)絡(luò)故障診斷模型。設(shè)計實現(xiàn)了管理域內(nèi)的衛(wèi)星網(wǎng)絡(luò)故障診斷專家系統(tǒng),并對知識獲取與表達、推理規(guī)則設(shè)計及系統(tǒng)模型建立等關(guān)鍵技術(shù)進行了論述。另外,設(shè)計了管理域間的協(xié)作故障診斷模型。
[關(guān)鍵詞]專家系統(tǒng) 衛(wèi)星網(wǎng)絡(luò) 網(wǎng)絡(luò)故障診斷 診斷規(guī)則 管理域間協(xié)作診斷
[中國分類號]TP[文獻標識碼]A[文章編號]1007-9416(2009)11-0104-01
1引言
衛(wèi)星網(wǎng)絡(luò)是由星際和星地鏈路連接在一起,由不同軌道、種類和性能的衛(wèi)星、星座及相應地面設(shè)施組成的互連互通衛(wèi)星群體網(wǎng)絡(luò)。衛(wèi)星網(wǎng)絡(luò)與地面網(wǎng)絡(luò)不同,它具有以下特點:(1)網(wǎng)元節(jié)點種類繁多;(2)網(wǎng)絡(luò)結(jié)構(gòu)復雜;(3)節(jié)點的資源有限;(4)網(wǎng)絡(luò)通信的傳輸延時較大;(5)節(jié)點運行動態(tài)變化、節(jié)點間無線通信的質(zhì)量受空間環(huán)境影響嚴重等等。要使這樣一個復雜的異構(gòu)網(wǎng)絡(luò)能夠自主、高效的運行,提高網(wǎng)絡(luò)的生存效能,就必須要保證網(wǎng)絡(luò)管理系統(tǒng)能夠及時、準確的發(fā)現(xiàn)、診斷網(wǎng)絡(luò)故障。雖然我國的衛(wèi)星網(wǎng)絡(luò)的建設(shè)處于起步階段,將網(wǎng)絡(luò)故障診斷作為網(wǎng)絡(luò)本身的一項內(nèi)在功能來研究,對于衛(wèi)星網(wǎng)絡(luò)的健康發(fā)展具有重要意義。
2基于動態(tài)管理域劃分的網(wǎng)絡(luò)故障診斷模型
衛(wèi)星網(wǎng)絡(luò)管理系統(tǒng)是一種基于動態(tài)分層結(jié)構(gòu)的網(wǎng)絡(luò)管理體系。在這樣一個動態(tài)分層的網(wǎng)絡(luò)管理體系結(jié)構(gòu)中,為實現(xiàn)對整個網(wǎng)絡(luò)的高效管理,設(shè)計了基于動態(tài)注冊注銷的管理域劃分機制,使得衛(wèi)星網(wǎng)絡(luò)中的被管節(jié)點在某一時刻都歸屬于某個管理分站的管轄范圍,而總控中心負責管理各個管理分站,并通過各個管理分站來實現(xiàn)對整個網(wǎng)絡(luò)的管理,從而實現(xiàn)對衛(wèi)星網(wǎng)絡(luò)的分層分布式管理。基于該網(wǎng)管體系結(jié)構(gòu),本文提出了基于動態(tài)管理域劃分的網(wǎng)絡(luò)故障診斷體系結(jié)構(gòu),它包括管理域內(nèi)的網(wǎng)絡(luò)故障診斷和管理域間協(xié)作故障診斷。
3 管理域內(nèi)的網(wǎng)絡(luò)故障診斷專家系統(tǒng)的設(shè)計與實現(xiàn)
衛(wèi)星網(wǎng)絡(luò)的節(jié)點成本較高,并且它們具有不可現(xiàn)場維護的特點,因此,對網(wǎng)絡(luò)狀態(tài)的監(jiān)控與故障診斷提出了越來越高的要求,它要求建立智能化的故障診斷系統(tǒng),以實現(xiàn)監(jiān)控和診斷的自動化。
衛(wèi)星網(wǎng)絡(luò)最根本的特征和功能是通信,從這個意義上來說,所有的網(wǎng)絡(luò)故障最終都會集中體現(xiàn)在網(wǎng)絡(luò)節(jié)點的通信能力或狀態(tài)上。因此,本文將衛(wèi)星網(wǎng)絡(luò)節(jié)點的通信狀態(tài)以及網(wǎng)絡(luò)性能水平作為衛(wèi)星網(wǎng)絡(luò)故障診斷的內(nèi)容。
衛(wèi)星網(wǎng)絡(luò)故障診斷專家系統(tǒng)就是用以實現(xiàn)對網(wǎng)絡(luò)主要節(jié)點或設(shè)備(路由節(jié)點、交換節(jié)點、主機、網(wǎng)絡(luò)打印機等)的狀態(tài)監(jiān)測和故障診斷。本文參照SNMP協(xié)議構(gòu)造了專家系統(tǒng)的總體結(jié)構(gòu)模型。
該模型由數(shù)據(jù)采集及預處理模塊、知識庫模塊、推理診斷及解釋模塊、學習機制模塊及用戶界面模塊等5部分組成。
(1)數(shù)據(jù)采集及預處理模塊 該模塊主要通過三種方式獲得網(wǎng)絡(luò)狀態(tài)信息,它包括:Trap機制、管理站輪詢和代理端本地輪詢(即在MIB庫中加一個polling組)。然后,簡約處理信息以消除這冗余,并生成故障診斷專家系統(tǒng)全局工作內(nèi)存中所需要的事實,以供推理機進行故障的推理診斷。
(2)知識庫模塊 它是整個專家系統(tǒng)的關(guān)鍵部分。一個專家系統(tǒng)的好壞與知識庫的建設(shè)水平有著密切的關(guān)系。根據(jù)衛(wèi)星網(wǎng)絡(luò)的特點,本文深入研究了衛(wèi)星網(wǎng)絡(luò)的通信方面的故障,以衛(wèi)星通信鏈路故障為例,設(shè)計了故障診斷規(guī)則以及基于XML形式的存儲格式。此外,還研究設(shè)計了其它類型的網(wǎng)絡(luò)故障的診斷規(guī)則。該模塊把設(shè)計的這些網(wǎng)絡(luò)故障診斷規(guī)則存儲起來,并且還能夠存儲推理過程中生成的中間結(jié)論、推理結(jié)果以及故障日志等。
(3)推理診斷及解釋模塊 該模塊是專家系統(tǒng)的核心,它根據(jù)數(shù)據(jù)采集及預處理模塊提供的診斷目標和網(wǎng)絡(luò)事實數(shù)據(jù),利用知識庫中的知識對目標進行推理,獲得診斷結(jié)果。由于本文把重點放在了衛(wèi)星網(wǎng)絡(luò)的故障診斷規(guī)則的研究與設(shè)計上了,所以該模塊采用了專家外殼系統(tǒng)JESS的推理機制,沒有再設(shè)計新的推理機。
(4)學習機制模塊 該模塊提出了基于故障案例發(fā)生頻率的學習機制,并成功應用于該專家系統(tǒng)中,它是指對于經(jīng)常發(fā)生的(即故障發(fā)生頻率高)網(wǎng)絡(luò)故障,如果它能夠在故障診斷“快表”里查詢到的話,不再經(jīng)過推理機診斷推理,而是直接返回診斷結(jié)果,這大大提高了故障診斷的效率。
(5)用戶界面模塊 主要用于完成人機交互、系統(tǒng)設(shè)置、問題描述、診斷結(jié)果顯示和系統(tǒng)的總體控制。該模塊允許對原有的專家知識庫進行修正和補充,使其具有良好的可擴展性。
4關(guān)鍵技術(shù)及其解決方法
(1)快速采集網(wǎng)絡(luò)信息,實現(xiàn)快速故障診斷。本文提出了代理端本地輪詢方式,它是指在代理端的MIB庫中加一個polling組,本組中的數(shù)據(jù)經(jīng)過一種運算之后,把結(jié)果存入這個polling組中,當該輪詢值超過某個閾值時,再向地面站報告該事件,這就使得代理端與地面站之間的交互次數(shù)大大減少,提高了信息搜集的效率。另外,在管理站定期輪詢過程中,通過建立優(yōu)先級輪詢機制,大大減少了帶寬浪費。
(2)知識表達與存儲:經(jīng)過研究,本文采用產(chǎn)生式與面向?qū)ο笙嘟Y(jié)合的方法,把故障診斷規(guī)則表示出來,并以XML的形式存儲在專家系統(tǒng)的知識庫中。
5管理域間的協(xié)作故障診斷模型
當某管理站在診斷網(wǎng)絡(luò)故障,需要域間協(xié)作時(可能是該域內(nèi)的節(jié)點無法與其它域內(nèi)的節(jié)點進行通信,那么該類故障可能是節(jié)點間的通信鏈路受到干擾,也有可能是該域內(nèi)的網(wǎng)絡(luò)節(jié)點出現(xiàn)了故障或者其它域內(nèi)的網(wǎng)絡(luò)節(jié)點出現(xiàn)了故障),它向總控中心發(fā)起域間協(xié)作診斷請求;總控中心收到該請求后,將發(fā)送過來的協(xié)作診斷總體任務(wù)進行任務(wù)劃分,劃分為若干個子任務(wù),即各個分管理站為實現(xiàn)該協(xié)作所要完成的診斷任務(wù)。這些子任務(wù)可以同時進行,這樣發(fā)起請求的分管理站與其它分管理站之間建立了協(xié)作關(guān)系。總控中心向該分管理站及其它分站分別發(fā)送各自的子任務(wù)。當參與協(xié)作的分管理站完成各自任務(wù)后,將診斷結(jié)果返回給總控中心,總控中心就能夠確定故障源。最后,總控中心把故障診斷結(jié)果回送給發(fā)送請求協(xié)作的分管理站,完成該分管理站與其它分管理站之間的協(xié)作故障診斷。
6 結(jié)語
本文結(jié)合衛(wèi)星網(wǎng)絡(luò)的特點,充分利用JAVA語言面向?qū)ο蟮木幊烫匦?在Windows XP平臺上仿真實現(xiàn)了一個基于SNMP協(xié)議的網(wǎng)絡(luò)故障診斷診斷專家系統(tǒng)。在故障信息采集過程中,提出了本地輪詢機制,減少了地面站與星上代理的交互次數(shù),這也是與地面網(wǎng)絡(luò)故障診斷的不同之處。本文提出的學習機制也加快了網(wǎng)絡(luò)故障診斷的效率。但是,該系統(tǒng)還僅是一種仿真實現(xiàn),還有待于未來在衛(wèi)星網(wǎng)絡(luò)中加以驗證。
[參考文獻]
[1] 石榮德,趙廷弟,屠慶慈,常文兵.故障診斷專家系統(tǒng).北京航空航天大學學報,1995,21(4).
[2] 蘇利敏,侯朝楨,巍忠健.指揮控制系統(tǒng)的通信網(wǎng)絡(luò)故障診斷專家系統(tǒng)。計算機工程,2003,29(13).