摘 要:本文用針對(duì)不同類型設(shè)備的分類構(gòu)造方法得到網(wǎng)絡(luò)故障模型,總結(jié)了網(wǎng)絡(luò)設(shè)備類型故障表象和故障類型的映射關(guān)系。本文以知識(shí)庫(kù)的形式表達(dá)各種網(wǎng)絡(luò)模型,當(dāng)被觀測(cè)對(duì)象滿足一定的表象現(xiàn)象時(shí),可以推理得到相應(yīng)的故障類型。
關(guān)鍵詞:網(wǎng)絡(luò)故障管理 故障診斷
中圖分類號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1674-098X(2012)04(b)-0037-01
計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)不斷發(fā)展,網(wǎng)絡(luò)的應(yīng)用越來(lái)越普及,使得網(wǎng)絡(luò)規(guī)模更大,網(wǎng)絡(luò)更加復(fù)雜。因此,網(wǎng)絡(luò)故障管理面臨巨大的挑戰(zhàn)。傳統(tǒng)的集中式網(wǎng)絡(luò)管理模型不能適應(yīng)當(dāng)前分布式、動(dòng)態(tài)性的網(wǎng)絡(luò)環(huán)境。本文采用分布式網(wǎng)絡(luò)管理模型,提出基于多代理技術(shù)的網(wǎng)絡(luò)故障管理框架,并且針對(duì)網(wǎng)絡(luò)故障管理各個(gè)階段詳述了分布式網(wǎng)絡(luò)故障管理的具體實(shí)現(xiàn)方法。
1 網(wǎng)絡(luò)故障現(xiàn)象與MIB變量的關(guān)系
管理信息庫(kù)(MIB)提供了網(wǎng)絡(luò)管理數(shù)據(jù)的標(biāo)準(zhǔn),為網(wǎng)絡(luò)故障管理提供了豐富的網(wǎng)絡(luò)狀態(tài)信息。在這個(gè)標(biāo)準(zhǔn)里規(guī)定了網(wǎng)絡(luò)設(shè)備必須保存的數(shù)據(jù)項(xiàng)目、數(shù)據(jù)類型,以及允許在每個(gè)數(shù)據(jù)項(xiàng)目中的操作。通過對(duì)這些數(shù)據(jù)項(xiàng)目的存取訪問,就可以得到該設(shè)備的統(tǒng)計(jì)數(shù)據(jù)。MIB II定義了11組MIB變量,在這些MIB變量組定義的變量中,定義了很
多與故障管理有關(guān)的變量。例如,IF組中可用于故障管理的MIB對(duì)象有:接口丟棄的輸入包數(shù)(iflnDiscards)、接口丟棄的輸出包數(shù)(ifOutDiscards)、包含錯(cuò)誤的輸入包數(shù)(iflnErrors)、包含錯(cuò)誤的輸出包數(shù)(ifOutErrors)、接口接收的字節(jié)數(shù)(必Octets)、接口發(fā)送的字節(jié)數(shù)(ifDutOctets),輸入的單播包數(shù)(ifinUNcatPkts)、輸出的單播包數(shù)(ifOutUcastPkts)、輸入的非單播包數(shù)(iflnNUcastPkts)、輸出的非單播包數(shù)(ift7utNUcastPkts)、因定向到一個(gè)未知或不支持的協(xié)議而被丟棄的包數(shù)(IfInUnknownProtos),輸出隊(duì)列中的所有包數(shù)(IfOutQlen)。其它組中也有與故障管理有關(guān)的對(duì)象屬性,例如IP組中:收到的全部IP分組數(shù)(ipInReceives)、收到的全部IP分組中成功發(fā)送到IP的上層協(xié)議的個(gè)數(shù)(iplnDelivers),IP的上層協(xié)議提供給IP傳送的全部IP分組數(shù)(ipOutRequests)等;UDP組中:接收到的UDP數(shù)據(jù)報(bào)總數(shù)(udpInDatagrams),發(fā)送的UDP數(shù)據(jù)報(bào)總數(shù)(udpOutDatagrams)等;TCP組中:接收到的TCP段總數(shù)(tcplnSegs)、發(fā)送的 TCP段總數(shù)(tcpOutSegs)等等。
因?yàn)镸IB變量并不是為了網(wǎng)絡(luò)故障診斷而設(shè)計(jì)的,所以許多網(wǎng)絡(luò)故障表現(xiàn)與MIB變量之間不存在一一對(duì)應(yīng)關(guān)系,即無(wú)法通過某個(gè)MIB變量直接判斷是否存在網(wǎng)絡(luò)故障。但是利用多個(gè)MIB變量的組合式能指示網(wǎng)絡(luò)的當(dāng)前狀態(tài),可以有效地表示網(wǎng)絡(luò)故障特征.如利用查詢得到的MIB對(duì)象的組合得到如網(wǎng)絡(luò)吞吐率、負(fù)載率、傳輸時(shí)延等有關(guān)網(wǎng)絡(luò)參數(shù)。
2 路由器設(shè)備的故障診斷
參照路由器故障的層次劃分,我們將路由器中可能出現(xiàn)的各種網(wǎng)絡(luò)故障匯集在一起,組成一顆描述路由器故障的故障樹。以下的模型中僅以Cisco公司2600系列路由器為例,列出了它們的MIB變量標(biāo)識(shí)符,事實(shí)上,對(duì)于不同廠家的路由器,只需要找到功能相同的MIB變量,就可以同樣依照上述模型進(jìn)行故障診斷。
2.1 絕對(duì)連接不通
故障1:以太網(wǎng)端口硬件壞、線路斷或?qū)Ψ皆O(shè)備故障。
表現(xiàn)現(xiàn)象:端口狀態(tài)down,鏈路協(xié)議狀態(tài)down o
對(duì)應(yīng)MIB:1.3.6.1.2.1.2.2.1.8.x(端口號(hào)片(down)
1.3.6.1.4.1.9.2.2.1.1.2.x(端口號(hào)) (down)
故障2:以太網(wǎng)端口被管理性關(guān)閉。
表現(xiàn)現(xiàn)象:端口狀態(tài)down,鏈路協(xié)議狀態(tài)down,端口管理狀態(tài)downs。
對(duì)應(yīng)MIB:1.3.6.1.2.1.2.2.1.8.×(端口號(hào))=2(down)
1.3.6.1.4.1.9.2.2.1.1.2.×(端口號(hào)=0(down)
1.3.6:1.2.1.2.2.7.×(端口號(hào))=2(down)
2.2 串行接口
故障1:串口的模式設(shè)置不對(duì),一般串口應(yīng)設(shè)定為SCTE模式。
表現(xiàn)現(xiàn)象:串口狀態(tài)即,線路協(xié)議狀態(tài)down,串口的DSU不是SCTE模式。
對(duì)應(yīng)MIB:1.3.6.1.2.1.2.2.1.8.×(端口號(hào))=1(up)
1.3.6.1.4.1.9.2.2.1.1.2.×(端口號(hào))=0(down)
故障2:串口數(shù)據(jù)鏈路協(xié)議錯(cuò)(與原來(lái)的設(shè)置不相符)。
表現(xiàn)現(xiàn)象:串口狀態(tài)down,線路協(xié)議狀態(tài)down,鏈路協(xié)議與原來(lái)的設(shè)定值不一致。
對(duì)應(yīng)MIB:1.3.6.1.2.1.2.2.1.8.x(端口號(hào))=2(down)
1.3.6.1.4.1.9.2.2.1.1.2.x(端口號(hào))=0(down)
3 三層交換機(jī)設(shè)備故障診斷
3.1 絕對(duì)連接不通
故障1:交換機(jī)的連接端口(下連)硬件壞、線路斷或?qū)Ψ皆O(shè)備故障:
表現(xiàn)現(xiàn)象:端口狀態(tài)down,鏈路協(xié)議狀態(tài)down o
對(duì)應(yīng)MIB:1.3.6.1.2.1.2.2.1.8.x=2(down)
1.3.6.1.4.1.43.29.4.8.2.1.4.x(a3ComSysEthernetPortLinkStatus)=2(down)
故障2:交換機(jī)的連接端口被管理性關(guān)閉
表現(xiàn)現(xiàn)象:端口狀態(tài)down,鏈路協(xié)議狀態(tài)down,端口管理狀態(tài)down o
對(duì)應(yīng)MIB: 1.3.6.1:?.1.2.2.1.8.x=2(down)
1.3.6.1.2.1.2.2.1.7.x=2(down)
1.3.6.1.4.1.43.29.4.8.2.1.4.x(a3ComSysEthernetPortLinkStatus)=2(down)
3.2 相對(duì)連接不通
MAC地址沖突。
表現(xiàn)現(xiàn)象:三層交換機(jī)中某個(gè)端口的固化表中有網(wǎng)絡(luò)工作站IPI或IP2所對(duì)應(yīng)的MAC1或MAC2的地址。如果在連接線路上經(jīng)過了路由器,而固化了該MAC地址的交換機(jī)端口不能到達(dá)路由器,則要加入對(duì)路由器對(duì)應(yīng)的以太網(wǎng)端口的MAC地址的判斷。
對(duì)應(yīng)MIB:1.3.6. I .4.1.43.29.4.10.2.1.19(a3ComSysBridgeAddressLearnMode)
1.3.6.1.4.1.43.29.4.I O.S.1.5(a3ComSysBridgePortAddressIsStatic)
{isStatic(1),isDynamic(2)}
3.3 連接性能故障
故障1:線路噪音:由于線纜類型不對(duì)、接口卡壞、干擾信號(hào)等.
表現(xiàn)現(xiàn)象:端口的CRC錯(cuò)誤增多,沖突數(shù)不增多。
對(duì)應(yīng)MIB:1.3.6.1.2.1.16.1.1.1.8(etherStatsCRCAIignErrors)
1.3.6.1.2.1.16.1.1.1.13(etherStatsCollisions)
故障2:后沖突;由于線纜過長(zhǎng)或中繼過多.
表現(xiàn)現(xiàn)象:端口的后沖突數(shù)增加。
對(duì)應(yīng)MIB:1.3.6.1.2.1.10.7.2.1.8(dot3StatsLateCollisions)
在網(wǎng)絡(luò)故障定位之后,網(wǎng)絡(luò)故障的處理范圍己經(jīng)縮小到故障點(diǎn),接下來(lái)的工作就是要根據(jù)故障點(diǎn)的表現(xiàn)現(xiàn)象判定網(wǎng)絡(luò)故障類型和產(chǎn)生故障的原因。本文用針對(duì)不同類型設(shè)備的分類構(gòu)造方法得到網(wǎng)絡(luò)故障模型,總結(jié)了網(wǎng)絡(luò)設(shè)備類型故障表象和故障類型的映射關(guān)系。本文以知識(shí)庫(kù)的形式表達(dá)各種網(wǎng)絡(luò)模型,當(dāng)被觀測(cè)對(duì)象滿足一定的表現(xiàn)現(xiàn)象時(shí),可以推理得到相應(yīng)的故障類型。