摘要:隨著網絡技術的迅猛發展,如今的網絡已揭開了它神秘的面紗,在人們的工作于生活中發揮著越來越重要的作用,但從另一方面來看,人們也將會有更多的機會來面對網絡故障所帶來的困擾與煩惱,如何及時地獲得網絡系統資源的異常信息,在網絡服務中斷或系統崩潰之前就提前發現并解決網絡中潛在的故障和隱患,已成為網絡管理人員的首要任務。本文從對網絡故障管理的分析入手,介紹了網絡故障的計算機智能化管理方法。筆者希望通過此文能夠對日后的網絡故障的管理工作起到一定的借鑒作用。
關鍵詞:網絡故障管理;計算機智能化管理方法
中圖分類號:TP393 文獻標識碼:A 文章編號:1674-7712 (2012) 10-0097-01
網絡故障管理是計算機網絡管理中一個重要的功能,用戶在正常使用計算機網絡的時候,如果網絡發生故障必然會影響用戶,因此,網絡管理器需要快速查找故障并排除故障。故障管理的任務就是查找故障和排除故障。故障管理包括故障管理、故障恢復和預防管理。故障管理的內容包括故障警告、故障測試、故障診斷及設備更換等。由于網絡故障的出現具有一定的復雜性因素,其通常是由于系統區域內不同功能的網絡部件共同作用的結果。在進行網絡故障的分析及管理時,應對系統構建的網絡進行必要的修復,最后,為了確保故障的完全修復,還應實時的分析網絡故障產生的原因。通常情況下,系統內的日志文件主要負責網絡中輕微故障的記錄工作,而當嚴重故障發生時,系統內置的報警機構將會發出警示信號,以通知網絡管理器進行實時的處理和防范。現階段,為了降低網絡故障的發生頻率,制造方或運營商通常會在系統內引入或根植相關的人工智能技術,這樣不僅能夠使得網絡故障的檢測及管理水平有所提高,而且其在系統的可靠運行方面也起到了非常重要的作用。
一、網絡故障原因及相關應對措施分析
日常維護可以有效地保證網絡穩定地運行,減少錯誤。但是,由于網絡設備、用戶使用、應用程序及網絡規劃不盡完善等問題的不可避免性,不論日常維護工作做的如何好,網絡還是會出現問題。網絡系統涉及面十分廣,有網絡硬件、網絡軟件、計算機、打印機、應用程序等等,當網絡系統中出現故障時,首要的原則是隔離網路問題,判明問題的原因,然后才是解決問題。在分析網絡常見問題的起因和具體解決方法之前,要先弄清網絡故障產生的原因,找出故障應該從哪幾個方面著手:
縮小故障的范圍??梢杂靡韵路椒òl現故障設計的范圍:根據出錯信息判斷;判明故障發生在一個工作站,還是幾個工作站,還是文件服務器;判別故障的類型是打印問題,通訊問題,還是應用程序問題等等。
檢查硬件設備。如果故障出現在一個設備上,可以將這臺設備隔離開來單獨運行,或將外設掛到一臺正常的機器上運行,如果這時該設備出現同樣的故障,表示這臺設備本身有問題,與網絡無關。如果發生故障的各個設備單獨運行時都正常,則說明問題出在設備與網絡的聯接方面。
故障發生時,屏幕上經常會出現“出錯信息”可以查閱《系統信息手冊》找到出錯原因。
經過第2步,確認故障不是計算機,外設本身的故障,而是網絡方面的問題后,根據第3步進一步縮小可能發生故障的范圍。如果是網絡硬件問題,可以確定可能有故障的各種設備,如網卡、BNC頭,HUB、雙絞線、同軸線、終結器或線路接觸不良等等。先對最便宜的設備進行更換,更換后如果故障仍存在,則更換稍貴些的部件,依次類推。
總結修復經驗,解決問題后,立即將修復經驗和更換內容進行記錄,已備類似問題出現時有據可依。
計算機智能管理系統分析為了能夠更有效地對各種大型復雜的網絡進行管理,許多研究人員將人工智能技術應用到網絡管理領域。雖然全面的智能化的網絡管理距離實際應用還有相當長的一段路要走,但是在網絡管理的特定領域實施智能化,尤其是基于專家系統技術的網絡管理是可行的。用于故障管理的專家系統由知識庫、推理機、知識獲取模塊和解釋接口四大主要部分組成。專家系統以其實時性、協作管理、層次性等特點,特別適合用在網絡的故障管理領域。但同時專家系統也面臨一些難題:(1)動態的網絡變化可能需要經常更新知識庫。(2)由于網絡故障可能會相關到其它許多事件,很難確定與某一癥狀相關的時間的開始和結束,解釋和綜合消息復雜。(3)可能需要大量的指令用以標識實際的網絡狀態,并且專家系統需要和它們接口。(4)專家系統的知識獲取一直以來是瓶頸所在,要想成功地獲取網絡故障知識,需要經驗豐富的網絡專家。
二、建立必要的事件知識庫
在專家系統中,知識的表示有邏輯表示法、語義網絡表示法、規則表示法、特性表示法、框架表示法和過程表示法。產生式表示法,即規則表示法,是最常見的一種表示法。其特點是模塊性、一致性和自然。知識庫是知識的集合,嚴格意義上的知識庫包括概念、事實和規則只部分,缺一不可。為了提高故障管理的智能水平,可以建立事件知識庫,用于存儲所有已知事件的類型、產生事件的原因和所造成的影響,以及應該采取什么樣的措施等一些細節的靜態描述。這個EKB并不是真正意義上的知識庫,它的數據僅僅包含了屬性值與元組,而屬性值表示概念,元組表示事實。但研究EKB可以為今后建立完善的知識庫奠定基礎。在EKB中存儲了己經確定事件。最初,被確定的事件僅限于一些標準事件和措施。隨著網絡的運行和系統的反饋,EKB的內容將不斷增加。理想狀態是能夠確定所有的事件。下面是EKB涉及到的只種基本的數據庫表:(1)事件類型表:該表中主要存儲了事件的靜態定義;(2)實時事件表:描述了正在運行的網絡中的實時事件;(3)設備信息表:存儲了網絡中設備的實際參數。EKB中存儲的相關事件的知識主要來源于專家。開發人員將獲得的知識應用到與故障管理相關的系統中,根據不同系統的需要分配相應的知識,以提高系統性能。雖然EKB并不是嚴格意義上的知識庫,但在開發過程中,可以通過不斷地增加和修正EKB的內容,在一定程度上提高系統的智能水平。
三、結語
本文通過對網絡故障原因及相關應對措施的分析,提出了將計算機人工智能及事件知識庫的構件方案用于計算機網絡故障的管理。通過大量的實踐證明,這種用于網絡故障管理的計算機智能化方案不僅比傳統的管理方式具有更高的決策水平,而且還能大幅提高計算機系統在故障檢測及隔離方面的效率。
參考文獻:
[1]楊海濤.網絡管理原理與實現技術[M].北京:清華大學出版社,2002
[2]武玉祥.專家系統[M].北京:北京理工大學出版社,2005