摘 要: 文章作者針對網線故障,展開思考和探索,結合實際工作環境和掌握的相關網絡知識與經驗,闡述了診斷和排除網絡故障的步驟和過程,歸納總結相應的解決方案,取得了一定的效果,具有一定的借鑒意義。
關鍵詞: 網絡故障 診斷 排除
1.前言
隨著高校的不斷擴招和各類課程電子化網絡化的普及,作為培養人才和技術發展的搖籃和重要基地的高校園地,實驗機房不僅為學生提供了計算機課程的實踐工具和場地,而且為其課程的電子化、網絡化提供了強大的支持,促進了各類學科教學質量的提升,同時,機房課時安排也越來越緊密,這給機房管理中的網絡管理帶來了嚴峻的挑戰和考驗,由此引發的實驗機房管理中的網絡管理也占有重要的位置和意義。我結合自身六年的機房管理經驗和掌握的大量專業知識,談談對網絡故障及時準確高效地診斷和排除的見解。
我所管理的實驗機房共配備有計算機200臺,分配在A、B、C三個機房內,并設有1機房控制室。控制室里配置10臺24端口交換機,每3臺交換機控制1個機房。1臺總交換機通過1臺路由器連接外網,其他9臺交換機跟此總交換機相連。整個實驗機房的網絡拓撲結構是星型結構和總線結構相結合,網絡拓撲結構圖如下。
2.了解網絡故障的癥結
實驗機房在教學使用過程中,因為學生使用不當、路由器故障、線路損壞,以及線路受到嚴重電磁場干擾,等等,經常會出現網絡故障,如果處理不及時,會給教學工作帶來極大的不便,甚至影響教學的進程。及時發現網絡故障、準確定位故障并及時排除就成為網絡管理中的一項重要工作。我現在針對工作機房的電腦出現大批量網絡不通這一案例,對網絡故障展開深入的思考和探討,并最終發現往往不被首先重視的網線故障正是引發網絡故障的癥結所在。此次網絡故障的具體現象表現為:C室機房突然同時出現27臺電腦本地連接的顯示圖標上出現了感嘆號,局域網不能相互訪問,廣域往也不能訪問。次日,B室也有24臺電腦出現相同情況。第三天,A室的65臺電腦也出現相同的故障現象。此次網絡故障現象跟以往幾年工作中遇到的網絡故障現象有很大的區別:第一是突發性,在出現這些故障現象的前一天,所有的機器運作正常,三間機房均是正常的實驗課,沒有任何的故障征兆;第二是接連性,在C室的27臺機器同時發生網絡故障還沒有得到根本解決的第二天,B室的24臺機器也同時出現了相同的情況,并且在B室發生機器故障的次日,A室的65臺機器也同樣出現了相同的故障現象;第三是批量性,三間機房的機器都出現了幾十臺機器故障的情況;第四是可變性,A室的65臺機器的故障現象只維持了一天,第二天全部恢復正常,以后一直運作正常。基于此,我對這些故障現象的發生給予了高度重視,下面是針對診斷并排除此次網絡故障展開了深入思考和探討。
3.解決故障的思路與實施
3.1排查癥狀原因
網絡故障按照故障對象的不同可以劃分為以下幾個。
3.1.1主機故障
引發網絡故障常見對象之一的主機故障進行思考和排查,按照常規分析覺得這個原因可以排除,原因有五點:一、計算機在網絡發生故障前是處于正常運作狀態,沒有任何的故障征兆;二、計算機環境在網絡故障出現前的最后一刻沒有發生變化,具體來說就是最近沒有安裝、移除、重新配置過硬件和軟件;三、計算機安裝了系統保護卡,并且實行了全盤保護,一般情況下,計算機在重新啟動時,系統可以自動恢復到原來配置的狀態;四、計算機系統安裝了殺毒軟件和設置了防火墻,并定時升級病毒庫和定時修復系統漏洞,計算機大批量被病毒感染并受到惡意攻擊導致網絡故障的可能性不大;五、為防止學生隨意修改IP,導致網絡問題,所有計算機的IP地址與MAC地址已經綁定。但是出于謹慎和考慮到百密也有一疏,系統保護卡也有失效的時候等因素,還是有必要對主機故障進行認真的排查。詳細檢查發現網絡配置、IP地址等配置均正常,系統保護卡沒有失效的跡象;另外通過監視主機的流量、掃描主機端口和服務、借助有效的查殺工具等途徑對系統進行了詳細的檢查,發現系統安全,沒有病毒感染。
3.1.2路由器和交換機故障
鑒于故障的批量性,思考是否路由器故障,但是再深入思考,覺得這個設想可以排除,因為在同一個實驗機房里,還有很多機器的網絡是很正常的;仔細查閱以前的記錄表,發現C室的27臺故障機器的網線連接基本上集中在一臺交換機上,B室的24臺故障機器的網線連接基本上集中在另一臺交換機上,思考是否是交換機的數據包傳輸出現了暫時性的堵塞,于是重新啟動這兩臺交換機,但是故障沒有得到解決,深入思考是否交換機壞了,更換了兩臺新的交換機,問題仍然沒有解決。
3.1.3RJ45故障
RJ45是指雙絞線以太網設備接口,俗稱“水晶頭”。其故障可以分為RJ45插頭接觸不良引起的故障和RJ45插頭故障引起的故障,一般從以下步驟實施故障排查:檢查網線上的水晶頭和網卡插口接觸是否良好。可先把水晶頭從網卡接口上拔下觀察其接口是否已生銹或者有灰塵,將其擦拭干凈,再除掉網卡接口內的浮塵,重新插接好,在保證網絡接口已插緊的情況下使用Ping命令進行網絡測試。Ping向目標主機(地址)發送一個回送請求數據包,要求目標主機收到請求后給予答復,從而判斷網絡的響應時間和本機是否與目標主機(地址)聯通。如果執行Ping不成功,則可以預測故障出現在以下幾個方面:網線故障、網絡適配器配置不正確、IP地址不正確。如果執行Ping成功而網絡仍無法使用,那么問題很可能出在網絡系統的軟件配置方面。Ping成功只能保證本機與目標主機間存在一條連通的物理路徑。此處測試顯示Ping不成功。嘗試更換網卡接口處的“水晶頭”和交換機接口處的“水晶頭”,繼續執行Ping命令,結果顯示Ping不成功,問題沒有得到解決,預測故障出現在網線故障上。
3.1.4網線故障
把思考鎖定在一直使用了六年都很正常的網線上。用簡易測線儀測試其中出現網絡故障的網線,結果顯示網線是通的。簡易測線器只是測8根線的通斷,這次測試結果顯示正常也并不代表網線就沒有故障。繼續深入思考并作了以下探索:打開所有網絡故障機器的網上鄰居屬性,然后打開本地連接的屬性,進入網卡的配置項,點擊高級項并把屬性Link Speed/Duplex Mode(速度和雙工)的值改為10 Full Mode,確定后退出界面,查看網絡情況,發現網絡暢通。這就進一步證實了我的思路是正確的,網線的確是出現了故障,網絡傳輸受到了干擾。用高級測試儀(fluke福祿克)測試網線,發現測量電容值、測量阻抗值、測量近端串擾(NEXT)值、測量誤碼率值全部達不到線纜標準。把傳輸速度降為10Mbit/s時,以上這些標準對網絡傳輸的影響不是很大,可以說無關大局,但是在原來的100Mbit/s傳輸時,問題就變得非常嚴重了,因為干擾引入的概率比10Mbit/s傳輸時增大了10倍。
網絡故障的癥結找到了,探究問題的根本,是實驗機房建設時鋪設網線不合規范,存在一定的弊端。當初拉設線纜時考慮不周密,網線預留過長,并且在網線上直接繞圈打結,這樣在沒有一定轉彎半徑的圈結彎角處,加速了線纜表皮的老化,而且長年繞圈打結的線纜,對線纜生產工藝的基礎性能產生了影響,使其發生了改變,通俗地說就是增加了線纜的干擾。線纜生產工藝的基礎指的是:每對線芯相互扭絞,傳輸一路差分信號,以差分方式在扭絞線對內傳輸的電信號產生的電磁場相互抵消,從而對外界造成的干擾降至最低,來自外界的電磁場共模干擾也得到有效抑制,為減少信號耦合,同一護套內的4對線芯,彼此絞距互不相同,進一步降低了線對干擾。當使用年限達到一定的時候,隱患就突現出來了,正如六年后的這次大批量的網絡故障。
3.2制定并實施解決方案
經過排查,針對查找出的故障原因,最佳的解決方案是把A、B、C三個實驗機房的線纜重新布設,改善網絡規劃和優化網絡性能,消除隱患,根除故障。但是由于重新組建三個機房的局域網,工程量大,費時長,受到教學時間限制,這個解決方案需等假期方可實行,暫時只有采取過渡性解決方案。采取的過渡性解決方案是:在C室合適的位置架設兩臺24端口的交換機,用旁邊一條正常的網線接入其中一臺交換機的第一個端口,另外一臺交換機與這臺交換機級聯,把機房里27條故障網線全部更換,重新拉網線,做RJ45接口,并用簡易測線儀測試成功后,全部接入這兩臺交換機的端口。同理,B室也做了相應的處理。經過測試,網絡全部暢通,網絡的傳輸速度達到網絡產品的標準值,問題得以解決。
實施了過渡性解決方案以后,我對修復效果進行了長期的跟蹤觀察,發現網絡運行狀況穩定良好,網絡故障得到過渡性的解決。
4.結語
為了提高網絡管理效果,我們應建立健全的事件管理體制,把每次故障登記在冊,包括每次故障問題、有條不紊的解決步驟和最終的思考結論都應詳細地記錄完整。這認真整理下來的檔案資料可以為以后的網絡管理工作提供經驗和資料。
在網絡故障領域,我緊密結合自身工作環境和實際,將掌握的相關網絡知識和經驗有機地結合,對網絡故障事件展開了深入的思考和探索,發現往往容易被大家忽視的網線故障就是引發網絡故障的癥結所在,并總結歸納了網絡故障診斷和排除的方法步驟和見解,同時給出了相應的解決方案,取得良好的效果,具有一定的可借鑒性。
參考文獻:
[1]潘朝陽.計算機網絡故障診斷與排除[M].北京:清華大學出版社,2007.
[2]康效龍.喬立民,劉欣等.網絡管理實用教程[M].北京:北京大學出版社,2005.
[3]潘朝陽,曾勁柏等.計算機網絡故障診斷與排除[M].北京:清華大學出版社,2007.
[4]電腦報.網絡維護與故障排解.云南人民電子音像出版社,2008.
[5]方耿.網絡維護與故障診斷.冶金工業出版社,2004.