公司的新機房建成并啟用后,筆者所在部門負責將公司的寬帶大客戶業務割接到新機房。線路割接完成之后,網絡測試正常,回訪某個大客戶,得知其上網不正常,部門領導遂安排筆者為用戶排查故障。
第一時間與用戶取得了聯系,無奈用戶除了能說出“全都上不了網”,就再也描述不出其他對處理故障有幫助的信息了。
從局端機房這邊測試網絡完全正常,故障一定還是出在用戶端。什么情況會導致“全都上不了網”呢?就以往處理此類故障的經驗,在線路割接之后突然上不了網,最大的可能是用戶端電腦之前獲取的IP地址未釋放,無法獲取新的IP地址。于是告知用戶,重新啟動電腦試一試。答復:“已經重新啟動了,還是全都上不了網?!?/p>
這種情況下,我們必須對用戶的網絡結構有一個大概的了解,從最容易發生故障的區域入手。一般粗略劃分用戶的網絡結構,只需要進行邊界劃分即可,用戶與運營商的邊界是網絡故障頻發的區域,也是區分用戶與運營商責任的區域,運營商必須保證在進入用戶內網之前的網絡通暢。我們給用戶提供光纖接入,并在用戶端放置光纖收發器,這里也就是我們與用戶的網絡邊界。重新啟動了光纖收發器之后,用戶的故障仍然沒有解決。筆者一邊與用戶電話溝通,一邊趕到用戶的所在地,用筆記本電腦直接接光纖收發器,上網一切正常,故障確定是在用戶內網了。
該單位將本單位的計算機、內網維護外包給了專業的維護公司,內網設備采購、維護均有專門的公司負責,于是,筆者告知用戶,線路沒有故障,應盡快請維護公司過來排查內網故障。由于維護公司必須等到下午才能趕到,用戶請求筆者幫忙,筆者爽快地答應了用戶的請求。
這個用戶的網絡結構并不復雜,光纖收發器下來的網線直接接在了一臺二層交換機上,再分配到各個辦公室。將筆記本電腦接到二層交換機,無法打開網頁。對于不同的網絡環境我們可以選擇從底層開始(適用于新建網絡、重新調整線路和增加新的網絡設備等物理環境變動的情況),也可以選擇從高層開始(適用于物理環境沒有變動的情況)。而在實際應用中,往往從位于中間的網絡層開始排查,測試網絡的連通性,如果網絡不能連通,再從物理層排查,測試線路;如果網絡能夠連通,則從應用層開始排查,測試應用程序本身。
第一步,先看本機IP地址獲取是否正常。給用戶分配了一段IP地址,用戶端電腦自動獲取即可,筆者的電腦確實自動獲取到了IP地址,可是卻不是我們給用戶分配的IP段。立刻想到是用戶的內網中有人將路由器反接了。事實也正是如此,用戶的幾個辦公室內都安裝了無線路由器,提供WiFi接入,而每一臺無線路由器都是將進線和電腦的網線都接在了LAN口。
原來,用戶的內網中即需要無線服務,又需要共享文件和打印機,維護公司的維護人員圖省事,就將路由器反接了,卻又沒有關閉路由器上的DHCP服務,導致內網中同時存在多個DHCP。用戶的電腦接入網絡,向網絡廣播要求IP地址,開啟DHCP服務的路由器從各自的IP池中挑出一個IP向客戶端放送,用戶電腦采用先收到的IP并記錄下給它這個IP的DHCP設備,然后再次廣播,該路由器收到回復并確認,記錄該IP已被使用。其他的路由器也收到回復,知道它所分配的IP未被使用,重新分配到自己的IP池中等待。這樣就會出現下面兩種情況:
1.如果幾個路由器的IP池一樣,某個路由器分配給用戶電腦的IP對其他幾個路由器來說并未分配出去,當有新的電腦加入網絡時,其他路由器恰好分配了之前的那個IP地址給它,并被它接受了,網絡上就會出現兩臺電腦共用一個IP,出現IP沖突。
2.如果幾個路由器的IP池不在同一網段,但是其中一臺是網關,上外網需要經過它,電腦要是獲得其他幾個路由器分配的IP地址,就不能訪問外網了。
回過頭想想,用戶的所有路由器都反接了,也就是說這些路由器都不是網關,要是用戶獲取到路由器分配的地址是肯定上不了網的,而用戶的故障是出現在網絡割接之后,割接之前一切正常。
問題并不僅僅是路由器反接了這么簡單!如果僅僅是將路由器的進線接到了WAN口,故障依然是存在的,而且用戶需要二層共享的要求也實現不了了。筆者將主交換機上的其他通往各個辦公室的網線全部斷開,筆記本能夠獲取正確的IP地址上網,主交換機故障的可能排除了。同時,用戶的部分電腦是直接接在主交換機上的,跳過了路由器,查看用戶電腦的IP地址獲取情況,又發現了一個問題,維護公司人員將用戶的電腦全設置成了IP地址手動設置,并且使用了非本公司的DNS服務器。
看來,維護公司人員可能自身的網絡知識也不是很充足,用戶需要二層共享,需要固定的IP地址,他就將我們給分配的IP地址固定設置給了用戶,恰巧我們這次割接更換了用戶的接入設備,手動設置的IP地址不能通過設備的認證;再加上用戶有時個別網頁或者應用打不開時,他依自作聰明地給用戶設置了某些外網的DNS服務器,這些外網的服務器到我們的出口并不穩定,時通時不通,成為了這次網絡故障的根本原因。
改成IP地址和DNS服務器自動獲取,上網恢復正常。接下來,幫助用戶優化了網絡結構,將路由器放到了主交換機之前,重新設置了路由器,解決了二層共享的問題,并電話給維護人員叮囑他以后遇到此類情況該如何處理。