■ 陸軍步兵學院(石家莊校區) 薄鵬 徐長戰
編者按: 筆者單位所在的校園網出現斷網,經排查是光纖收發器故障導致的,在此,通過該事件筆者對如何精準定位光纖收發器故障做出一些總結。
筆者所在單位為一所大型園區校園網絡,各辦公樓、教學樓、實驗樓及場、區、庫、所終端的信息點通過接入層的交換設備連接到匯聚層的交換機,再由匯聚層交換機連接到網絡中心的核心交換機,在這網絡三層結構中,使用最多的除了網絡交換機外就要數光纖收發器了。
某天早上剛上班接到電話說上不了校園網,通過電話指導用戶排除了本機配置和網線連接問題后在網管平臺中確認了接入的交換機一切正常,懷疑是連接庫房的光纖收發器出現問題。筆者前往故障現場,找到上不去網的用戶電腦,對端到端的網絡線路進行重新排查,基本排除線路物理中斷造成的網絡不通,根據用戶反映昨天還能正常上網,今天突然上不去,并且也沒有對網絡線路進行過改動。
根據多年網管經驗,目光就落在了放在接入交換上的那臺光纖收發器,這臺收發器已使用了五年之久,在除去外觀上的一層塵土后,首先將光纖收發器斷電,之后對連接光纖的TX(發射口)與RX(接收口)進行重新插拔,這時要注意小心操作以防將光纖弄斷。
之后對UTP網線口進行重新插拔,連接電源,收發器重啟,如果是普通的長時間工作的死機故障或由于塵土導致的接觸不良,這時就應該可以解決了。但還是上不去網。一般光纖收發器都是成對使用,在筆者來之前已經將機房中對應的那臺收發器進行過一系列故障排除工作,確定了沒有問題。
通過仔細觀察光纖收發器的六個指示燈,若光纖收發器正常工作,PWR電源指示燈必須常亮,FX-LINK/ACT光纖鏈路指示燈、TX-LINK/ACT網絡鏈路指示燈需常亮或閃爍。又觀察了幾分鐘后,發現LINK/ACT左邊代表光纖和網線數據傳輸狀態的指示燈一直常亮,全然沒有數據交互的閃爍狀態,且光纖收發器整體散熱比正常時略熱。在這樣的情況下,只能換掉這臺光纖收發器。在更換后,六個指示燈全亮,并出現閃爍狀態,又可以正常連網了,故障排除。
這次遇到的屬于光纖收發器的“硬故障”,筆者曾排除過關于光纖收發器的諸多問題,如何精準定位故障所在,給大家作一個經驗總結。
1.檢查PWD電源指示燈是否常亮,常亮說明供電正常,進行下一步排除。
2.一般最常見的問題是光纖收發器中LINK/ACT左邊分別代表FX-LINK/ACT光纖鏈路、TX-LINK/ACT網絡鏈路的兩個指示燈有不亮的,那么網絡肯定是不通暢的,需檢查鏈路是否連線正常,我們可以一點點排除,如果代表光纖鏈路的LINK/ACT不亮,可以將光纖接口TX(發射端)、RX(接收端)重新插拔,檢查光纖連接器是否完好插入設備接口,看能否解決。
如果還不亮,將TX和RX上連接的光纖接口調換一下位置再重新插上。如果是網絡鏈路TX-LINK/ACT燈不亮,這時重新插拔后沒有解決的話,用網線檢測儀測一下網線的通斷。
完成上述操作后故障還沒有解決的話,可以考慮光纖或網線可能存在物理斷路(也有部分光纖收發器只有在光纖鏈路接通后雙絞線指示燈才會亮)。光纖收發器都是成對使用的,排除故障時記得要兩個收發器都按照排除故障流程走一遍。
3.檢查設備傳輸長度是否與距離匹配,如果鏈路過長光損耗過大(建議用用光功率計儀表檢測光衰),超過設備接收范圍,也會造成鏈路指示燈不亮。
4.檢查設備傳輸速率是否匹配。如果完全不匹配,會造成網絡不通。當有半雙工的設備時,光纖的傳輸距離就有一定的限制。
1.光路衰減太大,沒有超出范圍,但是已經在接收敏捷度范圍四周。這是網絡丟包嚴重,打開網頁會非常慢。建議查檢收發器這間的通信鏈路。
2.收發器的端口與網絡設備接口,或兩端設備接口的雙工模式不匹配。建議做成一致的工作模式來排除故障。
3.可把收發器兩端接筆記本電腦(不要通過交換機或其他網絡設備),兩端ping沒問題后,從一端向另一端傳送一個較大文件,觀察其速度,如速度很慢(100M以下的文件傳送10分鐘以上),可基本判斷為收發器故障,使用此方法的前提是端對端的光纖鏈路沒有問題。
4.光纖收發器自身的溫度過高,或外界的溫度過高。光纖模塊受環境溫度的影響較大,雖然其本身內置自動增益電路,但溫度超出一定范圍之后,光模塊的發射光功率受到影響而下降,從而削弱光網路信號的質量而使丟包率上升,甚至使光鏈路斷開。
5.如不同品牌的收發器相互的兼容性事前沒做過測試則也會產生丟包、傳輸時間過長、忽快忽慢等現象。建設成對使用的收發器使用同一品牌相同型號。
此現象一般由交換機引起,交換機會對所有接收到的數據進行CRC錯誤檢測和長度校驗,檢查出有錯誤的包將丟棄,正確的包將轉發出去。但這個過程中有些有錯誤的包在CRC錯誤檢測和長度檢驗中都檢測不出來,這樣的包在轉發過程中將不會被發送出去,也不會被丟棄,它們將會堆積在動態緩存(buffer)中,等到buffer堆積滿就會造成死機。通常重啟之后就可以使通信恢復正常。建議檢查交換機中大量CRC校驗錯誤的產生原因。
以上就是筆者在網管中關于光纖收發器出現問題的一些經驗總結,希望大家遇到類似問題時能夠精準定位故障所在,節省排除故障時間,少走彎路。