■ 陸軍步兵學(xué)院(石家莊校區(qū)) 薄鵬 徐長(zhǎng)戰(zhàn)
編者按: 筆者單位所在的校園網(wǎng)出現(xiàn)斷網(wǎng),經(jīng)排查是光纖收發(fā)器故障導(dǎo)致的,在此,通過該事件筆者對(duì)如何精準(zhǔn)定位光纖收發(fā)器故障做出一些總結(jié)。
筆者所在單位為一所大型園區(qū)校園網(wǎng)絡(luò),各辦公樓、教學(xué)樓、實(shí)驗(yàn)樓及場(chǎng)、區(qū)、庫、所終端的信息點(diǎn)通過接入層的交換設(shè)備連接到匯聚層的交換機(jī),再由匯聚層交換機(jī)連接到網(wǎng)絡(luò)中心的核心交換機(jī),在這網(wǎng)絡(luò)三層結(jié)構(gòu)中,使用最多的除了網(wǎng)絡(luò)交換機(jī)外就要數(shù)光纖收發(fā)器了。
某天早上剛上班接到電話說上不了校園網(wǎng),通過電話指導(dǎo)用戶排除了本機(jī)配置和網(wǎng)線連接問題后在網(wǎng)管平臺(tái)中確認(rèn)了接入的交換機(jī)一切正常,懷疑是連接庫房的光纖收發(fā)器出現(xiàn)問題。筆者前往故障現(xiàn)場(chǎng),找到上不去網(wǎng)的用戶電腦,對(duì)端到端的網(wǎng)絡(luò)線路進(jìn)行重新排查,基本排除線路物理中斷造成的網(wǎng)絡(luò)不通,根據(jù)用戶反映昨天還能正常上網(wǎng),今天突然上不去,并且也沒有對(duì)網(wǎng)絡(luò)線路進(jìn)行過改動(dòng)。
根據(jù)多年網(wǎng)管經(jīng)驗(yàn),目光就落在了放在接入交換上的那臺(tái)光纖收發(fā)器,這臺(tái)收發(fā)器已使用了五年之久,在除去外觀上的一層塵土后,首先將光纖收發(fā)器斷電,之后對(duì)連接光纖的TX(發(fā)射口)與RX(接收口)進(jìn)行重新插拔,這時(shí)要注意小心操作以防將光纖弄斷。
之后對(duì)UTP網(wǎng)線口進(jìn)行重新插拔,連接電源,收發(fā)器重啟,如果是普通的長(zhǎng)時(shí)間工作的死機(jī)故障或由于塵土導(dǎo)致的接觸不良,這時(shí)就應(yīng)該可以解決了。但還是上不去網(wǎng)。一般光纖收發(fā)器都是成對(duì)使用,在筆者來之前已經(jīng)將機(jī)房中對(duì)應(yīng)的那臺(tái)收發(fā)器進(jìn)行過一系列故障排除工作,確定了沒有問題。
通過仔細(xì)觀察光纖收發(fā)器的六個(gè)指示燈,若光纖收發(fā)器正常工作,PWR電源指示燈必須常亮,F(xiàn)X-LINK/ACT光纖鏈路指示燈、TX-LINK/ACT網(wǎng)絡(luò)鏈路指示燈需常亮或閃爍。又觀察了幾分鐘后,發(fā)現(xiàn)LINK/ACT左邊代表光纖和網(wǎng)線數(shù)據(jù)傳輸狀態(tài)的指示燈一直常亮,全然沒有數(shù)據(jù)交互的閃爍狀態(tài),且光纖收發(fā)器整體散熱比正常時(shí)略熱。在這樣的情況下,只能換掉這臺(tái)光纖收發(fā)器。在更換后,六個(gè)指示燈全亮,并出現(xiàn)閃爍狀態(tài),又可以正常連網(wǎng)了,故障排除。
這次遇到的屬于光纖收發(fā)器的“硬故障”,筆者曾排除過關(guān)于光纖收發(fā)器的諸多問題,如何精準(zhǔn)定位故障所在,給大家作一個(gè)經(jīng)驗(yàn)總結(jié)。
1.檢查PWD電源指示燈是否常亮,常亮說明供電正常,進(jìn)行下一步排除。
2.一般最常見的問題是光纖收發(fā)器中LINK/ACT左邊分別代表FX-LINK/ACT光纖鏈路、TX-LINK/ACT網(wǎng)絡(luò)鏈路的兩個(gè)指示燈有不亮的,那么網(wǎng)絡(luò)肯定是不通暢的,需檢查鏈路是否連線正常,我們可以一點(diǎn)點(diǎn)排除,如果代表光纖鏈路的LINK/ACT不亮,可以將光纖接口TX(發(fā)射端)、RX(接收端)重新插拔,檢查光纖連接器是否完好插入設(shè)備接口,看能否解決。
如果還不亮,將TX和RX上連接的光纖接口調(diào)換一下位置再重新插上。如果是網(wǎng)絡(luò)鏈路TX-LINK/ACT燈不亮,這時(shí)重新插拔后沒有解決的話,用網(wǎng)線檢測(cè)儀測(cè)一下網(wǎng)線的通斷。
完成上述操作后故障還沒有解決的話,可以考慮光纖或網(wǎng)線可能存在物理斷路(也有部分光纖收發(fā)器只有在光纖鏈路接通后雙絞線指示燈才會(huì)亮)。光纖收發(fā)器都是成對(duì)使用的,排除故障時(shí)記得要兩個(gè)收發(fā)器都按照排除故障流程走一遍。
3.檢查設(shè)備傳輸長(zhǎng)度是否與距離匹配,如果鏈路過長(zhǎng)光損耗過大(建議用用光功率計(jì)儀表檢測(cè)光衰),超過設(shè)備接收范圍,也會(huì)造成鏈路指示燈不亮。
4.檢查設(shè)備傳輸速率是否匹配。如果完全不匹配,會(huì)造成網(wǎng)絡(luò)不通。當(dāng)有半雙工的設(shè)備時(shí),光纖的傳輸距離就有一定的限制。
1.光路衰減太大,沒有超出范圍,但是已經(jīng)在接收敏捷度范圍四周。這是網(wǎng)絡(luò)丟包嚴(yán)重,打開網(wǎng)頁會(huì)非常慢。建議查檢收發(fā)器這間的通信鏈路。
2.收發(fā)器的端口與網(wǎng)絡(luò)設(shè)備接口,或兩端設(shè)備接口的雙工模式不匹配。建議做成一致的工作模式來排除故障。
3.可把收發(fā)器兩端接筆記本電腦(不要通過交換機(jī)或其他網(wǎng)絡(luò)設(shè)備),兩端ping沒問題后,從一端向另一端傳送一個(gè)較大文件,觀察其速度,如速度很慢(100M以下的文件傳送10分鐘以上),可基本判斷為收發(fā)器故障,使用此方法的前提是端對(duì)端的光纖鏈路沒有問題。
4.光纖收發(fā)器自身的溫度過高,或外界的溫度過高。光纖模塊受環(huán)境溫度的影響較大,雖然其本身內(nèi)置自動(dòng)增益電路,但溫度超出一定范圍之后,光模塊的發(fā)射光功率受到影響而下降,從而削弱光網(wǎng)路信號(hào)的質(zhì)量而使丟包率上升,甚至使光鏈路斷開。
5.如不同品牌的收發(fā)器相互的兼容性事前沒做過測(cè)試則也會(huì)產(chǎn)生丟包、傳輸時(shí)間過長(zhǎng)、忽快忽慢等現(xiàn)象。建設(shè)成對(duì)使用的收發(fā)器使用同一品牌相同型號(hào)。
此現(xiàn)象一般由交換機(jī)引起,交換機(jī)會(huì)對(duì)所有接收到的數(shù)據(jù)進(jìn)行CRC錯(cuò)誤檢測(cè)和長(zhǎng)度校驗(yàn),檢查出有錯(cuò)誤的包將丟棄,正確的包將轉(zhuǎn)發(fā)出去。但這個(gè)過程中有些有錯(cuò)誤的包在CRC錯(cuò)誤檢測(cè)和長(zhǎng)度檢驗(yàn)中都檢測(cè)不出來,這樣的包在轉(zhuǎn)發(fā)過程中將不會(huì)被發(fā)送出去,也不會(huì)被丟棄,它們將會(huì)堆積在動(dòng)態(tài)緩存(buffer)中,等到buffer堆積滿就會(huì)造成死機(jī)。通常重啟之后就可以使通信恢復(fù)正常。建議檢查交換機(jī)中大量CRC校驗(yàn)錯(cuò)誤的產(chǎn)生原因。
以上就是筆者在網(wǎng)管中關(guān)于光纖收發(fā)器出現(xiàn)問題的一些經(jīng)驗(yàn)總結(jié),希望大家遇到類似問題時(shí)能夠精準(zhǔn)定位故障所在,節(jié)省排除故障時(shí)間,少走彎路。