BRAS即寬帶遠程接入服務器,是面向寬帶網絡應用的新型接入網關,它位于骨干網的邊緣層,可以完成用戶帶寬的IP網的數據接入。通常作為核心設備位于網絡結構的最上層,主要完成兩方面功能,一是網絡承載功能:負責終結用戶的PPPoE連接、匯聚用戶的流量功能;二是控制實現功能:與認證系統、計費系統和客戶管理系統及服務策略控制系統相配合,實現用戶接入的認證、計費和管理功能。
筆者單位的BRAS設備和上層路由器依靠BGP動態路由互聯,兩者之間路由的學習,保證了數據的正常轉發。相反的,如果路由學習錯誤,就會導致數據無法轉發,從而影響互聯網業務。本文從用戶反映網絡故障,撥號成功打不開網頁這一現象開始排查,并運用ping、trace和show命令,將網絡故障準確定位在了BRAS上地址池設置重復,進而導致路由學習錯誤,并最終引發網絡故障。接下來就詳細介紹一下網絡故障的處理過程。

圖1 查看路由器 10.219.144.0路由學習情況
近日,某同事向我們反映,有部分互聯網用戶出現故障,具體故障現象是撥號成功但打不開網頁,需要多次撥號后,才能正常上網。
根據用戶反映的時間節點大都在晚上,我們在機房搭建測試環境。經過多次撥號后抓取到了故障現象,即撥號成功打不開網頁。使用ipconfig查看到設備撥號成功后的IP地址是10.219.144.2,Ping網關10.219.144.1是沒有問題的,也沒有丟包和延遲大的現象發生。但是Ping核心路由器(10.253.0.19)就出現超時的現象,這樣就可以斷定問題出現在路由器和BRAS之間。
為了進一步驗證故障的環節出現在路由器和BRAS之間,我們使用trace命令對互聯網出口進行了跟蹤,發現數據只能跟蹤到BRAS,根本到達不了路由器。接下來登錄到核心路由器上,使用命令show ip fordwing route查看關于10.219.144.0路由的學習情況,如圖1所示。
通過圖1可以看到,在核心路由器上可以學習到兩條包含10.219.144.0網段的路由,即10.219.144.0/22和10.219.144.0/24,這兩條路由均來自不同的方向,其 中10.253.139.50即出現故障的BRAS,而10.253.139.2是另外一臺BRAS。路由器學習這兩條路由都能將他們轉發出去,但是數據回程的時候,它會根據路由最長匹配原則優先匹配10.219.144.0/24的地址段,從而轉發給10.253.139.2這臺 BRAS,這樣發生故障的BRAS用戶就上不網,因為它所在網段的子網掩碼比較短。
通過上面查看路由轉發明細,可以查看到路由轉發存在問題,具體情況是同一個網段從兩個方向學習到。根據路由最長匹配原則,在路由轉發的過程中匹配上子網掩碼較長的網段,從而導致路由轉發到其他BRAS設備。
找到故障的誘因后,登錄到故障的BRAS上,將IP地址重復的地址池做了相應的修改,從而達到解決故障的目的。具體配置命令即:


上面通過進入地址池,首先刪除了原有地址池的IP地址,然后在vbui接口下刪除了接口地址,緊接著又重新定義接口地址,最后在地址池中添加IP地址段即可。在完成BRAS上新的地址池配置工作后,使用測試環境PPPoE撥號后可以獲取到新地址池的IP地址10.219.212.2/32,該 IP地址訪問Internet也沒有問題,故障得到解決。
從得知用戶故障,并根據故障出現的時間節點,而后在機房搭建測試的環境抓取故障現象,并使用一系列ping、trace和 show命 令,準確定位了故障原因即路由在轉發上出現異常。具體原因是同一個網段路由轉發出去沒有問題,但是路由回程時會根據路由最長匹配的原則,轉發到其他BRAS設備,從而導致路由轉發故障。根據故障原因,通過修改重復的IP地址池后故障得到解決。
通過此次故障的排查,充分認識到IP地址池設置重復帶來的負面影響,為此我們將設置專人保管IP地址,專人專用,從而杜絕IP地址重復配置的事件發生,并及時做到數據的更新,同時在新的IP地址添加后,查看路由轉發表,對路由的學習情況進行比對,使用這些舉措在源頭上有效控制IP地址的合理使用,保障用戶的較好體驗。