李 季
(中移鐵通有限公司河北分公司,石家莊 050000)
“691”是互聯網用戶撥號上網過程中最常出現的故障代碼,通常指寬帶用戶在發起PPPOE連接階段,因業務域上的用戶名或密碼無效而被拒絕訪問時所返回的寬帶連接錯誤代碼。通過對投訴數據的對比分析,造成提示錯誤“691”可能的原因大致分為以下幾類:用戶數據一致性校驗失敗;用戶名或密碼錯誤;電話或寬帶到期欠費造成;服務器無反映,(機房用戶端口錯誤,或用戶寬帶帳號未被激活);域名出現錯誤;用戶硬件故障。
反復對用戶投訴信息數據的整理與分析,排除掉因用戶自身原因導致的信息認證失敗后,因網絡設備故障原因逐漸凸顯出來。客戶第一次正常上線時,在Radius系統中會記錄客戶請求中所攜帶的四元組信息,下次客戶再次上線時,由Radius將此次上線所攜帶的五元組信息與第一次上線記錄信息進行比對,一致則審核通過,若不一致則審核不通過。四元組信息包括:Bras設備標識、Bras設備端口、內層Vlan、外層Vlan。

圖1 現場模擬故障倒換實驗
為進一步驗證網絡側設備割接或倒換時導致用戶側故障,在某地開展現場模擬故障倒換試驗(見圖1)。測試驗證標準:故障后業務倒換到備用平面上去,由于Bras向Radius傳送的是四元組信息為物理信息,倒換后四元組信息發生變化,查看返回結果,若返回“691”錯誤,則證明在物理信息下,故障倒換會引發“691”問題。測試結果:逐項改變四元組中單個元素,實驗發現四元組中的任意一個元素發生改變,都會導致Radius認證失敗,從而在客戶端電腦上返回“691”錯誤,導致客戶網路連接失敗,多次驗證結果表明引發“691”問題的概率為100%。
為解決此問題,我們準備了多個解決方案,并進行了方案的對比,從有效性、可實施性、經濟性、安全性、失效性五個維度制定了對策評價,進而進行方案實施。第一步:調查網絡資源,確定調整對象;第二步:物理信息向虛擬信息數據改造,針對四元組中內容,逐項進行改造,內外層Vlan改造同時進行。
設備標識改造前,Radius以單臺Bras的Loopback地址作為設備標識,因為Loopback地址是采用公網地址,因此具有唯一,主備兩臺BRAS設備因設備標識不同,因此Radius判定為不同的設備。改造后,在Radius設備上建立標識組,將主備兩臺設備的設備標識建立一個虛擬的標識組,當Radius進行認證時,以虛擬標識組為單位進行判定,標識組內的兩臺設備判定為相同。
設備端口改造前,Bras將設備的物理端口信息報送給Radius,Radius以Bras物理端口信息并作為判定依據,主備兩臺Bras上配置的物理端口不一定相同,若不同,則Bras1上用戶倒換至Bras2上時,會出現認證失敗,導致返回“691”錯誤。改造后,將主備Bras設備的物理端口,虛擬成一個相同的虛擬端口,Bras將虛擬端口信息上報給Radius作為判定依據,主備Bras的虛擬端口信息相同時,則此項認證成功。
Vlan改造前,主備Bras設備接入端口下配置的Vlan可能不同,Bras的Vlan信息上報給Radius作為判定依據,若主備BRAS配置的Vlan不同,則導致Radius判定失敗,而返回“691”錯誤。改造后,將主備Bras設備接入端口下配置相同的Vlan,上報到Radius后判定通過。
網絡側設備改造工作完成后,進行了測試及驗證。實驗環境下的數據部署及模擬測試,當主用鏈路中斷時,業務會自動倒換至備用鏈路,倒換測試正常,且Radius認證順利通過,用戶獲取到IP地址,完成寬帶上網連接。
方法推廣實施后,寬帶用戶投訴數量同比下降明顯,有效減少了因客戶投訴造成的負面影響,提高了用戶滿意度。歸納總結本次技術方案的實施,主要是通過將四元組信息由物理信息修改為虛擬信息,提高了家庭寬帶業務倒換的認證成功率,實現客戶對網絡故障的“0”感知,用戶體驗得到了整體提升。