


摘要:本文主要介紹批處理技術在集團專線故障處理中的應用,通過批處理技術實現集團專線故障定位和修復引導,降低維護成本,提高故障處理及時率。并結合理論和工作實踐,總結了編制批處理程序實現網絡故障定位的經驗和應用批處理技術的優勢。
關鍵詞:批處理技術;集團專線;故障處理
一、引言
集團專線作為中國移動基于自身CMNET數據網以及自己的接入網和傳輸網絡資源向集團用戶提供專線接入,嚴格執行SLA服務等級協議,為用戶提供包括網絡可用率、數據包傳輸成功率、延遲時間、抖動量、故障受理時間等指標方面的承諾,從而實現集團用戶專享各種高質量的通信服務。作為集團專線維護人員,每天會面對各式各樣的網絡故障,在有限成本下光靠人工處理效率太低,如何縮短故障歷時,控制維護支出,提高故障處理及時率和用戶滿意度,使用方便、靈活,自動化程度高,功能強大,適用范圍廣的批處理技術就是一個“不二人選”。
二、什么是批處理
批處理是一種腳本語言,它應用于DOS和Windows系統中,由DOS或者Windows系統內嵌的命令解釋器(通常是COMMAND.COM或者CMD.EXE)解釋運行。通俗地說,批處理就是按規定的順序自動執行若干個指定的DOS命令或程序,將原來一個一個執行的命令匯總起來成批的執行,通過程序的運算,自動輸出對應的結果,從而大大提高效率。
批處理具有一個鮮明的特點:使用方便、靈活,自動化程度高,功能強大,適用范圍廣。批處理文件使用時在cmd.exe下鍵入對應名稱,或者雙擊該批處理文件,系統就會調用cmd.exe運行它,在系統中形成一個自動轉接的連續的作業流,依次執行每個命令或程序,中途無需操作人員介入,實現高度的自動化。由于編寫所需的代碼全部來自Windows內帶的命令,所以注冊表、文件、服務等幾乎windows的各個方面操作都可以用批處理實現,并能移植到所有運行windows系統的電腦上,這也是批處理技術能運用在各行各業的關鍵所在。
三、IP數據包的傳輸方式
IP數據包在TCP/IP協議棧中的網絡層上實現發送、轉發、接收。在網絡層,每個端系統都具有唯一IP地址,當源主機向目的端系統發送數據包時,數據包的首部包含了目的地的IP地址,當數據包到達網絡中的路由器時,路由器會根據數據包中的目的IP地址判斷下一個路由器的位置,然后通過以太網將數據包發送到下一個路由器,當數據包到達下一個路由器后,同樣又會重新委托以太網將數據包傳輸到再下一個路由器。隨著這一過程反復執行,數據包就會最終到達IP的目的地。事實上IP數據包在傳輸過程中所通過的路由器實則就是一個個不同網段的網關,它們分布在不同的網絡位置,擁有固定的IP地址,與路由協議一起實現了不同鏈路的互聯互通。
四、集團專線中的數據流
常見的集團專線有互聯網專線和數據專線,前者由運營商向集團客戶提供固定的公網IP地址用于互聯網接入業務,后者通過運營商的MPLS L3 VPN技術實現集團客戶不同區域局域網間的互聯互通。兩者是截然不同的業務,所形成的數據流也不盡相同,如圖1所示。
(一)互聯網專線中的數據流
圖1中,用戶終端1通過互聯網專線訪問互聯網,數據流從終端1出發,通過用戶交換機、用戶路由器/OUN(局域網網關)后穿越局域網進入運營商網絡,然后再通過ODN網到達BRAS1(專線網關),最后經CMnet網接入到Internet。整個數據流全程穿越了3段鏈路,分別是①局域網鏈路、②城域網接入層鏈路、③CMnet網鏈路。
(二)數據專線中的數據流
圖1中,用戶終端1通過數據專線訪問總部的服務器,數據流從終端1出發,到達BRAS1(專線網關)后通過MPLS L3 VPN技術進入BRAS2(對端專線網關),再穿越ODN網進入用戶總部局域網,最后通過交換機抵達目標服務器。整個數據流全程穿越了4段鏈路,分別是①局域網鏈路、②城域網接入層鏈路、④城域網核心層鏈路、⑤城域網接入層鏈路。
五、Ping命令在網絡中的應用
Ping命令用于確定源主機是否能與目的主機成功交換(發送與接收)數據包,再根據返回的信息,就可以推斷TCP/IP參數是否設置正確,以及運行是否正常、網絡是否通暢等。正常情況下,用Ping命令來查找問題所在或檢驗網絡運行情況時,需要逐段進行Ping測,如果所有都運行正確,可以確認基本的連通性和配置參數都沒有問題;反之,則可根據顯示信息對應查找問題。專線業務中數據流穿越的各段鏈路上均有固定的IP地址,如網關IP、端設備的IP及互聯網中DNS服務器IP等,使用Ping命令對數據流傳輸方向中關鍵IP進行檢測,通過回顯信息分析即可完成故障定位。通常情況下,互聯網業務會選擇用戶路由器網關IP及專線IP地址、專線網關IP地址、DNS服務器IP地址作為關鍵IP用于檢測時的Ping測地址;數據專線業務會選擇用戶路由器網關IP及專線IP地址、專線網關IP地址、對端專線網關IP地址、對端設備IP地址作為關鍵IP用于檢測時的Ping測地址。
六、網絡故障定位批處理文件
在網絡故障判斷過程時,維護人員會按數據流傳輸方向逐段Ping測來定位故障,這種檢測方式完全可以編寫專用的批處理文件來實現。經實踐應用,一個穩定、精準、完整的網絡故障定位批處理文件至少應包括三個部分:①輸入控制,確保信息準確無誤;②邏輯跳轉,實現按序逐段檢測;③結果顯現,讓電腦發“聲”。
(一)輸入控制
首先,在批處理文件中所有需輸入的關鍵IP地址和專線基本信息建議直接嵌入到批處理文件中,通過set命令在文件固定區域由維護人員根據填寫說明和現場組網方式完成相應設置并保存,使用時無需再進行任何配置,大大減少了使用難度并擴大了使用人的范圍,同時也能起到控制輸入信息被錯誤修改的作用。
其次,在批處理文件中添加輸入信息檢測模塊。當維護人員設置好相關參數后,點擊啟動批處理文件后會前先調用該模塊對填寫信息的完整性、格式、有無漏填和錯填情況進行檢測,檢測到錯誤后會彈出相應的提示界面并指出具體錯誤信息(如圖2所示),并指導如何修改直至完全正確,實現從源頭上控制信息輸入的準確性。
(二)邏輯跳轉
主程序通過goto命令實現邏輯上的連續檢測,采用Ping命令進行確認鏈路的連通性,對Ping測試結果采用IF %ERRORLEVEL%==0和IF not %ERRORLEVEL%==0及其他必要條件共同實現不同類型的集團專線鏈路通斷判定,當測試正常時結合判斷條件通過goto命令跳轉到對應的下一段鏈路繼續檢測,直至整條數據流目的端;當測試中檢測到鏈路故障時則會跳轉到對應故障信息顯示界面。
(三)結果顯現
網絡故障定位批處理文件執行后,無外乎會出現兩種結果,網絡連接狀態正常或異常。當網絡連接狀態正常時,會在信息顯示界面中插入網絡測試結果和常見的終端設置導致網絡訪問異常的解決方法,如無法打開網頁時檢查及設置DNS的方法;當網絡連接狀態異常時,會在故障信息顯示界面插入相關檢測信息,主要包括五部分:專線基本信息及檢測時間、鏈路故障定位、本次測試結果、引起該故障的可能情況分析、故障處理基本步驟。在此以互聯網集團專線故障為例,當無法Ping通專線網關時跳轉到故障顯示界面,如圖3所示。
七、批處理技術在處理網絡故障中的優勢
在集團專線故障處理中發現,用戶局域網問題引起的網絡故障占總故障的51.6%~67.9%(眉山移動2022年1月-4月數據)遠高于運營商網絡問題引起的故障。但由于大多數用戶無法區分網絡故障原因,很多局域網故障被誤認為是運營商網絡問題,運營商無奈中槍,客戶滿意度也受到影響。究其原因,主要是用戶不具備網絡故障判斷能力和處理能力。
如何解決集團專線中所面臨的這個問題,應用批處理技術不乏是一種行之有效的手段,它適用于所有window系統,具有廣泛的使用空間,通過編輯完全可以模擬維護人員對網絡故障進行常規測試,快速完成集團專線網絡故障定位,除此之外它還具備獨有的優勢。
(一)實現集團專線故障預處理
以往集團專線發生故障時,用戶通過售后電話或客戶經理報障,維護人員受理后趕往現場進行故障處理,通常在此期間維護人員無法有效獲取故障準確信息,只能是到場后著手排查,導致故障歷時普遍較長。如果在集團專線開通后,就將批處理文件拷貝在用戶指定的電腦上,當專線無法正常連接時,用戶可自行運行批處理文件進行故障檢測,此刻用戶成了故障預處理第一人,無需其具備任何計算機網絡技能,都能在第一時間完成故障信息收集,并通過故障信息顯示界面直觀判斷出網絡故障發生的位置。若為本地局域網故障,用戶可根據提示中的故障原因分析并結合故障處理基本步驟,自行排查或將故障信息告知辦公網絡代維人員處理;若為運營商側網絡故障,用戶可直接通過報障電話將故障信息進行精準描述,維護人員通過該信息能清晰地了解到故障情況,能更加精準地針對處理,真正做到有的放矢。
(二)特別適合無規律且短時自復故障處理
在集團專線故障中,有一類無規律且短時間內又自動修復的網絡故障最令人頭痛,當用戶報障后,往往維護人員還未到達現場,故障就自動修復了;或者在維護人員剛剛離開不久,故障再次發生。通常這類故障出現后,用戶會認為是運營商網絡不穩定造成的,要求運營商進行修復,雖說運營商通過網管信息能夠確認運營商設備狀態,但由于用戶側故障原因無法確認,最后大多情況下運營商會采用維護人員現場蹲點來捕捉網絡故障,或者采用設備替換法逐個替換直至問題不再發生,這種故障處理方式效率低、運氣成分重。
但如果引入批處理技術,精準定位這類網絡故障就變得簡單可行。2022年4月某園區內公司互聯網專線開始出現不定期中斷,每次3~5分鐘后自行恢復,非故障期間網絡運行一切正常。由于運營商使用的烽火OLT網管日志上無法提供OUN實時故障檢測信息,雖多次組織處理但由于故障間隙短,問題一直無法準確定位,故障遲遲未能解決。期間曾對用戶進行過簡單的網絡技能培訓,希望能在故障第一時間定位問題,但收效甚微。最終選擇采用批處理技術編寫網絡故障定位工具進行故障定位。當網絡故障再次發生時,用戶立即運行批處理文件,檢測發現無法正常Ping通用戶路由器,確認故障發生在用戶局域網側,然后結合故障發生時間和用戶提供的其他異常信息進行排查,最終判定為園區某臺設備啟動時負荷較大,使得和它連接的交流線路電壓不穩定,引起用戶路由器重啟導致網絡中斷,在將路由器接入電源更換到其他線路上以后閃斷故障消失,網絡恢復正常。
(三)既省錢又省時,效果立竿見影
2022年5月眉山移動東坡區公司開始了集團專線網絡故障定位工具(批處理程序)的應用,有效減少了用戶局域網故障導致的投訴,對于有基本網絡維護能力的用戶,實現了指導用戶局域網故障自行檢查、處理,減少了無關故障處理成本。經分析,5月在網絡故障定位工具應用后,局域網報障環比減少39件,與應用前相比下降15.61%。以140.41元/次的按次工單計算,節省成本5475.99元,預計全市推廣后,全年僅局域網故障處理成本能節省約26萬。
同時通過網絡故障定位工具的應用,用戶可以在上報故障的同時將檢測結果一并精準反饋,維護人員能清晰地了解到故障情況,可以更加精準地針對處理和優化解決方案,初步測算,5月份集團專線平均故障處理時長較應用前減少約0.5小時。
八、結束語
本文結合實際工作,通過批處理技術自行設計開發出集團專線網絡故障定位工具,大大提高了故障處理效率并減少了無關故障處理成本支出。通信行業中類似的應用場景很多,具有較高的分享和推廣價值,也為相關專業運維提供了一個新的參考思路。
作者單位:祝每周 中國移動通信集團四川有限公司眉山分公司
參" 考" 文" 獻
[1]謝希仁.計算機網絡.(第6版)[M].北京:電子工業出版社,2013.
[2]周自恒.網絡是怎樣連接的.(第1版)[M].北京:人民郵電出版社,2017.
祝每周(1982.10-),男,漢族,重慶銅梁,大學本科,通信工程師,研究方向:集團專線及ICT項目建設管理、IP城域網、計算機網絡。