趙冰冰
中國電信股份有限公司南京分公司
伴隨著網絡的高速發(fā)展,網絡設備的種類和數量在大量增加,網絡用戶數量也呈現井噴式增長。網絡設備及用戶業(yè)務的多樣性發(fā)展導致網絡業(yè)務的配置越來越復雜,新開業(yè)務的配置量及存量用戶的維護數量也越來越多。這對網絡操作維護人員的業(yè)務技能要求顯著提高,工作量也大量增加。面對諸多型號的設備及復雜的業(yè)務種類,維護人員不斷地探索提高配置及維護效率的各種工具,不斷提升服務質量。
從最初的手工配置,到簡單的腳本配置,再到系統化的配置,經過不斷的探索與優(yōu)化,我們找到了一個靈活高效的配置系統。此系統改變了傳統IT系統操作黑盒子的模式,可根據需求靈活修改配置指令、快速添加設備型號,具有較強的擴展能力,能夠很好地適應網絡的快速發(fā)展。
此階段網絡發(fā)展較為緩慢,設備及用戶入網數量較少,用戶對時效性要求較低,簡單的手工配置即可滿足網絡配置維護要求。
網絡發(fā)展初期,用戶業(yè)務類型較為單一,多為簡單的撥號或專線上網業(yè)務,用戶業(yè)務開通時,維護人員登錄設備網管或直接Telnet到設備,依據業(yè)務類型直接進行相應的命令行配置即可完成業(yè)務的開通需求。此時維護人員僅需掌握少量的設備指令即可完成業(yè)務開通及維護的要求。網絡維護時,由于設備種類較少,業(yè)務簡單,僅需最基本的查看命令即可,如圖1 Telnet方式登錄設備查看專線業(yè)務配置。此方式對維護人員的要求相對較低。
圖1 Telent方式登錄設備查看專線配置
隨著網絡的發(fā)展,業(yè)務量逐步增大,設備種類及數量增多,業(yè)務配置及設備入網需求急劇增大,此時簡單的手工配置已不能滿足業(yè)務的快速發(fā)展需要,同時,配置數量的增加還導致維護人員工作量大幅增加,維護人員數量需求增大,維護成本增加。如何解決業(yè)務快速發(fā)展與維護人員缺少的矛盾?自動化配置工具應運而生。
網絡配置規(guī)范化,為自動化配置提供了可能性。我們將全網配置進行統一規(guī)范化,同一型號不同設備間配置模板化,如專線業(yè)務均采用QOS限速模式,而非既有QOS形式又有POLICY-CAR形式,撥號業(yè)務使用同一子接口號等。如此一來,新業(yè)務上線需全網部署時則可使用同樣的配置命令,亦或是批量配置用戶時僅修改用戶相關參數即可。同一型號大量設備重復性的配置工作既耗時耗力又毫無技術含量,則可使用IT工具模擬人工實現批量配置。現網的維護中多采用簡單的
重構與創(chuàng)新——網絡技術編程工具,將需配置的指令寫入程序,僅需導入用戶及設備參數即可實現設備自動批量配置。
SecureCRT的腳本可實現簡單的批量業(yè)務配置功能。常見的修改設備登錄口令、新增撥號域名等均可使用SecureCRT腳本來實現。如實現修改設備登錄口令的功能,首先將所有需配置的設備IP及新口令整理成表格;其次將設備修改口令的命令按照配置順序編輯成vbs腳本,腳本功能包括從表格讀取內容和登錄設備進行操作兩大部分;最后在Telnet中運行腳本,如圖2所示,腳本運行時根據表格登錄不同設備,同時依據表格內相應的新口令對設備口令進行修改,以此實現大量設備的口令修改功能。依賴腳本的快速配置能力,我們將匯聚及OLT的登錄口令全部實現腳本化修改,原本每臺設備需要5分鐘時間修改,現在全網2286臺設備一個人一天即可完成全部的口令修改工作。
這種工具大大提高了配置效率,節(jié)省了大量的人力,降低了對維護人員的技能要求。此工具類似EXCEL中的宏,特點是簡單易掌握,但是靈活性較差,僅能滿足簡單的業(yè)務需求。
圖2 Telnet下運行腳本
隨著業(yè)務需求的增多,腳本的數量不斷增長,網絡維護中運行腳本的操作也開始成為一項體力活,此時對自動化運維系統的需求越來越強烈。我們開發(fā)了自動化的運維系統取代人工快速選擇腳本并登錄設備進行配置。此時的系統化運維已經實現真正意義上的運維IT化。
這里的業(yè)務可以不僅僅局限于用戶的業(yè)務,可以是廣義的業(yè)務,只要是需要在設備上進行配置的內容均可理解為業(yè)務,如設備入網時需要配置的管理地址可以理解為業(yè)務。設備的入網及專線業(yè)務的開通均可使用系統自動實現。在實現專線業(yè)務的開通時,系統廠家提前將不同型號設備的專線開通及注銷指令寫入系統后臺,當需要開通專線時,系統自動根據工單判斷需配置的設備型號,同時讀取工單中用戶的參數(如用戶速率,用戶vlan等),生成實時的設備配置指令,自動登錄設備進行配置即可完成業(yè)務的開通。系統平均每天可處理200個用戶的業(yè)務開通或注銷,節(jié)省了約四人/天。同時系統具備日志功能,可查看系統登錄設備時操作的日志。當自動配置報錯時,維護人員可根據日志進行排錯。如此一來,維護人員僅需在系統報錯時介入,大大減少人力維護的成本,提高開通效率。
這類自動化運維系統通常由專業(yè)的IT公司開發(fā),系統對設備的配置也在后臺進行,各種配置指令由開發(fā)人員寫入后臺進行維護,系統使用人員僅可查看配置結果及相關日志。系統的開發(fā)為維護人員節(jié)省了大量的時間和精力,同時規(guī)范化的配置也大大提高了網絡配置的正確率和規(guī)范性,提高了網絡維護的效率。
圖3 專線自動配置系統工單
自動運維系統在網絡維護中發(fā)揮了很大的作用,提高了業(yè)務的開通速度。但實際工作中,業(yè)務種類的增加、網絡設備系統版本的升級、設備型號的變更等原因均會導致配置指令的變化。這種變化必然會導致配置腳本的變化。由于所有配置腳本均在系統內部進行配置,配置指令的變更必須由系統廠家進行后臺操作,所以早期的自動運維系統對廠家的依賴較大,且這種對系統的更改周期較長,需求響應慢。如何實現設備配置腳本界面化,讓維護人員可自行修改配置命令成為我們探索的新目標。
新的運維系統正是基于設備配置指令與系統底層徹底分離的目的,將配置指令置于系統前臺,使指令的修改不涉及系統底層的變更。新系統底層僅處理與流程相關的內容。不同業(yè)務類型的配置指令以各個模板的形式呈現在系統界面。系統底層提取業(yè)務類型及設備型號,動態(tài)匹配業(yè)務模板。系統核心則為模板指令與實際執(zhí)行的設備指令間的轉化。系統動態(tài)選擇模板后,將模板指令翻譯為設備指令并登錄相應的設備進行配置,完成整個業(yè)務配置。同時系統擁有與其他系統的接口,自動完成業(yè)務工單的生成等功能。系統具體架構如下:
圖4 新系統架構圖
我們將匯聚、OLT及ONU設備的入網均納入新系統,實現了設備的快速化規(guī)范入網。當有新設備入網時,人工選擇設備入網的拓撲后,系統自動根據設備類型及業(yè)務登錄相應設備進行配置,如設備管理地址、語音地址、撥號業(yè)務等內容。當業(yè)務配置指令變更時,維護人員僅需將相應的業(yè)務配置模板內容進行修改即可。若業(yè)務類型有增加,我們可以通過增加業(yè)務模板的方式來滿足新增業(yè)務的需求。上述所有的操作均可在系統界面進行,而無需廠家后臺介入。模板管理界面如圖5所示。新系統適應了現在網絡業(yè)務類型增多、設備指令多變、設備型號變化的特點,可快速實現業(yè)務變化的需求。業(yè)務上線實現周期由以前的平均兩個星期縮短至現在的兩天,大大縮短了業(yè)務上線時間。在近期DHCP集中認證改為分布式session級認證的改造中,由于命令模板可快速修改,新入網設備迅速實現了session級認證的配置。
圖5 業(yè)務模板管理界面
伴隨著運維IT化的大趨勢,IT化運維在網絡運維中扮演了重要的角色。無論是從節(jié)省人力、提高效率的角度還是操作正確率的角度,IT化運維無疑是網絡運維發(fā)展的必然趨勢。運維指令模板化的IT系統符合了網絡設備更新快、業(yè)務種類不斷增加的特點,將會受到越來越多運維人的青睞。