鄧 湘 勤
(國電大渡河流域水電開發有限公司,四川 成都 610041)
水電企業IT運維管理“雙提升”的探索與思考
鄧 湘 勤
(國電大渡河流域水電開發有限公司,四川 成都610041)
摘要:目前,國內多數水電企業設立有集控中心,統一管理企業的IT基礎設施建設和運維服務。通過集中控制和統一調度,有效管理企業IT運維,提升企業管理水平和效益。為構建智能水電,促進企業管理和效益的雙提升提供完善的科技保障和技術支持。
關鍵詞:IT運維;監控;管理;效益
1前言
網絡規模的發展和擴大,使得應用產品技術日漸多樣和復雜,越來越多的企業實現了生產業務和日常工作信息化,并通過提高信息化水平而提高經營水平和管理能力,隨著網絡運用的普及和深入,企業業務的展開也越來越依賴IT(軟件)系統的正常運轉,IT部門正由“成本中心”轉變為“服務中心”、“效益中心”。IT運維作為IT管理的核心和重點部分,其作用發揮,直接決定著企業管理、效益雙提升成果。
IT運維管理部門作為企業的基礎職能部門,為企業信息系統安全穩定運行提供了重要的科技保障和技術支撐。在網絡的基礎設施建設完成之后,整個網絡處于運行狀態,IT運維部門采用相關的管理方法,對運行環境(包括物理網絡、軟硬件環境等)、業務系統等進行維護管理。目前,國內IT運維管理方式、管理手段趨同,理念相近,如何全面提升企業競爭力與可持續發展能力,完善企業運維體系,發揮IT運維在水電企業的作用,突出水電特色,促進管理和效益的雙提升,是水電企業IT運維人員的一個重要工作課題。
近年來,水電企業均開展了信息化建設工作,部分水電企業信息化基礎設施建設已初具規模,建立了相對完善的IT系統綜合管理平臺,能夠對網絡、服務器、存儲、數據庫、應用系統、機房等進行統一的監控管理;并對用戶現有的路由器、防火墻、上網行為管理、備份系統、DNS等系統進行升級和擴容,業務系統、信息系統運轉良好,取得很好的成效。正因為如此,許多企業越來越重視IT運維管理,通過引入ITIL思想,不斷完善運維制度,梳理IT運維流程,努力提升IT運維能力,從而更好的保障了企業業務系統的正常運行。

同時,在運維實踐中,也暴露出不少急需解決的問題。一是理念跟不上企業發展的步伐。從長遠看,IT系統以業務為中心的動態架構終將向以戰略為中心的知識架構發展,計算機網絡大發展必須適應企業業務的應用,企業對IT系統的要求必然越來越高,IT系統面臨IT資源整合、IT管理、IT業務個性化的挑戰。二是設備跟不上。不少企業的網絡分析技術,路由器、交換機的應用與安全技術,網絡安全事件回放以及黑客攻擊的手段、方法及防范技術,網絡安全架構設計和網絡安全設備的部署,主機操作系統和應用服務器系統安全加固等還不適應企業未來發展的需要,在實踐操作中,流程不規范、運維水平參差不齊也導致經濟效益、管理效益不突出,甚至造成操作過于繁瑣,影響效率。三是人員總體水平跟不上。
2“在哪兒”的問題
“在哪兒”就是要明確企業IT運維的現狀,通過對IT的實踐運作進行審視,運用對標的手段、統籌的方法、綜合分析公司IT運維的環境,所處的階段,找準自身的方位。
近年來,筆者所在的公司信息化工作按照“實用優先、試點先行”的思路穩步推進,先后建成了視頻會議系統、OA、網站、財務管理、人資管理、生產管理、工程管理等業務系統;信息網絡基礎架構不斷夯實,依托流域光纖通信環網和電信租用通道,公司廣域網帶寬已達到8M+水平。IT基礎設置包括硬件和軟件2大部分,硬件包括:服務器、網絡通訊設備、視頻會議設備、存儲設備等,軟件包括:操作系統、數據庫、中間件、基礎應用軟件等。
隨著各業務系統的建設,IT系統的運維工作日趨繁雜,也日益重要。客觀地說,目前公司信息化建設重點已從大規模的“基礎設施建設”階段轉向以管理創新、提升應用效益為主要特征的“雙提升”階段。公司IT運維迫切需要通過統一管理,來優化IT運維管理流程,降低故障發生概率,快速定位故障,縮短故障處理時間,提高問題處理效率。
3“去哪兒”的問題
“去哪兒”就是要明確公司IT運維的發展方向,明確目標。要把握全局,統籌規劃。IT運維服務的目標是要把80%以上的問題和隱患通過日常的巡檢、維護都能解決掉。
上世紀90年代,國內用戶開始引入IT,在完成了IT基礎架構的建設后,進入了維護和運維階段,發展到現在,IT系統的多平臺、多層次、異構性越來越為大家所認同、接受,同時,其復雜程度也對IT服務提出了更高的要求,越來越多的跡象表明:“大運維”正在成為IT基礎架構服務的未來發展方向,這也是筆者所在公司所關注的。
一般來講,IT運維的主要目的有三個:
(1)提供一個安全穩定的基礎設施平臺,為各業務系統運行提供可靠保障和運維支撐。主要通過提供硬件維保(服務器、存儲、網絡)及軟件維保(系統、數據庫、中間件等產品),為公司提供方便、快捷、安全的服務。
(2)為各個業務部門提供IT運維服務,快速處理日常問題。這就需要IT運維人員不僅要熟知不同廠商的各種軟硬件產品,而且需要對IT基礎架構理論、企業IT法規和最佳實踐有深入的理解和積累。
(3)通過自動化監控手段提高工作效率,減輕IT運維人員工作強度。以建設企業綠色數據中心為目標,使IT行業的理論標準水電行業的規范制度要求有機結合,為公司日常管理提供咨詢、集成、維護等一系列IT服務。
基于以上目的,公司在IT運維管理上不斷引入新思維、新方法,在管理上不斷創新。
說到底,IT運維管理是為公司業務服務,減少IT系統故障率,提升公司運營效益,IT運維體系建設的總目標是從業務的角度實現全公司IT資源的整體監控,并通過制定相應的流程規范來合理、高效的調配資源,使IT管理架構與全公司業務系統的管理架構相統一,使IT運維服務工作能在一個統一的管理平臺下進行。
4“怎么去”的問題

圖1 IT運維管理平臺模型
“怎么去”就是要規劃好實踐路徑。要堅持理論指導,堅持結合實際的創新,破除IT運維和其他業務部門間的障礙,不斷提升IT運維水平,保障企業業務系統高效運行。4.1建立IT運維管理平臺,實現IT設備運行可監控
首先,建立IT運維統一管理平臺,對全網設備進行全面監控。將網絡設備、服務器、數據庫、中間件、應用、IP地址、虛擬機、存儲、機房環境等統一納入監控范圍。實現故障告警、根源分析,當設備異常時,第一時間通過短信的方式通知運維人員,并迅速響應。第二,將業務相關軟硬件關聯起來,實現整體業務監控,保障關鍵業務系統的正常運行。通過建立業務故障發現、分析機制,提升業務系統運維能力。及時發現業務運行隱患。第三,可視化呈現,將我們所關心的網絡拓撲、業務拓撲、機房拓撲等已圖形化的方式展現,在同一界面展現各個設備的運行狀況和健康度,并實時展現相互關系,幫助準確、及時掌控整體系統運行情況,發揮整合的效力。

圖2 機房監控
4.2建立IT運維管理平臺,實現IT故障可避免

圖3 運維管理統計圖
建立統一的IT運維管理平臺,找到設備運行的薄弱環節,在薄弱環節有的放矢的投入人力和物力、避免潛在故障的發生。通過建立IT運維管理平臺,提早發現和準確定位問題,找出全網系統運行的薄弱環節。發現設備利用率超閾值的情況,第一時間短信通知相應運維人員,避免宕機故障的發生。經過一段時間的監控,發現部分設備資源使用率較高,一直高負荷運轉,設備運行不平衡,存在潛在的宕機風險。經及時采取相應措施,避免了重大故障的發生。
4.3建立IT運維管理平臺,優化IT運維流程
在系統中對現行IT運維管理流程進行了梳理、整合和優化,結合ITIL標準,制定統一的運行維護服務制度和操作規程,為運維人員間的協同操作提供規范和約束,包括網上保修、問題處理、機房出入登記機制等。
4.4建立IT運維管理平臺,實現IT運維效益提升
建立IT運維管理平臺,實現IT設備監控自動化,打造全天候7x24小時無人自動巡檢,故障自動告警的運維保障平臺,擺脫日常繁瑣的手動巡檢帶來的運維人力高支出,平衡由于運維工程師水平不同所帶來的波動性風險。故障處理后,將處理的結果編輯成知識文檔,納入知識庫,固化處理經驗,積累解決方案,便于重復問題的快速響應。從而不斷提升運維團隊的整體水平,提升企業運維效益。
5結語
本文從IT運維管理平臺建設的工作實踐出發,探討了水電企業運維服務管理和效益提升的工作方法。以ITIL思想做指導,建立與水電企業IT運維環境相適應的一體化運維管理平臺。幫助IT運維部門由被動的“救火”,轉變成科學有效的流程化IT運維管理,從根本上解決故障發現
和解決滯后、IT資產臺帳管理不規范、運維流程不清晰等問題。實現了全方位的IT系統管理。對網絡設備、服務器、安全設備、存儲、機房基礎環境進行整合管理,實現了對IT系統的集中、統一監控與管理。全面提升運維人員運維能力,持續推進企業的信息化建設。為構建智能水電,促進企業管理和效益的雙提升提供完善的科技保障和技術支持。
鄧湘勤(1975-),女,四川遂寧人,工程師,國電大渡河公司集控中心網絡主管,主要從事企業信息化網絡管理及運維工作.
(責任編輯:卓政昌)
工作研究
收稿日期:2015-05-20
文章編號:1001-2184(2015)03-0115-02
文獻標識碼:B
中圖分類號:TV74;S219.07;C93
作者簡介: