當前運維已由監控告警的初級形式向著自動化、智能化方向演進。進入運維4.0時代后,通過引入網絡流量分析數據來實現針對大量應用、業務日志的集中式高效分析。
成都科來軟件有限公司技術經理齊宇飛(如圖1)解釋了運維新時代的實現途徑,即以大數據和機器學習為手段,整合現有多種監控數據和業務數據、事件,結合原有的人工運維操作等,實現復雜能力的工具化,進而實現運維操作的自動化,或稱之為“AIOps”,如圖2。
科來以網絡全流量分析作為切入點,努力實現以上目標,但要實現全流量的分析并不簡單, 對于數據中心而言,傳統數據中心與云數據中心的運維也有所不同,齊宇飛認為,第一,如何獲取流量,比如有些數據中心是通過SDN的流量,它并不是那種傳統上可以做鏡像的,而科來是可以通過一定手段去實現的;第二是整體處理性能,當萬兆口流量出現了,整機處理能力能不能跟上;第三,是否支持數據中心級的部署模式,因為一個數據中心有無數多的點要去采集,所以構架一定是分布式的,多點采集,到統一的分析中心匯總;第四,在海量數據中如何找出問題點。

圖1 科來 齊宇飛

圖2 AIOps框架圖
現代化的數據中心是全流量分析的重要應用場景,在數據中心側,要能夠實現應用的全局監控,快速準確的展現應用和業務運行狀態,同時對于應用路徑的各個環節也必須實現全路徑監控。不僅如此,還要考慮云計算虛擬化環境、SDN、移動互聯網等場景,并能在應用交易路徑的所有環節都要部署流量采集點,并加以統一視圖的分析。
在IT團隊建設上,新一代的智能運維平臺不能僅面向某一個團隊,網絡、應用、研發、安全等各部門的配合也是業務穩定運行的關鍵,智能運維平臺應具備多層次的監控運維能力,既針對特定部門的特定需求提供精準的監控和操作工具,也可以針對部門間配合協調需求,提供集成化監控分析和操作手段。
在未來,智能運維是運維發展的重要方向,而基于全流量分析技術則是實現智能運維的重要手段之一,在此次“2018中國數據中心建設論壇”上,科來榮獲“2018企業級數據中心建設十大用戶信賴品牌”獎。