文/劉昱

山東大學青島校區規劃面積3000 畝,可滿足25000 名學生和2000 名教職工學習、生活和教學科研的需要。隨著青島校區的成立,由濟南、威海、青島三地共八個校區形成“山東大學系統”,使山東大學成為中國地區最大、系統相對最完善的高校,也將帶動山東大學進入全新時代,向創建世界一流大學邁進。
隨著大數據、物聯網、互聯網+、移動互聯等信息化應用不斷深入,信息化與山東大學的教育教學和科研、管理、生活已經深度融合,成為了學校發展的重要支撐。為了解決傳統校園網在網絡部署、運維和管理等方面長期存在的諸多問題,山東大學青島校區校園網建設采用SDN 架構,在控制區部署SDN 控制器、認證系統及DHCP 等,核心設備全部為100G 骨干網,匯聚和接入設備1500 多臺,無線設備6700 多臺,滿足業務高性能需求,智能化終端接入數量約10000 多個。
隨著學校基礎設施建設日趨完善,如何高效的運維和管理這部分設施和應用成為了學校信息中心新的挑戰。
基礎設施品牌眾多、種類復雜,通過傳統的人工管理方式,不僅效率低下,而且被動式的運維體系,無法優先于用戶發現潛在的問題;隨著接入網絡的終端日趨增加,對于終端和IP 地址的管理變得更加復雜和困難,無法及時追溯終端的位置信息和IP 地址的分配情況;用戶的上網日志存在著大量的數據價值,有利于管理員進行定位溯源,如果僅僅將日志分散于網絡設備中,將失去數據的價值。
隨著山東大學青島校區信息化建設的深入推進,學校工作對校園網絡的依賴性越來越強,對網絡的穩定性和可靠性也提出了更高的要求。完善的IT 運維管理體系能夠保障網絡基礎設施的穩定和高效運行,能夠改善業務的可用性及可靠性。鑒于此目的,山東大學青島校區構建了一套以基礎設施數據為基準,多方運維數據聯動的新型IT 運維管理體系,有效提升了整體運維效率,實現了管理可視化、數據多樣化和效益最大化。
目前青島校區核心網絡已率先實現了100G 互聯,樓宇上聯核心全部支持擴展到40G/100G,樓宇接入全部通過萬兆上聯匯聚,有線網絡終端全部實現千兆接入;無線網絡使用超過6700 臺最新的802.11ac wave2 無線AP,實現校區Wi-Fi 全覆蓋。
為有效監控青島校區這張有線無線融合網絡,避免在多套運維系統之間來回切換,貫徹一個平臺原則,在青島校區部署了一套智能IT 運維管理系統。系統可自動對現網中運行的交換機、路由器、安全設備、無線控制器、無線AP 實時全面的監控。在統一的平臺上實現全方位的資源監控,通過數據收集和處理進行集中展現,實現性能數據、告警數據并行輸出,并通過3D動態建模,實現資源動態可視化管理,構建IT 運維人員全新運維視圖。
智能運維系統可自動計算有線及無線網絡設備之間的連接關系,以層級拓撲方式清晰展現整體學校網絡結構。拓撲圖中(如圖1)以不同顏色直觀展示設備及鏈路健康狀態,并支持展示鏈路流量信息、動態實時更新,幫助運維人員掌控全局網絡運行狀況。

圖1 學校網絡結構中的設備及鏈路健康狀態
在學校信息化建設過程中,業務系統建設的運行狀況直接體現信息部門的服務水平。如果業務系統出現故障,將導致全校師生無法進行正常教學和學習。因此對于業務系統的監控,青島校區采用了CFIA 理論樹形邏輯關聯算法為核心的監控體系,以應用系統為核心,結合該應用系統關聯的網絡設備、服務器、數據庫、中間件等故障信息,進行聯動計算,計算出業務的健康值,并且以業務拓撲方式直觀呈現,清晰展現各層IT 資源的結構脈絡,當業務出現異常時,可從故障點自上而下的溯源分析,實現事前預警、事中感知、事后追溯。
隨著學校接入網絡終端激增,需要采用更加智能的方式來管理網絡和終端。青島校區通過集成的核心服務、工作流和自動化,關聯網絡設備的接口數據、網絡設備的機柜位置數據、配線架信息數據、房間墻插數據、無線AP 的位置數據以及上網終端數據,構成有線無線終端上網軌跡鏈,支持網絡設備、用戶終端和IP地址之間關系的深刻洞察,提高安全性,確保終端始終可追溯性。
隨著移動互聯網迅猛發展,利用移動互聯網技術提升學校的運維服務和效率,無疑是一項新的嘗試。青島校區構建了一套基于智能運維管理平臺開發實現的移動端智能運維系統,通過在移動端,可以隨時隨地接受來自運維管理平臺的告警產生信息和告警恢復信息,并且可以聯動運維流程進行移動化處理,例如提交服務請求、故障申報及流程審批處理,真正實現了運維的移動化,不必再受位置和空間的限制。
運維管理范圍不僅只管網絡設備,用戶的上網信息數據同樣重要。青島校區構建了一套以用戶賬號信息為基準,覆蓋用戶終端信息,NAT 數據的全日志記錄,將網絡行為數據與用戶標簽數據關聯,建立完整的用戶網絡行為數據模型,組成最直接簡潔的數據鏈:誰(賬號)在哪里(位置)用什么(終端設備)干了什么(在網絡中做了什么);將傳統的以IP 為標識的行為數據變為以賬號和終端為標識,溯源更精準。
在進行運維日志系統建設過程中,青島校區網絡運維人員探索了一條新的思路,可以基于用戶的行為數據進行分析,例如可根據用戶身份(如本科生、研究生、教職工)分析他們的訪問行為,同時從時間以及院系、年級等標簽維度進行分析,了解不同群體的行為特點,從而更有針對性的提供IT 運維服務。又例如可根據網站域名統計用戶訪問量,獲知哪些內部發布資源的訪問量最高,并基于此及時調整資源帶寬分配策略以及資源服務器數量;同時可統計校內學生訪問哪些網站最多,獲知學生的日常動態。

圖2 智能IT 運維體系
山東大學青島校區智能IT 運維體系(如圖2)是應用大數據、智慧運維、移動運維等新IT 解決方案在運維工作中的成功實踐,運用新型IT 技術解決教育教學中的實際需求,將在未來教育行業形成常態。同時山東大學青島校區將繼續探索新的技術路線,努力打造三地一體化運維體系,構建“集中化、一體化、智能化”的設計模式,分層設計,實現功能總集成、流量總調度、資源全監控,提升三地協同運維的能力。