張元龍+廖曉群
摘要:隨著高校私有云平臺的建設,實現IT資源的大整合、統一管理和按需分配,云平臺的運維至關重要,大量的應用系統相繼上線,傳統的運維模式無法滿足云平臺的運維要求,如何解決云平臺運維面臨的挑戰。根據高校私有云平臺建設架構和云平臺運維特點,構建一個智能化、規范化、標準化的云平臺運維模式。
關鍵詞:私有云;運維管理;安全
中圖分類號:TP315 文獻標識碼:A 文章編號:1007-9416(2017)05-0252-01
隨著私有云平臺在高校的落地,各類信息化應用系統大量上線。各種問題接踵而至,一方面來自云平臺的運維,另一方面來自云平臺的管理。如何有效的對云平臺進行運維管理,是目前面對的巨大挑戰,也是信息化建設快速、穩步發展的保證。本文主要介紹了云平臺的架構以及云平臺運維的特點,構建云平臺的運維管理模式,以保證云平臺安全、穩定的運行。
1 云平臺架構
目前,高校的私有云大都是IAAS云平臺,即基礎設施即服務。云平臺是基礎設施的集合,包括服務器、存儲設備、網絡設備以及其他設施,其最重要的特點是按需分配,以服務的方式交付計算、存儲和網絡的基礎設施服務。
云平臺技術已經相當成熟,一般云平臺架構包括物理資源層、虛擬化層、云服務層、用戶四部分。其中物理資源層包括服務器、存儲、網絡設備以及其他設備。虛擬化層包括計算虛擬化、網絡虛擬化、存儲虛擬化。云服務層包括云管系統和自助服務門戶。
從云平臺的架構可以看到,云平臺囊括了除機房設施外的所有硬件設備,可見相當復雜。隨著云平臺的落地,建設初期階段結束,云平臺的大量工作重點轉移到后期運維,可見運維管理的重要性。
2 云平臺運維管理的特點
云平臺包括基本的硬件設備,操作系統、中間件、應用軟件軟件資源,同時具備對云平臺內的虛擬資源和物理資源的實時監控。由此可以看出云平臺運維的特點主要體現在資源按需分配、資源集中管理和資源監控統計上。
2.1 資源按需分配
云平臺服務器、存儲、網絡設備集中且規模大、密度高、擴展靈活快速以及高可靠性。云平臺將軟硬件資源以服務的方式提供給用戶,用戶按需使用。按需分配主要體現著云主機的彈性擴展以及靈活的資源分配上,最主要的是計算和存儲。按需分配的優點在于用戶不需要對IT資源的計算能力、存儲能力、網絡能力的大小以及后續系統升級帶來的升級服務進行考慮,用戶只僅需要按需申請就可以了,極大的加快應用系統的上線、升級。
2.2 資源集中管理
云平臺的資源集中管理體現在所有的軟硬件資源通過云平臺,依托校園網為用戶提供服務。資源包括網絡資源IP的分配、計算資源、存儲資源以及軟件資源,將軟硬件資源以虛擬機的形式提供給用戶使用,由云管理平臺協調完成。云管理平臺管理物理資源、虛擬資源、軟件資源以及其他高級服務功能。集中管理最重要的是確保各資源之間的協調,例如,如果一臺物理服務器宕機之后,業務遷移后是否能保證其他資源能夠承擔這臺宕機的服務器應用。集中管理中需要確保資源的預留,計算資源按照一個計算節點資源的虛擬資源進行預留,存儲資源按照每個卷的百分之30進行預留,一旦資源超過了預留值,資源的擴展就需要考慮了。
2.3 資源監控統計
云平臺的資源監控包括虛擬機的各項指標的實時監控、云平臺監控以及服務狀態監控,虛擬機的監控包括CPU、內存、存儲以及網絡使用率。資源監控主要有三方面:一是云平臺中虛擬機的性能狀況,二是物理資源(計算和存儲)的使用狀況,三是各個性能指標的異常情況。資源的統計包含CPU、內存、存儲、網絡等一段時間的平均值、最大值、最小值,軟件的使用狀況,以及其他相關統計。通過資源的監控統計,對云平臺的后期擴容以及資源的規劃,對云平臺的潛在故障的提前發現以及提前修復,同時對故障進行報警都非常重要。
3 云平臺運維管理模式
云平臺是一套復雜的、規模龐大的IT資源提供中心,為保證平臺穩定、安全、高效的運行,其運維管理應具備規范化、安全性、自動化的特點。目前的私有云運維方式的流程為:私有云的運維管理人員管理所有軟硬件資源,應用運維人員通過互聯網VPN撥號鏈接到校內網內,通過遠程連接進行運維管理,業務管理人員在校內同樣通過遠程連接進行應用系統的管理。
3.1 規范性
有序的管理如此龐大的資源,必須要有一套操作規范,包括云平臺管理人員操作規范和云平臺用戶操作規范。云平臺的運維參與者有用戶、應用維護人員、云平臺運維管理人員,如何有效的實現對IT資源的運維管理,規范化是必要的。云平臺上的資源大,應用程序多,云平臺一旦故障,直接會導致全校的信息化應用系統的癱瘓,影響正常的教學、科研、管理工作。大多數的故障都是人為操作引起的,因此云平臺的操作規范性是必須的,結合權限管理,能夠有效的避免因操作人員的操作失誤導致的業務中斷。
3.2 安全性
安全對信息化來說是非常重要的,也是一個國家戰略。作為信息化平臺的運維來說,安全也是至關重要的。云平臺的安全體現著云平臺本身,操作系統,應用系統等幾個方面。云平臺本身的安全由廠家定期巡檢,操作系統的安全依靠漏掃平臺確保安全,應用系統安全依靠云殺毒軟件部署在每個云主機來保證安全。其他的包括出口防火墻以及云平臺的七層軟防火墻的設置,對特定的端口進行開放,預防網絡蠕蟲、DDOS攻擊等。
3.3 自動化
信息化建設的不斷深入,云平臺的資源規模的擴大,云平臺運維管理的難度、復雜度、工作了日益增加,傳統的人工運維管理不能滿足當前發展要求。云平臺的運維包括日常巡檢、模板維護、故障處理等工作。日常巡檢工作每天對平臺進行健康巡檢和資源的性能指標的異常巡檢,為提高工作效率,可以對日常巡檢工作編寫成腳本文件定期執行任務,提取有效信息進行查看,提高了系統日常維護工作效率。如果是簡單故障,將按照提前寫入系統的處理流程腳本,進行處理,并將故障日志信息進行留存,以便后期進行查看,分析原因。云平臺的運維自動化是實現運維智能化的基礎。
4 結語
云平臺已經成為技術主流,各種應用系統都遷移到云上,云平臺安全、穩定、高效運行的保障是云平臺運維管理體系的建立,是保證信息化建設、教學、科研工作正常進行的支撐。在后續的工作中,結合實際情況,構建一套完善的運維管理體系,實現云平臺的運維管理智能化、規范化、標準化是必然要求。
參考文獻
[1]薛新民.云平臺機房特點及運維管理研究[J].信息技術與標準化,2015,(06)66-69.
[2]張艷輝.云平臺運維管理探析[J].信息技術與標準化,2014,(11)64-67.
[3]張四海,張萬光.高校IT運維服務面臨的挑戰與機遇[J].中山大學學報(自然科學版),2009,(S1):235-237.
[4]劉偉.基于Vmware虛擬化的云平臺運維研究[J].數字技術與應用,2015,(12)124.
[5]潘曉霞,周亮彪.私有云IT運維管理平臺研究[J].科技資訊,2015,(12):3.endprint