覃國孫



【摘 要】文章首先根據云管理平臺的基本特點介紹了基于虛擬化的云管理平臺的總體結構設計思路,然后以廣西廣播電視監測中心的監測監管云管理平臺為例,介紹了云管理平臺的功能架構及其實現,對企事業單位構建私有云管理平臺具有一定的參考意義。
【關鍵詞】云管理平臺;虛擬化;高可用
【中圖分類號】TP311.52 【文獻標識碼】A 【文章編號】1674-0688(2017)04-0030-03
0 前言
一個完整的云計算數據中心必然包含云管理平臺,它也是云數據中心的核心部分。云管理平臺的創建,一是為了提高資源的利用率,簡化資源和服務的管理和維護,減少數據中心的運營成本;二是為了通過快速、簡單和可擴展的方式創建和管理大型、復雜的IT基礎設施(服務器、網絡、應用、存儲設備等)。本文旨在研究設計和實現一種既符合云管理平臺的基本特點,又貼合實際工作應用需求的虛擬化云管理平臺。
1 云管理平臺總體結構設計
本文提出的云管理平臺的技術思路主要從以下幾個方面去研究和設計,其總體結構圖如圖1所示。
1.1 資源池化管理
通過對服務器和網絡設備等硬件資源進行虛擬化處理,形成虛擬層面的資源池。該資源池可管理物理資源、虛擬資源、存儲資源和網絡資源。同時,可按需分配資源,為每一套應用系統提供基礎的計算能力、存儲能力及網絡能力。
當資源池中的資源不夠時,平臺能快速地將新增加的物理資源直接池化,平臺可自動識別新資源,在增加硬件資源的過程中不需要再做其他設定,由平臺自動進行管理。虛擬服務器節點的增加由管理平臺對虛擬服務器鏡像進行復制即可實現業務服務器的增加,整個過程的資源分配由平臺管理軟件自動實現,減少了人工管理成本。
1.2 高可用管理
采用從虛擬機、應用程序和業務數據3個維度進行高可用管理的策略來保障部署在云上的業務的連續性。
1.2.1 虛擬機高可用
管理平臺底層設計采用分布式文件系統,數據多備份,自動檢測故障,自動恢復數據,可以保證虛擬機硬盤資源的安全性。CPU、內存和存儲都化為虛擬資源被加入到資源池中,虛擬機可以在資源池中的任意物理機上啟動,并配合虛擬機動態切換機制,保證虛擬機的高可用。通過偵聽虛擬機的網絡和服務提供的Heartbeat接口,在短時間內完成虛擬機狀態的判斷,并創建新虛擬機接替業務程序,切換時間視虛擬機的操作系統的不同而有所變化。
虛擬機鏡像采用支持寫時復制的qcow2鏡像格式,以鏡像模板加快照的方式創建和還原虛擬機。虛擬機中的業務應用進行升級更新時,可先在后臺復制的一臺虛擬機中進行應用升級,待該克隆虛擬機測試通過后快速替換運行原應用程序的虛擬機,采用這種虛擬機創建替換方法,使系統應用不發生中斷,保證業務的連續性。
1.2.2 應用程序高可用
管理平臺同時為虛擬機中的應用程序提供Heartbeat接口,實時監控應用程序的健康狀態,一旦監控到當前應用程序與管理平臺部署的心跳檢測出現異常,管理平臺在預設閾值時間內將自動關閉當前的虛擬機,啟動備機,整個切換過程在極短的時間內完成,能夠保證業務程序的高可用。
1.2.3 業務數據高可用
所有的虛擬機中都不保存業務數據,所有業務數據通過映射網絡驅動器保存至分布式存儲中,采用基于分布式存儲的容災設計,保證業務數據的高可用。
1.3 設備監控管理
管理平臺通過接口實時采集基礎設施硬件等物理資源的各種自身狀態信息,并設計基于圖像可視化的設備監控界面,實時展示服務器磁盤運行狀態和網絡設備端口連接狀態等,并能實現對虛擬資源及各個業務系統的應用性能進行監控與管理,以便更全面、直觀地掌握整個平臺的使用狀況并及時進行維護管理。
1.4 實時監測告警管理
通過在多個計算節點部署集群化的監視器,設計采用虛擬機主動向服務器發送心跳包的方式,避免了服務器主動發包方式會增加管理平臺負擔和依賴客戶端程序穩定性的情況,建立管理平臺與虛擬機之間心跳包自動檢測機制,定時檢測虛擬機狀態,發現異常后立即自動連接短信發布模塊向管理人員發送相應的故障信息,能及時了解并處理平臺故障,保證云平臺的穩定性和系統維護的高效性。
1.5 Web服務
云平臺管理軟件可對資源域中所有節點上的資源進行統一管理,并提供Web接口給管理員和用戶,所有運維管理用戶角色都通過網絡查看云平臺的實時運行狀態及管理整個集群,并對權限內的資源進行訪問和操作。
云平臺管理軟件相當于云操作系統,本文設計將此軟件部署在高可用的虛擬機上,這樣的好處在于這臺虛擬機可以動態地生成于云平臺中的任一節點服務器上,相較于固定節點安裝方式更靈活可靠,并實現了管理軟件的業務連續、高可用。此外,管理軟件如果發生故障,只會影響云數據中心的管理功能,而不會影響整個數據中心的正常運轉。
2 云管理平臺主要功能設計
根據總體結構設計與技術思路,設計云管理平臺的主要功能應包括云平臺總覽、資源管理、項目管理、告警管理、模板管理、系統管理等功能模塊,其功能架構圖如圖2所示。
由于設計實現的功能眾多,下面結合廣西廣播電視監測中心云管理平臺實踐,選取幾個重要的功能進行介紹。
2.1 云平臺總覽
云平臺總覽是將數據中心內部的所有硬件信息的健康狀況、資源的使用率、所在網絡的位置等綜合地展現出來,給管理用戶展示更直觀的管理界面。通過該界面可直觀、動態地反映整個云平臺的實時運行狀態,包括CPU、內存、硬盤等池化資源的實時使用情況,各類物理服務器、交換機和存儲設備的網絡狀態和設備健康狀態,以及一些集群的概況和告警信息等。其中,動態的系統拓撲視圖與機柜中實際的交換機和服務器盤位一一真實對應,具體到每個接口和每塊磁盤的狀態,管理平臺每秒輪巡顯示所有機柜中每臺物理機和交換機的連接情況,以不同的顏色顯示每個節點、鏈路的實時狀況,并實時更新物理機的圖標和連接線顏色,畫面更加生動、直觀,能更快速、全面地掌握整個云平臺的資源狀態,也能更好地定位故障點,提高系統維護的及時性。云平臺總覽實際效果圖如圖3所示。
2.2 資源管理
資源管理包括物理機管理及監控、虛擬機管理及監控、存儲管理及監控等模塊,其整合了數據中心內部的計算資源、存儲資源、網絡資源,并做到從上層的應用到底層硬件設備的實時監控,幫助管理員和用戶檢查應用和控制資源的動態分配。
2.2.1 虛擬機管理
虛擬機管理包括創建虛擬機、維護虛擬機、替換虛擬機、開關及刪除虛擬機、遠程登錄虛擬機、分配和遷移虛擬機、制作虛擬機模版、虛擬機高可用管理等模塊,這些也是管理平臺日常使用最頻繁的功能。這里介紹創建虛擬機和虛擬機高可用管理這2個比較具有本平臺特點的功能。
2.2.1.1 創建虛擬機
創建虛擬機是管理平臺時常使用的操作,為提高管理使用效率,本平臺設計出的配置虛擬機界面幾乎是“傻瓜化”的,只需簡單填寫數字和拉動進度條即可快速配置所需要的虛擬機,真正做到了像使用水電一樣按需靈活分配,不用經過培訓即可操作,大大提高了工作效率。
2.2.1.2 虛擬機高可用管理
中心管理員或者團隊管理員都可以對其管理的虛擬機進行高可用操作。本平臺根據實際應用需求設計提供了2種高可用的方式供用戶選擇,即還原式高可用和重啟式高可用。
還原式高可用能夠在虛擬機宕機時,按照最新的快照部署新的虛擬機,保證虛擬機的業務不間斷;重啟式高可用能夠在虛擬機宕機、斷網、物理機斷連時,重啟虛擬機,管理員可以通過實際登錄虛擬機查看其可用情況,如果用戶判定這臺虛擬機在重啟后可用,那么無需還原虛擬機,如果用戶判定這臺虛擬機不可用,那么可以手動還原虛擬機。
2種高可用方式的設置可以使管理員根據需要靈活管理虛擬機,以多種手段靈活保障虛擬機高可用。
2.2.2 告警管理
云管理平臺使用告警信息進行實時短信發送的方式來進行監測預警。若告警持續1~3 min,那么平臺進行第一次短信發送;若告警持續4~9 min,那么平臺進行第二次短信發送;若告警持續10~30 min,那么平臺進行第三次短信發送;若告警持續31~60 min,那么系統進行第四次短信發送。經過分類分級的短信設置,可以進一步提高管理平臺響應處理和及時解決故障的能力。
3 結語
經過實踐證明,本平臺通過結合實際需求的設計應用,能使云數據中心的運維管理人員通過全面可視化的多元操作管理界面,只需簡單操作,就能快速地對整個云數據中心的資源進行動態靈活的管理調度、按需分配及運維操作,實現了易操作、易管理維護的效果,同時通過多種技術手段保證了云數據中心具備高可用性、高安全性,這對其他企業和單位構建云管理平臺有一定的參考價值。
參 考 文 獻
[1]孫磊,沈蘇彬.一種基于OpenStack的云管理平臺[J].計算機技術與發展,2016(1):185-189.
[2]楊紹光,張云勇,等.基于OpenStack的云計算IaaS管理平臺研究[J].互聯網天地,2013(3).
[3]鄭楚鋒.虛擬數據中心云管理平臺的設計與實現[D].廣州:華南理工大學軟件學院,2012.