劉曉魁



摘要:當數據中心云平臺架構面臨老化升級時,需要考慮資源利舊、兼容性、成本、效率等諸多因素,對整體架構重新進行設計。這里以甲骨文信息處理教育部重點實驗室的數據中心為例,對已有的微軟的SystemCenter架構問題和需求進行梳理,并與現有主流的VMware vSphere架構、微軟Azure Stack架構以及超融合架構之間的兼容性、可拓展性、可行性等進行分析,對云平臺架構的升級和多云架構管理提供一些參考。
關鍵詞:數據中心;云平臺;架構;升級
中圖分類號:TP311? ? 文獻標識碼:A
文章編號:1009-3044(2021)30-0004-03
開放科學(資源服務)標識碼(OSID):
Analysis of Data Center Cloud Platform Architecture Upgrade
LIU Xiao-kui
(Oracle Bone Inscriptions Information Processing Lab, Anyang Normal University, Anyang 455000, China)
Abstract: When the data center cloud platform architecture is facing aging and upgrading, we need to consider many factors such as resource utilization, compatibility, cost, efficiency and so on, and redesign the overall architecture. Taking the data center of the Key Laboratory of Oracle information processing Ministry of education as an example, this paper analyzes the existing Microsoft system center architecture and the existing mainstream VMware vSphere architecture, Microsoft azure stack architecture and hyper fusion architecture, hoping to provide some reference for the architecture design and upgrading of the old cloud platform.
Key words: Data center; cloud platform; architecture; upgrade
隨著信息化建設的不斷發展,數據中心總體架構正朝著資源設備整合、管理維護簡化的趨勢發展。特別是日趨成熟的虛擬化技術,可以更高效地挖掘硬件資源,大大降低運維和建設成本。服務器虛擬化提高了物理服務器資源的利用率;網絡和存儲的虛擬化,使得災難恢復更加簡化、應用部署更加便捷、負載均衡更加靈活;操作系統和基礎硬件的分離,有效解決了諸多兼容性問題。隨著云技術的日趨成熟,私有云中的超融合架構也應運而生。這里以甲骨文信息處理教育部重點實驗室數據中心為例,在涉及整個云平臺架構升級時,重新進行架構梳理和設計。
1現有架構梳理
所在甲骨文信息處理教育部重點實驗室數據中心承載著是冷門絕學性質的甲骨文資源大數據平臺--“殷契文淵”,為全世界甲骨文與甲骨學研習者提供便利,傳承與弘揚著中華民族優秀古典文化遺產。該平臺目前已經收錄專業甲骨文著錄84種,收錄專業文獻32117篇,收錄數字甲骨圖150302片,并且,數據還在不斷增長,功能也在不斷拓展。未來線上三維甲骨也在計劃建設中。海量的圖像數據存儲、傳輸和處理對系統性能和網絡速度都有比較高的要求。目前有服務器31臺,磁盤陣列4臺,存儲容量約80T,交換機7臺。甲骨文數據中心現有云架構如下:
現有31臺物理服務器,配置如下:
其中兩臺相對舊配置的物理機用于安裝主輔域控制器,同時用一臺虛擬機做輔域控制器,用以提升基礎架構的高可用性、穩定性。另外四臺舊配置服務器組建一個物理服務器故障轉移群集,供學生課程設計互動體驗云平臺使用。性能較為優越的服務器,通過萬兆網卡直連存儲,承載了主要業務系統,分為3個物理服務器故障轉移群集:管理服務器群集、甲骨文科研成果發布服務器群集、教師教研服務器群集。
共有四個群集如下表:
在網絡設計方面,由于存在物理服務器網絡、虛擬服務器網絡、存儲網絡、群集網絡等,錯綜復雜,網絡虛擬化中使用Windows Server 2012 R2中的NIC Teaming功能來實現多網絡融合,在提升訪問速度和網絡的災備能力的同時,實現虛擬機網絡之間的隔離。這種架構從性能上看完全能滿足目前和將來一段時間的需求。甲骨文云平臺網絡架構圖如下:
私有云管理平臺方面,在2014年時,微軟公有云、私有云或者混合云的Azure 和 Azure Stack架構還沒有出現,是采用第三方的微創云管理平臺,它構建在System Center之上,雖然也可以向用戶提供虛擬機申請、擴容、退租等操作,同時可以對整個虛擬化環境進行管理、監控、備份,在可用性、安全性、管理靈活性也有一定的體現,在當時還是新技術應用,但是隨著時間推移,故障率開始提升,各種問題也凸顯出來。這里主要從軟件和硬件兩個方面進行分析:
2面臨需要解決的問題
數據中心是在2014年進行整體改造升級的,當時云架構初露頭角,隨著信息化的高速發展特別是云技術的日趨成熟,出現許多新的技術手法和手段,隨著時間推移,暴露出越來越多需要解決的問題,這里分為軟件和硬件兩個方面。
1)軟件方面問題:
原有部署的基于System Center2014版本的虛擬化環境集成化程度較低。諸多服務也都是基于System Center組件和SQL Server數據庫之上,這些服務部署在不同的管理服務器群集中的虛擬機上,并且服務之間相互依賴,導致穩定性上存在一些隱患。而System Center是使用一系列的組件來實現各種虛擬化功能的管理得,比如基于面向Windows桌面的配置軟硬件資產管理的批量部署工具:System Center Configuration Manager(SCCM);用于監控各種服務和應用的System Center Operations Manager(SCOM)組件;用于數據中心虛擬化管理的System Center Configuration Manager(SCVMM)組件;用于計劃任務生成的System Center Orchestrator(SCO)組件;提供數據保護和數據還原的System Center Data Protection Manager (SCDPM)組件等。一般狀態下穩定性尚可,但是遇到需要異常恢復時,會遇到各種服務之間相互調度和協調的問題。甚至于服務器的開關機都需要按照順序進行,并且開機時需要對諸多虛擬機設置合理的延遲方案。如果遇到突然斷電,或者非正常關機,往往會影響到云架構中各個服務間正常通信。另外,原有第三方的云管理對System Center的依賴很大,相應的它的可用性也存在很大的風險。隨著服務器硬件的逐步老化,軟硬件故障率提高,問題更加突出地暴露出來。比如:故障轉移群集中物理服務器丟失或者虛擬機脫域等問題出現頻率增加。總的來說,就是舊的云架構集成化程度相對不高,結構和運維復雜,第三方云管理平臺在異常情況下的自我恢復能力差等。
2)硬件方面問題:
物理服務器全部過保,需要考慮升級換代和平穩過渡的問題。續保成本很高,而如果全部一次性更換,代價也很高,需要在硬件升級中,找到利舊和保障應用穩定之間的平衡。
原有萬兆冗余網絡架構從性能和穩定性上都能滿足目前和未來幾年的需求。可以將新的云架構直接使用或者融合到原有網絡架構中。這種使用新云架構實現舊的虛擬化層面管理目前主流的云管理平臺都是可以實現的,但是將舊的物理服務器直接應用在新的云架構中往往都涉及服務器授權的問題。
3云平臺架構預升級方案分析
要解決上面問題,必須從底層架構層面對數據中心云平臺進行設計。經過多方調研和考察學習,這里給出如下三種云平臺架構預升級方案,并分析各自的優勢和面臨問題:
第一種:升級微軟Azure Stack架構
微軟System Center 2016版本、2018版本和目前最新的2019版本陸續發布。并且,微軟云平臺已經出臺Azure 和 Azure Stack架構,支持公有云、私有云或者混合云。
該平臺在私有云和公有云轉換或者拓展方面比較靈活;另外云架構底層虛擬化原理有一定的連貫性,在運維和管理習慣上更加容易上手;私有云系統架構中對Windows系統十分友善,系統激活非常便捷,可以輕松解決Windows系統版權問題。
但是,這種Azure架構獨立封裝性強,在理服務器利舊方面不具備優勢;也不能向下兼容直接將原有的基于SystemCenter架構的2014版本管理起來;目前國內高校用戶罕見,經驗的積累和交流是個問題。
第二種:升級為主流的VMware云架構
VMware架構市場占有率很高,技術相對比較成熟,對原有的物理設備有著更好的兼容性和可拓展性,可以實現快速部署軟件定義的數據中心,執行效率很高。在高校中有著廣泛的使用案例,同行之間相互學習和借鑒經驗的機會很多。
缺點就是跟原有微軟基于System Center的虛擬機不能直接兼容,虛擬機遷移需要使用Vmware Converter工具轉換。如果保留原有微軟基于SystemCenter架構,需要同時運維管理兩套私有云架構。另外完全不同的云架構,結構差異比較大,比如原微軟云架構中的域管理功能,無法直接使用VMware架構中的某個功能模塊代替,如果強行遷移到VMware架構下,只是兩種云架構機械的嵌套,效益不高,意義不大。只能完全放棄原有云架構,將業務逐步完全遷移出來,然后再考慮舊物理設備的利用。這個過程應該會花費更多的時間成本。
第三種:升級為超融合私有云架構
超融合架構技術,可以通過對網絡、存儲、安全等基礎資源的全面池化和整合,實現基礎資源的按需分配及彈性擴展,甚至是自動化部署。可以大大簡化日常的管理和維護工作,提高效能與管理水平,實現安全可靠、高效節能、靈活多樣的集約化建設和虛擬化管理。彌補傳統架構的投入成本高、業務上線慢、運維工作量大、擴展復雜等缺點。諸多互聯網廠商都在介入超融合領域,其中出現不少功能和設計上的亮點,比如“IT資源的可視化管理”“可通過瀏覽器、移動終端靈活訪問的B/S瘦客戶端云管理系統”等。
綜合上面三種云架構升級方案,在云平臺架構軟件方面,前兩種微軟Azure Stack和VMware云架構都不能實現對舊的虛擬化平臺的直接管理,第三種超融合私有云架構通常都能支持VMware、Hyper-v、KVM等市場上主流的多種虛擬化平臺,可以實現對原有虛擬化平臺的管理。在物理設備利舊方面,后兩種的服務器硬件可拓展性更好一些,可以將舊的云架構中的物理服務器重新部署后利用到新的云架構中,雖然一般都需要在新的架構中購買物理服務器授權,但是考慮到原有服務器性能尚可,利舊的價值明顯。從自身業務拓展需求出發,綜合建設成本、運行效率和運維管理的角度進行考量,該數據中心的云架構升級傾向于第三種云架構升級方案。這種私有云超融合架構,可以直接管理原有的虛擬化平臺,提升舊設備利用率,通過分步遷移數據中心核心業務和其他業務,可以實現數據中心整體架構的平穩過渡升級。
4結束語
數據中心的架構設計舊架構升級的時候,要立足自身原有資源,以需求和問題為導向,面對現有諸多云平臺新架構,考慮兼容性、可拓展性、可行性等因素,實現數據中心的整體架構升級和重組。當然,還要根據具體的標準化物理環境包括UPS電源、精密空調系統、消防系統;系統運維包括網絡運維與監控、動力和溫濕度監控、人臉或指紋識別等門禁準入系統;以及網絡鏈路負載、應用和數據庫服務器負載、數據存儲和災備、網絡安全等方面進行查漏補缺,讓整個云架構更加完善起來。整體的云平臺架構分析在數據中心的建設和升級改造中有著十分重要的決策意義,希望能夠通過這次分析對其他數據中心云整體架構的升級有一定的參考價值。
參考文獻:
[1] 施慶.基于VMware vSphere的高校數據中心虛擬化建設研究[D].上海:復旦大學,2012.
[2] VMware [EB/OL]. http://www.vmware.com/cn/virtualization/
[3] 鐘原.基于云計算數據中心網絡設計[J].微型電腦應用,2019,35(3):59-61.
[4] 沈立強.虛擬化技術推動數據中心革命[J].中國教育網絡,2009(12):32-34.
[5] 余侃.云計算時代的數據中心建設與發展[J].信息通信,2011,24(6):100-102.
[6] 冼學輝,熊偉.基于超融合技術的高校數據中心設計與實現[J].中國教育信息化,2020(15):80-82.
[7] 常潘.數字化校園數據中心建設的研究[J].中山大學學報(自然科學版),2009,48(S1):232-234.
【通聯編輯:梁書】