張海全 林峰 楊東 陳涓

為了解決南瑞集團阿里云、華為云、自研云及虛擬化軟件、堡壘機等多種軟硬件產(chǎn)品集成對接,通過建設(shè)南瑞云管平臺提供異構(gòu)云環(huán)境下的監(jiān)控、管理和運維能力,實現(xiàn)對異構(gòu)云的統(tǒng)一監(jiān)控、統(tǒng)一管理及統(tǒng)一運維,用云管平臺代替人手工操作,提升自動化程度,提高管理和運維的效率,提高資源使用效率,降低成本,降低安全風險。
一、引言
隨著云計算技術(shù)的普及,“三分建設(shè)、七分運營”同樣體現(xiàn)在云計算行業(yè),南瑞集團IT建設(shè)經(jīng)過多年的發(fā)展,從傳統(tǒng) IT 到虛擬化,正在進行從虛擬化到私有云以及多云共存的這一關(guān)鍵性轉(zhuǎn)型與變革,隨著虛機、容器以及云建設(shè)規(guī)模的快速增長,導致不同的云平臺由于其管理的粒度、監(jiān)控指標、運維管理規(guī)范均不相同,給混合云管理人員帶來較大的挑戰(zhàn);內(nèi)部私有云、虛擬化資源和外部云平臺資源,從企業(yè)層面難以實現(xiàn)統(tǒng)一管控;隨著業(yè)務(wù)的發(fā)展,傳統(tǒng)的手工操作工作量變大、資源交付服務(wù)效率低將會嚴重阻礙業(yè)務(wù)的敏捷性。因此,集團有必要從統(tǒng)一監(jiān)控、統(tǒng)一管理以及統(tǒng)一運維三個方面建設(shè)完善的云管理平臺。
二、云管平臺需求分析
南瑞集團信息化建設(shè)經(jīng)過多年的發(fā)展,已演進到從虛擬化到私有云以及多云共存的關(guān)鍵階段。隨著云建設(shè)規(guī)模的快速增長,異構(gòu)云平臺之間對資源的管理粒度、監(jiān)控指標、運維規(guī)范均不相同,難以實現(xiàn)統(tǒng)一管控,為運維管理工作帶來較大的挑戰(zhàn)。隨著集團全球業(yè)務(wù)的發(fā)展,難以滿足各類創(chuàng)新業(yè)務(wù)復雜多變的需求,傳統(tǒng)的運維方式工作量大、服務(wù)效率低下。通過構(gòu)建統(tǒng)一的云管理平臺,整合集團內(nèi)部多種私有云及虛擬化資源池,充分發(fā)揮計算、存儲、網(wǎng)絡(luò)、安全等基礎(chǔ)設(shè)施云服務(wù)能力。
三、云管平臺系統(tǒng)架構(gòu)設(shè)計
本次云管的總體計框架可以用”一體兩線五層”來總結(jié),見圖1。
一體:指本次方案是一個結(jié)合成熟商業(yè)軟件,根據(jù)南瑞的需求進行定制開發(fā),綜合考慮云技術(shù)、資源全生命周期管理的一體化解決方案,方案本身采用自上而下的整體設(shè)計理念,各個功能模塊基于整體框架的分解逐層展開設(shè)計,同時在實現(xiàn)過程各子系統(tǒng)也是緊密銜接,協(xié)同工作的解決方案。
兩線:本次方案的實現(xiàn)涉及多個系統(tǒng)及功能組件,在縱向上必須打通兩條主要通道,一條是自上而下的服務(wù)線,即從用戶提交請求開始,經(jīng)過全局資源的調(diào)度分配,直至在本地資源落地的完整過程;一條是自下而上管理線,包含本地資源的注冊納管,運行狀態(tài)等信息收集匯聚,直到面向管理的呈現(xiàn)。
五層:本次方案架構(gòu)分為五個層次:基礎(chǔ)架構(gòu)層,資源接入適配層,服務(wù)支撐層,功能模塊層,統(tǒng)一門戶層。
第一層:基礎(chǔ)架構(gòu)層
由VMware虛擬化平臺、私有云以及容器云、桌面云組成,將服務(wù)器、存儲、網(wǎng)絡(luò)虛擬成異構(gòu)的資源池,提供資源層面的交付服務(wù)。
第二層:資源接入適配層
負責與各個云平臺的對接,計算、存儲、網(wǎng)絡(luò)的納管。
混合IT接口層由云平臺接入模塊、和獨立設(shè)備接入模塊組成。
云平臺接入模塊由適配層和各個云平臺插件組成,實現(xiàn)了同資源池的完全解耦。
第三層:服務(wù)支撐層
包含核心模塊和管理模塊。核心模塊,為上層提供編排服務(wù)、任務(wù)執(zhí)行服務(wù)、應(yīng)用部署服務(wù),支持上層門戶為各類角色用戶提供多云、混合云自動化的資源部署自動化、資源管理自動化、應(yīng)用部署自動化、以及應(yīng)用自動化運維服務(wù)。管理模塊包含用戶和多級租戶管理,以及不同角色用戶的訪問權(quán)限控制。
編排引擎:橫向支持跨主機、跨網(wǎng)絡(luò)、跨云平臺的編排,縱向支持涵蓋資源和應(yīng)用的編排,是自動化運維的基礎(chǔ)。運營門戶中的服務(wù)目錄集群服務(wù)交付、自服務(wù)門戶中的代碼自動化部署、一鍵擴容、自動化伸縮均依賴于這個的編排引擎。
任務(wù)執(zhí)行引擎:主要支持在多個被管操作系統(tǒng)批量執(zhí)行腳本任務(wù),并在執(zhí)行過程和完畢后上報執(zhí)行狀態(tài)、日志和結(jié)果。在執(zhí)行編排任務(wù)場景中,支持編排引擎的任務(wù)執(zhí)行請求。
代碼部署引擎:主要支持應(yīng)用部署,支持以不同的策略,在多臺虛擬機執(zhí)行應(yīng)用代碼部署任務(wù)。在執(zhí)行編排任務(wù)場景中,支持編排引擎的應(yīng)用部署執(zhí)行請求。
第四層:功能模塊層
從整體上分為資源交付及運營模塊、應(yīng)用交付及運維模塊和資源運維模塊;
資源交付及運營模塊:云管平臺需要提供自服務(wù)門戶及服務(wù)運營門戶,實現(xiàn)IT資源的全生命周期管理,即從服務(wù)目錄產(chǎn)品定義、申請、審批、資源自動化創(chuàng)建、網(wǎng)絡(luò)設(shè)置、應(yīng)用安裝、資源續(xù)租、實例變更到最后釋放。同時,云管平臺需要提統(tǒng)一的計量,計費、成本分析、資源池容量分析,物理虛擬資源的資源使用分析、并能提供資源使用優(yōu)化建議。并為IT管理員及用戶提供各種維度的資源報表分析。
應(yīng)用交付及運維 :云管平臺需要幫助企業(yè)實現(xiàn)應(yīng)用維度的環(huán)境管理,實現(xiàn)應(yīng)用的持續(xù)集成和發(fā)布,同時提供應(yīng)用自動化運維和監(jiān)控告警能力。
服務(wù)對接:以模塊的方式同企業(yè)現(xiàn)有的安全組件、辦公及運維系統(tǒng)對接,包括備份、堡壘機、漏洞掃描等。
第五層:統(tǒng)一門戶層
為各類角色用戶和應(yīng)用提供整合的用戶接口,各類角色用戶均可以通過這個整合門戶登陸,選擇進入要進入的門戶;面向企業(yè)內(nèi)部的用戶以及云平臺的管理員,為其提供IT資源分析門戶,面向IT管理員提供服務(wù)運營門戶,面向內(nèi)部用戶提供自服務(wù)門戶和應(yīng)用運維門戶。同時可以為客戶定制資源使用實時情況的大屏展示。
四、結(jié)語
通過云管平臺,統(tǒng)一納管異構(gòu)的基礎(chǔ)設(shè)施,提供統(tǒng)一的資源統(tǒng)計分析,成本分攤分析。同時,通過云管平臺服務(wù)運營及自服務(wù)模塊,標準化、服務(wù)化、自助化交付 IT資源,集成南瑞內(nèi)部已有 OA 系統(tǒng)、App入口,保證 IT 資源服務(wù)化能力的落地。云管平臺建設(shè)中,除了 IT 基礎(chǔ)架構(gòu)資源的快速敏捷使用和交付,業(yè)務(wù)部門可以對 IT 資源的全生命周期進行自助式服務(wù)之外,業(yè)務(wù)部門還可以通過云管平臺不斷提升應(yīng)用交付的效率,提升應(yīng)用 CI/CD 水平。