葉繼強(qiáng)
【摘 要】本文通過(guò)分析在企業(yè)有關(guān)于混用新舊服務(wù)器配置高可用群集的問(wèn)題,通過(guò)采用VMware EVC技術(shù)解決這類(lèi)問(wèn)題的途徑,并描述了在中核蘇閥科技實(shí)業(yè)股份有限公司(以下簡(jiǎn)稱(chēng)“公司”)案例中應(yīng)用虛擬化平臺(tái)技術(shù)構(gòu)建服務(wù)器高可用群集(HA)的過(guò)程,研究合理的服務(wù)虛擬化應(yīng)用平臺(tái)構(gòu)架。通過(guò)實(shí)踐證明,基于VMware EVC技術(shù)能將新舊服務(wù)器組成群集,計(jì)算資源得以共享,使虛擬機(jī)應(yīng)用服務(wù)可以進(jìn)行故障自動(dòng)遷移,提高了服務(wù)器的使用率和穩(wěn)定性,降低了公司在服務(wù)器設(shè)備資金的投入成本和管理成本。
【關(guān)鍵詞】服務(wù)器高可用群集;虛擬化技術(shù);VMware EVC
中圖分類(lèi)號(hào): TP302文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 2095-2457(2019)33-0011-002
DOI:10.19694/j.cnki.issn2095-2457.2019.33.005
0 引言
隨著企業(yè)的不斷擴(kuò)大,企業(yè)服務(wù)器數(shù)量也越來(lái)越多。大多服務(wù)器只運(yùn)行一個(gè)系統(tǒng)應(yīng)用,公司采用虛擬化技術(shù)很好的解決服務(wù)器計(jì)算資源閑置的問(wèn)題,為了使服務(wù)器計(jì)算資源能夠互通共享,就需要配置服務(wù)器高可用群集。
中核蘇閥科技實(shí)業(yè)股份有限公司(以下簡(jiǎn)稱(chēng)“公司”)信息中心現(xiàn)有信息化建設(shè)起步較早,公司的信息化應(yīng)用系統(tǒng)分布在不同的物理服務(wù)器上,數(shù)據(jù)環(huán)境基本按照“一臺(tái)服務(wù)器、一個(gè)操作系統(tǒng)、一種應(yīng)用”的模式不斷搭建擴(kuò)展。公司信息中心機(jī)房現(xiàn)有物理服務(wù)器數(shù)量三十余臺(tái),但由于服務(wù)器建設(shè)周期不同,服務(wù)器新舊程度存在差異,服務(wù)器CPU也有不同平臺(tái)等級(jí)的問(wèn)題,對(duì)配置服務(wù)器高可用群集帶來(lái)困難。通過(guò)配置增強(qiáng)型vMotion兼容性 (Enhanced vMotion Compatibility,EVC)功能確保群集內(nèi)服務(wù)器的兼容性,可以解決新舊服務(wù)器混用問(wèn)題。
1 需求分析與方案設(shè)計(jì)
公司的虛擬化平臺(tái)搭建的是VMware vSphere平臺(tái),服務(wù)器搭載的是ESXi6.0u3版本系統(tǒng);計(jì)算資源方面,服務(wù)器品牌均為HPE服務(wù)器,但服務(wù)器系列跨度較大,從GEN7至GEN10各個(gè)系列的新舊服務(wù)器混用;存儲(chǔ)方面,公司使用萬(wàn)兆網(wǎng)絡(luò)連接存儲(chǔ)聚合與數(shù)據(jù)群集,為服務(wù)器群集高可用提供基礎(chǔ)。原服務(wù)器群集使用VCSA進(jìn)行統(tǒng)一管理,雖然應(yīng)用數(shù)據(jù)都與計(jì)算資源服務(wù)器分離,但由于服務(wù)器兼容性問(wèn)題,無(wú)法使用在線遷移功能,計(jì)算資源故障后也無(wú)法自動(dòng)遷移至可用服務(wù)器上。
由于VMware vSphere平臺(tái)虛擬硬件規(guī)格對(duì)于啟用高可用群集的CPU有兼容性要求,本次重新構(gòu)建了一個(gè)以3臺(tái)ESXi6.5U2的主機(jī)的群集并新建vCenter進(jìn)行管理。VMware EVC具有多種模式,不同的模式所提供的功能有所不同,由服務(wù)器硬件規(guī)格差異所支持的模式也有所不同,當(dāng)具有不同EVC模式支持的主機(jī),創(chuàng)建成同一個(gè)群集時(shí),其EVC選型支持以最小的一臺(tái)主機(jī)的最后一項(xiàng)為準(zhǔn)。
群集必須最低具有三臺(tái)ESXi主機(jī),本次挑選了2臺(tái)HPE DL380 GEN10和1臺(tái)DL580 GEN9的服務(wù)器進(jìn)行構(gòu)建群集。雖然服務(wù)器CPU型號(hào)不同,但所支持的EVC模式是基本相同的:
新建的服務(wù)器群集不對(duì)公司原有網(wǎng)絡(luò)環(huán)境產(chǎn)生改變,連接公司原有萬(wàn)兆存儲(chǔ)網(wǎng)絡(luò)并掛載存儲(chǔ)聚合卷,3臺(tái)服務(wù)器分別連接公司核心網(wǎng)絡(luò)交換機(jī)與災(zāi)備網(wǎng)絡(luò)交換機(jī),完成群集網(wǎng)絡(luò)組建。
在不影響各個(gè)應(yīng)用服務(wù)連續(xù)性和終端環(huán)境穩(wěn)定性的前提下,使用VEEAM災(zāi)備系統(tǒng)對(duì)公司OA應(yīng)用、ERP應(yīng)用、視頻會(huì)議系統(tǒng)原有系統(tǒng)進(jìn)行全環(huán)境備份,并直接恢復(fù)至新的虛擬群集中;在新群集上新建備用域及DNS服務(wù)器,使全新安裝的虛擬機(jī)環(huán)境能在域環(huán)境故障情況下具有一定的容錯(cuò)能力。
2 服務(wù)器高可用群集EVC配置實(shí)踐過(guò)程
VMware的高可用必須先創(chuàng)建一個(gè)群集,然后用主機(jī)填充該群集,并在建立故障切換保護(hù)之前配置EVC設(shè)置。群集構(gòu)建的基礎(chǔ)是vSphere和vCenter Server的搭建。為3臺(tái)服務(wù)器安裝相同版本的EXSi6.5U2后,選取第一臺(tái)搭建VCSA至服務(wù)器本地磁盤(pán)上后,確定群集的節(jié)點(diǎn),配置節(jié)點(diǎn)的網(wǎng)絡(luò)連接并掛載共享存儲(chǔ)。
根據(jù)公司原核心網(wǎng)絡(luò)VLAN的劃分,為3臺(tái)服務(wù)器分配配置三個(gè)虛擬交換機(jī),一個(gè)作為生產(chǎn)網(wǎng)絡(luò)、一個(gè)作為虛擬機(jī)動(dòng)態(tài)遷移vMotion網(wǎng)絡(luò)、另一個(gè)作為備份網(wǎng)絡(luò)。通過(guò)連接萬(wàn)兆網(wǎng)絡(luò)添加兩個(gè)存儲(chǔ)聚合卷,完成服務(wù)器高可用群集的底層要求。在建立好網(wǎng)絡(luò)架構(gòu)后,將3臺(tái)服務(wù)器添加到群集并完成高可用配置。
按EVC設(shè)置規(guī)則,不同型號(hào)的主機(jī)按所支持的EVC模式的最后一項(xiàng)為準(zhǔn),在群集配置中選擇為Intel 主機(jī)啟用EVC,并將VMware EVC模式選為Intel "Broadwell"Generation模式,此模式可提供事務(wù)性同步擴(kuò)展、監(jiān)控模式訪問(wèn)防護(hù)、多精度帶進(jìn)位加指令擴(kuò)展、PREFETCHW和RDSEED等CPU功能,缺點(diǎn)是只支持同等級(jí)或更高CPU規(guī)格的服務(wù)器加入群集。在開(kāi)啟了EVC后配置開(kāi)啟vSphere HA,在出現(xiàn)服務(wù)器故障下自動(dòng)重新啟動(dòng)虛擬機(jī)應(yīng)用服務(wù),并設(shè)置預(yù)留一定比例的群集資源來(lái)定義故障切換容量。
在完成了群集的基礎(chǔ)搭建后,通過(guò)vCenter對(duì)群集的計(jì)算資源進(jìn)行整合,并為要遷移的虛擬機(jī)應(yīng)用系統(tǒng)預(yù)估劃分計(jì)算容量和空間容量。通過(guò)不同的遷移方式,將虛擬機(jī)遷移至群集上:
通過(guò)使用公司VEEAM災(zāi)備系統(tǒng),將原有虛擬機(jī)系統(tǒng)環(huán)境、應(yīng)用服務(wù)、數(shù)據(jù)全部備份并封裝成獨(dú)立的備份單元,在群集上直接將備份單元恢復(fù)至虛擬環(huán)境里來(lái)。完成整體環(huán)境恢復(fù)后,恢復(fù)網(wǎng)絡(luò)服務(wù)并測(cè)試應(yīng)用功能。
在群集上新建備用域與DNS服務(wù)器,并為群集上的虛擬機(jī)配置可切換的備用地址,斷開(kāi)群集與主域之間的網(wǎng)絡(luò)連接,測(cè)試備用域與DNS的可用性。
公司視頻會(huì)議系統(tǒng)驗(yàn)證使用的是USB電子狗,由于該USB設(shè)備無(wú)法進(jìn)行自動(dòng)遷移,需在群集上為虛擬機(jī)與主機(jī)之前建立反向規(guī)則,將視頻會(huì)議應(yīng)用虛擬機(jī)綁定至規(guī)定的主機(jī),使其不進(jìn)行自動(dòng)故障遷移。
服務(wù)器高可用群集配置全部完成后,對(duì)群集故障遷移能力進(jìn)行測(cè)試,關(guān)閉群集中任意一臺(tái)主機(jī),群集檢測(cè)到主機(jī)故障并自動(dòng)對(duì)虛擬機(jī)進(jìn)行了計(jì)算資源遷移,應(yīng)用服務(wù)完全不受虛擬機(jī)的在線遷移影響,做到客戶端無(wú)感知故障自動(dòng)遷移。而視頻會(huì)議應(yīng)用由于虛擬機(jī)規(guī)則的設(shè)置,沒(méi)有進(jìn)行自動(dòng)遷移。
4 效益分析
通過(guò)服務(wù)器高可用群集EVC配置,有效地發(fā)揮了公司虛擬化平臺(tái),使新舊服務(wù)器可以混用在同一群集中,大幅提高了舊服務(wù)器的利用率,有效遏制了物理服務(wù)器數(shù)量的增長(zhǎng)。
減少了物理服務(wù)器的采購(gòu)數(shù)量,如不使用EVC技術(shù),那每次服務(wù)器購(gòu)置就必須按群集主機(jī)基數(shù)進(jìn)行采購(gòu),現(xiàn)在按需對(duì)服務(wù)器數(shù)量進(jìn)行更新,對(duì)中小型機(jī)房的服務(wù)器采購(gòu)節(jié)省了大量更新設(shè)備的經(jīng)費(fèi),同時(shí)也延長(zhǎng)了老服務(wù)器的可用時(shí)間。
利用服務(wù)器高可用群集,實(shí)現(xiàn)了服務(wù)器之間的動(dòng)態(tài)資源調(diào)配和高可用功能,可使群集有能力進(jìn)行主機(jī)故障自動(dòng)遷移虛擬機(jī)應(yīng)用服務(wù),保證了應(yīng)用系統(tǒng)業(yè)務(wù)的連續(xù)性。
通過(guò)配置EVC技術(shù),成功將原有3臺(tái)新舊混搭的物理服務(wù)器構(gòu)建成一個(gè)高可用群集,虛擬化應(yīng)用效果較好。通過(guò)服務(wù)器虛擬化群集整合,既滿足了公司應(yīng)用系統(tǒng)穩(wěn)定運(yùn)行的需求,又有效控制了公司服務(wù)器設(shè)備購(gòu)置和管理的成本。