高效松,楊金剛
(哈爾濱鐵路局 信息技術(shù)所, 哈爾濱 150006)
基于VMware集群技術(shù)的信息系統(tǒng)整合設(shè)計(jì)與實(shí)施
高效松,楊金剛
(哈爾濱鐵路局 信息技術(shù)所, 哈爾濱 150006)
大量鐵路信息系統(tǒng)的實(shí)施,在帶來(lái)工作便利的同時(shí),也產(chǎn)生了舊服務(wù)器維護(hù)成本過(guò)高、新服務(wù)器資源使用率過(guò)低等現(xiàn)象。本文結(jié)合哈爾濱鐵路局信息系統(tǒng)應(yīng)用現(xiàn)狀,通過(guò)采用VMware虛擬化集群技術(shù),以現(xiàn)有服務(wù)器及信息系統(tǒng)的整合過(guò)程為例,從多個(gè)角度進(jìn)行整合設(shè)計(jì),對(duì)實(shí)施過(guò)程中的一些經(jīng)驗(yàn)和需要注意的事項(xiàng)進(jìn)行了總結(jié)。
虛擬化;虛擬集群;系統(tǒng)整合;機(jī)房整合
近年來(lái),大量鐵路信息系統(tǒng)的投產(chǎn),在提升鐵路運(yùn)輸生產(chǎn)效率及鐵路運(yùn)輸質(zhì)量的同時(shí),也增加了信息系統(tǒng)維護(hù)部門的運(yùn)營(yíng)及維護(hù)成本。要想較好地解決這些問(wèn)題,虛擬化技術(shù)是一個(gè)有效的手段。眾所周知,利用虛擬化技術(shù),可以整合應(yīng)用負(fù)載,充分利用服務(wù)器性能并極大地降低維護(hù)與運(yùn)營(yíng)成本。本文從哈爾濱鐵路局信息系統(tǒng)整合的背景、目標(biāo)及整體架構(gòu)、遷移方案等多個(gè)方面對(duì)整合的設(shè)計(jì)及實(shí)施進(jìn)行總結(jié)與描述。
哈爾濱鐵路局信息系統(tǒng)存在著舊服務(wù)器多、新服務(wù)器利用率低等諸多問(wèn)題。
(1)老舊服務(wù)器維護(hù)成本高,新服務(wù)器資源使用率偏低。
機(jī)房運(yùn)行著大量老舊服務(wù)器,經(jīng)常出現(xiàn)服務(wù)器的硬盤、電源模塊故障,由于配件的停產(chǎn)、缺失,系統(tǒng)的維護(hù)成本升高。而相對(duì)較新的服務(wù)器資源利用率偏低,普遍存在單服務(wù)器跑單應(yīng)用的現(xiàn)象,并且服務(wù)器未能建立有效的應(yīng)用集群環(huán)境。
(2)硬件系統(tǒng)維護(hù)對(duì)業(yè)務(wù)影響大,新服務(wù)器部署時(shí)間長(zhǎng)。
硬件故障維護(hù)、升級(jí)或擴(kuò)容時(shí),需要停機(jī)操作,常造成應(yīng)用系統(tǒng)中斷,影響正常業(yè)務(wù);新應(yīng)用服務(wù)器的上線,安裝操作系統(tǒng)、更新系統(tǒng)補(bǔ)丁、部署殺毒軟件等工作,常常造成應(yīng)用部署時(shí)間久、周期長(zhǎng)的情況發(fā)生。
(3)服務(wù)器維護(hù)量大,機(jī)房用電及空調(diào)壓力大。
中心機(jī)房存在生產(chǎn)服務(wù)器型號(hào)繁雜、數(shù)量多,產(chǎn)生了維護(hù)工作量大、機(jī)房耗電量大及空調(diào)壓力重等問(wèn)題,急需對(duì)機(jī)房相應(yīng)服務(wù)器進(jìn)行整合。
系統(tǒng)整合的總體目標(biāo)是利用虛擬化技術(shù),搭建VMware虛擬集群,解決鐵路局現(xiàn)有數(shù)據(jù)中心中存在的一些問(wèn)題。
(1)提高機(jī)房空間的利用率,降低服務(wù)器的維護(hù)量。
利用服務(wù)器虛擬化技術(shù)實(shí)現(xiàn) X86 服務(wù)器硬件資源整合,服務(wù)器數(shù)量減少50%以上,整合后節(jié)約60%以上機(jī)房空間。在極大減少服務(wù)器維護(hù)量的同時(shí),降低機(jī)房用電及空調(diào)壓力。
(2)通過(guò)建立VMware集群,提高應(yīng)用服務(wù)器的可靠性。
利用服務(wù)器虛擬化技術(shù)建立VMware集群,為所有虛擬服務(wù)器提供高可用性(HA) 保護(hù),在不增加成本的情況下解決缺少 HA 保護(hù)的難題。在硬件維護(hù)的過(guò)程中,通過(guò)集群應(yīng)用級(jí)的高可用,將業(yè)務(wù)的中斷降至1 min以內(nèi)。
(3)建立高效的運(yùn)維管理,降低操作系統(tǒng)部署時(shí)間。
建立統(tǒng)一管理平臺(tái),對(duì)基礎(chǔ)設(shè)施、IT設(shè)備等資源進(jìn)行動(dòng)態(tài)調(diào)度,簡(jiǎn)化管理,提高運(yùn)營(yíng)效率,降低運(yùn)營(yíng)成本。將操作系統(tǒng)部署的平均時(shí)間由5 h降至30 min以內(nèi)。
基于哈爾濱鐵路局?jǐn)?shù)據(jù)中心的現(xiàn)狀和未來(lái)業(yè)務(wù)的發(fā)展目標(biāo),充分利用虛擬化技術(shù),構(gòu)建適合鐵路局業(yè)務(wù)發(fā)展的私有數(shù)據(jù)中心,實(shí)現(xiàn)鐵路局信息系統(tǒng)基礎(chǔ)架構(gòu)“統(tǒng)一規(guī)劃”、“統(tǒng)一部署”和“統(tǒng)一管理”,最終實(shí)現(xiàn) IT“服務(wù)”轉(zhuǎn)型。
3.1 服務(wù)器架構(gòu)
為保證各應(yīng)用的安全隔離,依據(jù)業(yè)務(wù)的不同重要程度,服務(wù)器架構(gòu)包括:虛擬機(jī)管理集群、重要應(yīng)用集群、備份機(jī)制。
(1)虛擬機(jī)管理集群
2 臺(tái) 4 路刀片服務(wù)器部署在數(shù)據(jù)中心,用于支撐數(shù)據(jù)中心虛擬集群的管理,包括:vCenter Server、 vSphere Data Protection、虛擬機(jī)遷移等服務(wù)器,近而實(shí)現(xiàn)管理與業(yè)務(wù)的分離。
(2)應(yīng)用生產(chǎn)集群
8 臺(tái) 4 路刀片服務(wù)器和10 臺(tái) 2 路刀片服務(wù)器,分布部署在兩個(gè)集群中,用于支撐現(xiàn)有的老舊服務(wù)器以及未來(lái)新業(yè)務(wù)系統(tǒng)部署。邏輯上分為重要應(yīng)用集群、一般應(yīng)用集。重要應(yīng)用集群采用 8 臺(tái)4路刀片服務(wù)器,支撐生產(chǎn)系統(tǒng)高性能需求業(yè)務(wù);一般應(yīng)用集群采用 10 臺(tái)2路服務(wù)器,支撐內(nèi)網(wǎng)普通業(yè)務(wù)服務(wù),集群依據(jù)業(yè)務(wù)負(fù)責(zé)情況自動(dòng)均衡分配資源,初期按照整合比1:10進(jìn)行實(shí)施,未來(lái)依據(jù)實(shí)際運(yùn)行情況調(diào)整。
(3)備份機(jī)制
如條件準(zhǔn)許,采用2臺(tái)2路機(jī)架式帶存儲(chǔ)的服務(wù)器,通過(guò)部署VMware Data Protection (VDP)建立備份集群;或各自應(yīng)用系統(tǒng)采用系統(tǒng)定時(shí)等方式進(jìn)行數(shù)據(jù)備份。由于條件限制,我們暫采用第2種方式進(jìn)行備份。
3.2 存儲(chǔ)架構(gòu)
為解決存儲(chǔ)數(shù)據(jù)分散保存和缺少高可靠性保護(hù)等問(wèn)題,本方案設(shè)計(jì)通過(guò)1臺(tái)存儲(chǔ)劃分兩個(gè)LAN的方式承載X86業(yè)務(wù)負(fù)載。重要應(yīng)用集群、一般應(yīng)用集群服務(wù)器部署在此存儲(chǔ)中,存儲(chǔ)硬盤要求采用RAID5及以上的劃分模式。由于存儲(chǔ)容量的限制,我們采用了兼顧安全及經(jīng)濟(jì)的RAID5方式存儲(chǔ)數(shù)據(jù)。
3.3 網(wǎng)絡(luò)架構(gòu)
以太網(wǎng)絡(luò)由管理集群、生產(chǎn)集群連接匯聚交換機(jī),通過(guò)兩路光纖網(wǎng)卡和VLAN 方式隔離不同業(yè)務(wù)流量,并通過(guò) Qos 進(jìn)行業(yè)務(wù)帶寬分配;虛擬化平臺(tái)網(wǎng)絡(luò)功能分為管理網(wǎng)絡(luò)、VMotion 網(wǎng)絡(luò)和VM 網(wǎng)絡(luò)等幾種類型,針對(duì)現(xiàn)有網(wǎng)絡(luò),達(dá)到最佳應(yīng)用效果。虛擬機(jī)VLAN網(wǎng)絡(luò)圖如圖1所示。
3.4 應(yīng)用系統(tǒng)遷移
3.4.1 應(yīng)用系統(tǒng)遷移方式
應(yīng)用系統(tǒng)由物理機(jī)遷移為虛擬機(jī)(P2V)通常包含3種方式, 每種方式適應(yīng)不同的應(yīng)用遷移場(chǎng)景,需要根據(jù)具體的實(shí)際情況選擇適合的遷移方案。
(1)系統(tǒng)在線熱遷移
系統(tǒng)在線熱遷移也稱為系統(tǒng)實(shí)時(shí)遷移,是指通過(guò)宿主操作系統(tǒng)安裝遷移工具,對(duì)應(yīng)用系統(tǒng)進(jìn)行在線狀態(tài)的遷移。熱遷移主要適應(yīng)的場(chǎng)景包括:一般由于業(yè)務(wù)原因,使得服務(wù)器無(wú)法關(guān)機(jī)或不可長(zhǎng)時(shí)間關(guān)機(jī)的應(yīng)用系統(tǒng)。此類應(yīng)用可以選用免費(fèi)的VMware Converter遷移工具,進(jìn)行系統(tǒng)在線遷移。

圖1 虛擬機(jī)VLAN網(wǎng)絡(luò)圖
此種遷移方式的主要優(yōu)點(diǎn)是對(duì)運(yùn)行的業(yè)務(wù)影響最小,即最大程度地實(shí)現(xiàn)了系統(tǒng)的在線遷移,而且目前VMware官方對(duì)此提供的支持也較好,其缺點(diǎn)是系統(tǒng)遷移之后,原有系統(tǒng)的未優(yōu)化之處也一并被遷移。
基于熱遷移所具有的這些優(yōu)點(diǎn)及相應(yīng)業(yè)務(wù)的需求,本次應(yīng)用系統(tǒng)的整合,90%以上的服務(wù)器采用了熱遷移的方式進(jìn)行系統(tǒng)整合。
(2)系統(tǒng)離線冷遷移
系統(tǒng)離線冷遷移是指通過(guò)光盤引導(dǎo)遷移工具軟件的方式,對(duì)應(yīng)用系統(tǒng)進(jìn)行系統(tǒng)離線狀態(tài)的遷移,此時(shí)應(yīng)用宿主系統(tǒng)處于關(guān)機(jī)狀態(tài)。冷遷移主要適應(yīng)的場(chǎng)景是對(duì)原應(yīng)用系統(tǒng)一致性要求較高,并且應(yīng)用可停機(jī)的情況。此類應(yīng)用可以選用免費(fèi)的VMware Converter光盤引導(dǎo)版遷移工具進(jìn)行系統(tǒng)離線遷移。
此種遷移方式的主要優(yōu)點(diǎn)是宿主機(jī)無(wú)需安裝軟件,并且實(shí)現(xiàn)了遷移前后的應(yīng)用系統(tǒng)內(nèi)容一致性最高。此種遷移方式的缺點(diǎn)也較突出,主要原因是此種方式需要加載網(wǎng)卡和Raid卡等驅(qū)動(dòng),經(jīng)常造成系統(tǒng)的遷移成功率較低。此外,目前VMware官方網(wǎng)站在系統(tǒng)遷移工具欄也不提供此版本的軟件鏈接,同時(shí)隨著新的硬件不斷地更新,缺少新版驅(qū)動(dòng)的情況也影響了此種方式遷移的成功率。
由于此種遷移方式存在的弊端,本次系統(tǒng)整合僅對(duì)站段細(xì)信息系統(tǒng)等特例服務(wù)器進(jìn)行冷遷移測(cè)試,測(cè)試中出現(xiàn)多次遷移失敗的情況。所以在具體的生產(chǎn)整合過(guò)程中,我們未采用此種遷移方式。(3)系統(tǒng)重新部署,手工遷移手工遷移是指通過(guò)采用新建宿主操作系統(tǒng),重新部署應(yīng)用的方式實(shí)現(xiàn)遷移。此種遷移方式主要應(yīng)用場(chǎng)景是需要對(duì)原有系統(tǒng)進(jìn)行優(yōu)化,解決原有系統(tǒng)應(yīng)用及數(shù)據(jù)庫(kù)等要素進(jìn)行調(diào)整、優(yōu)化的使用場(chǎng)景。
此類遷移方式的優(yōu)點(diǎn)是可以對(duì)原有系統(tǒng)進(jìn)行優(yōu)化,使新系統(tǒng)可以獲得更好的穩(wěn)定性及可用性。缺點(diǎn)是人工參與較多,需要廠商或應(yīng)用工程師配合,并且相對(duì)前兩種方式此種遷移也最耗時(shí)。
在本次應(yīng)用系統(tǒng)的整合過(guò)程中,存在著對(duì)多個(gè)系統(tǒng)進(jìn)行優(yōu)化、調(diào)整的需求。基于此種需求,我們采用手動(dòng)遷移的方式對(duì)處室網(wǎng)站平臺(tái)、信息流轉(zhuǎn)信息系統(tǒng)等進(jìn)行遷移整合。
3.4.2 應(yīng)用系統(tǒng)具體遷移步驟
(1)應(yīng)用系統(tǒng)硬件調(diào)查,特殊軟件需求獲取
針對(duì)原有應(yīng)用進(jìn)行調(diào)查,包括:是否運(yùn)行于老舊設(shè)備、單機(jī)單服務(wù)器之上;運(yùn)行的操作系統(tǒng)及硬盤和內(nèi)存應(yīng)用調(diào)查;應(yīng)用數(shù)據(jù)庫(kù)類型;是否需要特殊軟、硬件。整合應(yīng)用系統(tǒng)遷的移計(jì)劃樣例如圖2所示。
(2)應(yīng)用預(yù)遷移測(cè)試,制定遷移資源配置表
挑選代表性應(yīng)用,進(jìn)行遷移測(cè)試。包括:Windows2003、Windows2008以及冷、熱兩種遷移分別進(jìn)行測(cè)試,根據(jù)測(cè)試及調(diào)查結(jié)果進(jìn)行遷移資源配置。由于虛擬機(jī)資源可以后期動(dòng)態(tài)調(diào)整,所以基于有效利用硬件資源的前提是遷移資源配置應(yīng)按照中等資源需求進(jìn)行配置。

圖2 系統(tǒng)遷移計(jì)劃樣例圖
(3)遷移后,進(jìn)行資源配置與遷移驗(yàn)證
依據(jù)具體業(yè)務(wù)需求及資源配置表,分配資源遷移系統(tǒng),各應(yīng)用部門配合進(jìn)行遷移驗(yàn)證。
3.5 虛擬化安全
可以采用專業(yè)的虛擬化安全軟件,為虛擬環(huán)境提供全面的保護(hù);或者采用Mcfaee殺毒軟件進(jìn)行安全防護(hù)。目前,我們主要采用Mcfaee進(jìn)行病毒安全防護(hù)。
4.1 以安全為第一注意事項(xiàng),實(shí)施指導(dǎo)計(jì)劃
由于整合的應(yīng)用系統(tǒng)均為生產(chǎn)系統(tǒng),所以方案的設(shè)計(jì)及實(shí)施均以安全為第一位。整合需要事前進(jìn)行認(rèn)真調(diào)研,制定實(shí)施方案與測(cè)試計(jì)劃。根據(jù)測(cè)試結(jié)果進(jìn)行項(xiàng)目實(shí)施并在投產(chǎn)后注意集群監(jiān)管。
4.2 根據(jù)系統(tǒng)整合特點(diǎn),注重實(shí)施細(xì)節(jié)
項(xiàng)目涉及的應(yīng)用環(huán)境復(fù)雜,需注重前期準(zhǔn)備調(diào)研,并針對(duì)特殊問(wèn)題采取相對(duì)應(yīng)的解決對(duì)策。
(1)系統(tǒng)內(nèi)運(yùn)行的特殊服務(wù)在遷移過(guò)程中易產(chǎn)生數(shù)據(jù)不一致的問(wèn)題,此時(shí)可將服務(wù)退出或停止,待遷移完成之后再將各服務(wù)改為原有模式。
(2)各底層管理服務(wù)器的ESXi操作系統(tǒng),應(yīng)盡量采用相同的版本,方便虛擬機(jī)的HA及容錯(cuò)(FT)等技術(shù)的使用。如果ESXi需要升級(jí),應(yīng)執(zhí)行先升級(jí)測(cè)試后投產(chǎn)的原則。
(3)Windows2008系統(tǒng)遷移后,需要聯(lián)網(wǎng)激活。針對(duì)此類問(wèn)題,可采用電話激活、外網(wǎng)激活等方式。
(4)尤其注重官方文檔的使用并結(jié)合互聯(lián)網(wǎng)資源,有效地完成項(xiàng)目的實(shí)施工作。
(5)通過(guò)管理軟件,高效地對(duì)虛擬環(huán)境進(jìn)行監(jiān)控。虛擬機(jī)部署之后,也需要對(duì)虛擬集群、虛擬機(jī)、存儲(chǔ)、網(wǎng)絡(luò)等進(jìn)行監(jiān)控。通常此類監(jiān)控可采用VMware vSphere自身的監(jiān)控工具或?qū)S玫奶摂M機(jī)管理監(jiān)控工具vCenter Operations Manager(VCOPS)。VMware vSphere系統(tǒng)性能監(jiān)控圖如圖3所示。

圖3 系統(tǒng)性能監(jiān)控圖
通過(guò)采用虛擬機(jī)集群技術(shù),整合舊系統(tǒng)、實(shí)施新系統(tǒng),是搭建企業(yè)應(yīng)用數(shù)據(jù)中心的一種重要手段。哈爾濱鐵路局信息系統(tǒng)整合于2015年底完成,企業(yè)內(nèi)部私有應(yīng)用數(shù)據(jù)中心的優(yōu)勢(shì)顯現(xiàn),降低了信息系統(tǒng)維護(hù)及運(yùn)營(yíng)成本,提高了工作效率,較好地達(dá)到了系統(tǒng)整合的預(yù)期目標(biāo)。
[1] Matt Liebowitz,Christopher Kusek. VMware vSphere 性能設(shè)計(jì):性能密集場(chǎng)景下CPU、內(nèi)存、存儲(chǔ)及網(wǎng)絡(luò)的最佳設(shè)計(jì)實(shí)踐[M]. 姚海鵬,劉韻浩,譯.北京:機(jī)械工業(yè)出版社,2015,8.
[2] 戴夫?沙克爾福. 虛擬化安全解決方案[M]. 張小云,譯.北京:機(jī)械工業(yè)出版社,2015.
[3] Christopher Wahl, Steve Pantol. Vmware網(wǎng)絡(luò)技術(shù)原理與實(shí)踐[M]. 姚 軍,譯.北京:機(jī)械工業(yè)出版社,2014.
[4] 王春海. VMware vSphere企業(yè)運(yùn)維實(shí)戰(zhàn)[M]. 北京:人民郵電出版社,2014.
責(zé)任編輯陳 蓉
Integration of Information System based on VMware cluster technology
GAO Xiaosong, YANG Jingang
( Institute of Information Technology, Harbin Railway Adminnistration, Harbin 150006, China )
The implementation of a large number of Railway Information Systems has brought convenience at work. However, it also created the problems of high maintaining cost of old servers and low utilization rate of new servers. This article combined with the present situation of Information System application in Harbin Railway Administration, took the integration process of the servers and Information System as an example, used the VMware virtual cluster technology to design the integration process from multiple perspectives, summarized some experiences and some matters needing attention in the implementation process. The author hoped that this article could provide some useful help for the colleagues.
virtualization; virtual cluster; system integration; server room integration
U29∶TP39
A
1005-8451(2016)12-0023-04
2016-05-25
高效松,高級(jí)工程師;楊金剛,高級(jí)工程師。