譚志遠,宮云平,周文紅
(1.中國電信股份有限公司廣東研究院 廣州510630;2.中國電信集團公司 北京100032)
云計算虛擬化技術的引入為業(yè)務網(wǎng)絡演進、資源整合提供了新的技術手段。云計算虛擬化技術越來越成熟,應用越來越廣泛,并經(jīng)過近兩年來基于云計算技術對業(yè)務平臺進行關停并轉的現(xiàn)場試驗,驗證了基于云計算虛擬化技術在整合資源、提高資源利用率、降低維護成本、增加業(yè)務平臺的整體容災性能等方面的能力,能給現(xiàn)階段業(yè)務平臺的運營維護帶來質的變化。
現(xiàn)階段對于重要業(yè)務平臺(如WAP網(wǎng)關、彩信中心、短信中心等),是否進行云化始終存在顧慮,因為這些業(yè)務平臺其承載的業(yè)務量大、用戶量多、影響面廣,擔心云化后可能給這些業(yè)務平臺的安全運行帶來諸多不可預測的隱患,因此在推進重要業(yè)務平臺云化方面始終比較慎重。
究竟哪些業(yè)務平臺適合云化,哪些業(yè)務平臺不適合云化,如何評估,其評估的依據(jù)和方法是什么?本文結合云計算技術的特點和業(yè)務平臺的實際情況,探索了一套針對業(yè)務平臺是否可云化的評估方法,并形成了可量化、可操作的評估體系,希望能對業(yè)務平臺的云化起到指導作用。
(1)業(yè)務平臺云化
業(yè)務平臺云化是把現(xiàn)有業(yè)務平臺遷移到云計算資源池承載的簡稱,即針對現(xiàn)有業(yè)務平臺,經(jīng)過云化評估后,把可云化的業(yè)務平臺通過P2V(physical-to-virtual,把物理機中的應用系統(tǒng)遷移到虛擬機中)模式或者新建模式(在云計算資源池中的虛擬機上重新部署業(yè)務平臺運行環(huán)境)把業(yè)務平臺遷移到云計算資源池中。
(2)部分云化
根據(jù)業(yè)務平臺的實際情況或需要,把業(yè)務平臺中部分模塊遷移或部署到云資源池中,而業(yè)務平臺中的其他模塊保持傳統(tǒng)的承載方式不變(直接使用物理機)。
(3)融合云
本文中融合云的概念是指x86云與小型機云混合組網(wǎng)的解決方案,即根據(jù)實際需要,把業(yè)務平臺的部分模塊遷移或部署到x86云,部分遷移或部署到小型機云的混合解決方案。
根據(jù)目前云計算服務器虛擬化技術的發(fā)展,主要存在兩個不同的發(fā)展方向,即“1變多”和“多變1”兩種方式,兩種方式的比較見表1。根據(jù)現(xiàn)網(wǎng)業(yè)務平臺云化實際應用場景和云資源池的建設情況,本文主要討論“1變多”的情況(大型機的虛擬化除外),即把一臺物理服務器虛擬成多臺虛擬機供業(yè)務平臺使用。根據(jù)資源池服務器類型的不同,云資源池也存在如下幾種情況:使用小型機虛擬化技術構建的云資源池(以下簡稱小型機云)、使用x86服務器構建的云資源池(以下簡稱x86云)以及小型機云和x86云混合使用構建的融合云資源池。

表1 服務器虛擬化的兩個方向
服務器虛擬化后,最顯著的特點是實現(xiàn)計算、內存、存儲、網(wǎng)絡等資源的共享,并且各虛擬機的資源可按需分配。與傳統(tǒng)的業(yè)務平臺部署不同,各虛擬機與底層硬件之間多了如圖1所示的虛擬化層(hypervisor),因此需要結合這些特征以及業(yè)務平臺的實際情況綜合評估業(yè)務平臺是否可云化,是否適合云化。

圖1 服務器虛擬化“1變多”
基于云計算的虛擬化技術可以把現(xiàn)網(wǎng)設備老化、資源利用率低、生命周期短、業(yè)務突發(fā)性高且符合云化條件的各種業(yè)務平臺(優(yōu)先考慮對小業(yè)務平臺、短生命周期平臺、離線分析平臺、硬件故障率高、過保或維保即將到期的業(yè)務平臺)遷移到云平臺統(tǒng)一承接,實現(xiàn)業(yè)務平臺的資源整合。
根據(jù)現(xiàn)網(wǎng)業(yè)務平臺實際云化的經(jīng)驗和云計算技術的特點,不是所有的業(yè)務平臺都適合遷移到云資源池中,業(yè)務平臺是否可以云化會受制于諸多因素,因此在實施業(yè)務平臺云化前務必做好充分的評估,什么類型的業(yè)務平臺適合云化,需要從哪些方面評估業(yè)務平臺是否可云化。
為了更充分地評估業(yè)務平臺是否可以云化,在評估前需要先收集現(xiàn)有待云化業(yè)務平臺的一些基本數(shù)據(jù),通過業(yè)務平臺的現(xiàn)狀,再結合云計算的特點綜合評估業(yè)務平臺是否可云化。
收集待云化平臺的基本資料,主要包括平臺設備使用情況和業(yè)務特性方面的資料。在物理設備方面,收集業(yè)務平臺的服務器設備、網(wǎng)絡設備、存儲設備以及其他特殊設備(信令卡、加密狗等)等相關資料,主要包括平臺涉及服務器的數(shù)量,各服務器的操作系統(tǒng)種類和版本、CPU數(shù)量、核數(shù)和CPU利用率、內存容量及當前平均利用率、已使用磁盤空間大小、使用網(wǎng)絡帶寬大小,平臺使用外接存儲資源大小、IP地址情況,使用防火墻情況以及安全控制策略、外接設備情況等。
業(yè)務特性方面收集的資料包括業(yè)務的忙/閑時情況、業(yè)務實時性要求、業(yè)務的重要程度、用戶量、業(yè)務所需的I/O吞吐量等。
待云化業(yè)務平臺需要采集的信息包括表2和表3所涉及的評估數(shù)據(jù)。
收集到待遷移平臺的資料后,從虛擬化技術特性、業(yè)務特性、維護管理要求等幾個方面分析是否對業(yè)務平臺進行可云化或部分云化評估。
4.2.1 云計算技術制約
根據(jù)表1所示,目前“1變多”虛擬化技術根據(jù)平臺架構的不同主要有x86云和小型機云兩種技術實現(xiàn)方式(兩者組合可以構建融合云),而不同實現(xiàn)方式下,各廠商的虛擬化產(chǎn)品所實現(xiàn)的功能是有所差異的,因此在進行云化評估時,首先必須根據(jù)現(xiàn)有資源池所使用虛擬化產(chǎn)品的功能情況進行評估。主要有如下幾個方面的評估內容。

表2 待云化平臺資源使用情況匯總(1)

表3 待云化平臺資源使用情況匯總(2)
(1)平臺架構
待云化的業(yè)務平臺如果是x86架構,可接入x86架構的云資源池(如使用VMware、Citrix、RedHat等廠商虛擬化技術的資源池);非x86架構(RISC架構)的平臺,如可通過軟件移植方式轉換成x86架構,也可以接入x86架構的云資源池,否則只能根據(jù)平臺所使用操作系統(tǒng)的種類選擇對應廠商的小型機云(如使用HP UX的業(yè)務平臺只能接入HP小型機云,使用IBM AIX的業(yè)務平臺只能接入IBM小型機云)。
(2)x86資源池支持的客戶操作系統(tǒng)
待接入x86云資源池的業(yè)務平臺各模塊或子系統(tǒng)(業(yè)務平臺全部云化或部分云化)所使用的操作系統(tǒng)必須是資源池所使用虛擬化軟件支持的客戶操作系統(tǒng)(含版本)。虛擬化產(chǎn)品所支持的客戶操作系統(tǒng)及版本情況可查詢對應公司虛擬化產(chǎn)品支持GuestOS的兼容性列表。
(3)不能虛擬化的特殊外接設備
對于業(yè)務平臺中使用特殊外接設備(如信令卡、語音板卡、傳真卡、調制解調器、安全軟件狗、硬件加密設備等)的模塊,當服務器虛擬化軟件不支持對特殊設備的虛擬化,且無法通過其他技術(如通過USB over Network技術解決虛擬化軟件不支持特殊USB設備的問題)解決業(yè)務平臺使用特殊設備的問題時,將無法云化,這種情況下可對平臺中符合條件的模塊進行部分云化。
4.2.2 業(yè)務特性需求制約
云計算虛擬化“1變多”的技術就是把物理機虛擬成多臺虛擬機使用,其目的是提高服務器資源的利用率,但當需要把一個本身對資源要求高且平時資源利用率就很高的平臺遷移到虛擬機上運行時,這就違背了虛擬化的初衷,并且由于實施虛擬化后物理服務器上需要運行Hypervisor軟件,將更加降低服務器的利用率。這種業(yè)務平臺就不建議遷移到云資源池中。同時對于高I/O要求的業(yè)務平臺也不建議云化,一方面虛擬化層的增加會對I/O處理有所犧牲(雖然虛擬化產(chǎn)品廠商承諾影響較小);另一方面資源池需要使用共享存儲以實現(xiàn)高可靠性和動態(tài)遷移等功能,如果大量高I/O要求的平臺統(tǒng)一承載在一個共享存儲上,共享存儲將是一個較大的瓶頸。另外,鑒于目前云計算技術在安全領域尚未給人們足夠的信心,對于承載安全性比較重要的業(yè)務平臺,也是必須要評估的因素。綜上所述,在業(yè)務特性方面,結合云計算的特點建議從如下幾個方面進行評估。
(1)CPU資源
對于CPU資源要求非常高的業(yè)務平臺,如現(xiàn)有系統(tǒng)或應用運行在8核及以上(因目前虛擬化廠商的產(chǎn)品最大支持8核,今后可根據(jù)虛擬化廠商產(chǎn)品的發(fā)展,修訂評估依據(jù))的CPU物理服務器上,且平時平均利用率超過50%,暫不建議進行虛擬化或把該平臺對CPU資源需求低的模塊進行部分云化。
(2)I/O吞吐量
對于I/O吞吐量大的業(yè)務平臺,如系統(tǒng)或應用運行在每塊網(wǎng)卡上的平均網(wǎng)絡帶寬需求超過100 Mbit/s,對存儲LUN的平均IOPS大于2 000,平均吞吐量大于100 Mbit/s的DISK I/O暫不建議進行虛擬化或采用部分云化吞吐量小的模塊。
(3)安全敏感性
對于安全等級高或涉及敏感數(shù)據(jù)的業(yè)務平臺,暫不建議云化。
4.2.3 維護管理制約
業(yè)務平臺云化后,在日常維護管理手段和云化可操作性方面也必須進行一定的評估,主要評估內容如下所述。

表4 業(yè)務平臺云化評估
(1)維護手段或方式
對于云化后,無法按照維護界面要求或無技術手段實現(xiàn)對業(yè)務平臺遠程監(jiān)控和維護的平臺,不建議云化。
(2)網(wǎng)絡遷移的可行性
評估業(yè)務平臺云化后網(wǎng)絡遷移的可行性,特別是部分云化的業(yè)務平臺,從效益、效率、可執(zhí)行性方面進行組網(wǎng)方案的評估。
(3)業(yè)務的忙/閑時
在實際云化時,可根據(jù)業(yè)務平臺的忙、閑時的不同,把能實現(xiàn)錯峰填谷效果的業(yè)務平臺配置在資源池的同一個集群中,將能更好地提高資源池的利用率,不建議把峰谷同步的業(yè)務平臺整合在一個集群中承載。
4.2.4 云化評估
將上述評估要素整理成評估模板,見表4,在云化過程中可根據(jù)業(yè)務平臺的實際情況,對照評估模板進行評估,可得到業(yè)務平臺是否可云化的結論。
本文總結筆者近幾年在實施業(yè)務平臺云化方面的工作經(jīng)驗,結合云計算虛擬化技術發(fā)展的現(xiàn)狀,根據(jù)業(yè)務平臺的實際情況,摸索出了一套業(yè)務平臺云化的評估方法,探討了在實施業(yè)務平臺云化過程中需要重點關注和評估的3個方面,并針對3個方面的評估提出了具體的評估要求和參考指標,希望能在實施業(yè)務平臺云化工作中給讀者以指導和啟迪。
1 譚志遠,宮云平.云計算給業(yè)務平臺的發(fā)展與運維帶來的機遇與挑戰(zhàn)探討.電信科學,2011,27(10A):6~10
2 譚志遠.中國電信移動增值業(yè)務平臺快速云化解決方案.中國電信集團公司網(wǎng)絡運行維護事業(yè)部,2012