李 純,鄒耀輝
(中國電信股份有限公司深圳分公司 深圳518048)
云計算是一種通過網絡以按需、易擴展的方式獲得所需服務或IT基礎資源的交付和使用模式,有SaaS、PaaS和IaaS三大服務模式。IaaS指消費者通過Internet從完善的計算機基礎設施獲得的服務,用戶能夠部署運行操作系統和應用程序等任意軟件。云計算能促進通信網絡技術應用系統升級換代,提供綜合信息服務運營基礎設施支撐能力。中國電信積極關注建立可運營、可管控的云平臺,利用虛擬化技術將基礎資源設施封裝為用戶可靈活使用的服務。中國電信股份有限公司深圳分公司(以下簡稱深圳電信)也積極投身于云平臺的試驗中,已成功搭建了一套本地IT虛擬平臺,承載了OSS/OA、增值等多項專業應用。
深圳電信本地OSS包括交換、傳輸、數據、動力環境監控等專業網管、網絡資源管理、開通服務保障、跨網專業網絡監控四大類,涉及服務器約448臺,除部分前置采集服務器外,大部分設備安裝在樞紐7樓OSS機房。由于早期的IT技術和系統分立建設等因素,平臺仍采用單一的物理服務器做業務組網單元,需要大量實體服務器。隨著業務擴展,實體服務器數量逐年增加。目前樞紐7樓OSS機房的UPS電源、設備機柜出現滿負荷狀態,已無法滿足OSS新業務對IT資源的需求。
搭建基于IaaS架構體系下的OSS云平臺能夠有效地推動深圳電信業務變革的實現,打造深圳本地IT發展的新優勢。其一,打破OSS平臺“一臺服務器、一個應用”的舊有模式,在每臺物理機上運行多個虛擬機,提高IT資源和應用的效率和可用性;其二,通過整合服務器將共用的基礎架構資源聚合到統一的資源池中,減少大量硬件、電力和散熱等需求,從而大幅降低能耗;其三,節省服務器占用空間,有效改善機房機柜位置緊缺的狀況;其四,節省硬件的成本投入,降低管理人工成本,提高經濟效益;最后,用戶無需關注底層基礎設施,便能夠自由控制、快速部署資源或獲得服務,按需擴展和使用。該云平臺將為深圳本地IT平臺的發展注入一股強大的生命力。
3.1.1 架構實現
目前,OSS架構主要包括采集層、數據處理及業務層、數據分析統計層3個層面。采集層設備主要完成協議轉換、業務設備運行、原始數據采集和轉發的功能,通過不同類型的物理鏈路業務直接相連,設備主要布放在業務設備所在地機房,分布區域廣,以專用采集設備為主,虛擬化難度較大;數據處理及業務層設備完成原始數據接收及預處理入庫和業務訪問接入,由PC服務器群組成,設備數量多,集中于樞紐7樓OSS機房,為主要的虛擬化對象;數據分析統計層設備完成數據統計分析和存儲功能,主要采用小型機設備和HA架構,數量較少,虛擬化移植成本較大。非安裝在樞紐7樓OSS機房的網管系統設備,受限于網絡條件及系統架構,需要進行網絡或系統架構的改造,虛擬化成本較高。
3.1.2 操作系統
OSS平臺服務器的操作系統分為UNIX、Linux和Windows 3類,UNIX運行在IBM、HP、SUN等小型機上;Linux和Windows運行在x86服務器上。由于目前主流的虛擬系統幾乎不支持UNIX操作系統小型機,因此本次云計算規劃平臺研究課題的主要對象為Linux及Windows兩類操作系統的PC服務器。
3.1.3 云計算優化資源
根據目前OSS的現狀及虛擬化條件,可做虛擬化的計算資源統計結果,可虛擬化的服務器為184臺,可云計算優化資源的統計結果見表1。

表1 可云計算優化資源統計結果
3.1.4 資源
(1)計算資源需求
將上述可云計算優化資源中的可虛擬化服務器作為樣本,采用調研表格獲取數據形式,收集整理服務器的業務應用系統信息、服務器IP地址、操作系統、服務器型號品牌、CPU型號及個數、頻率、CPU核數、CPU平均利用率、權重及CPU使用量(GHz)等信息,以兩個月為采集周期,采集184臺OSS服務器計算資源數據,統計CPU資源需求,得出資源需求分析結果,見表2。
①安全檢查與巡查。每年進行兩次以上水庫工程安全大檢查;每座水庫至少落實1名巡查員,按水庫大壩巡視檢查有關規定進行巡查。
(2)內存資源需求
將上述可云計算優化資源中的可虛擬化服務器作為樣本,采用調研表格獲取數據形式,收集整理服務器的業務應用系統信息、服務器IP地址、操作系統、服務器型號品牌、內存大小、內存平均使用率及內存使用量等信息,以兩個月為采集周期,采集184臺OSS服務器內存數據,統計內存資源需求,得出分析結果,見表3。

表2 計算資源需求分析結果

表3 內存資源需求分析結果
(3)存儲資源需求
將上述可云計算優化資源中的可虛擬化服務器作為樣本,采用調研表格獲取數據的形式,收集整理服務器的業務應用系統信息、服務器IP地址、操作系統、服務器型號品牌、磁盤空間實際使用率、系統容量大小、磁盤空間使用量等信息,以兩個月為采集周期,采集184臺OSS服務器磁盤容量數據,統計存儲資源需求,得出分析結果,見表4。

表4 存儲資源需求分析結果
3.2.1 云平臺基礎設計思路
OSS作為電信業務的重要支撐保障及運維管理系統,必須滿足業務可用性和連續性,同時滿足移動互聯網等業務的需要,因此規劃整個云平臺必須采取硬件設備全冗余配置及數據雙備份,以滿足業務可用性的需求和快速恢復能力,并進行多網段規劃,支持DCN、互聯網、DMZ等業務接入需求,綜合災備能力設計,滿足四、五星級關鍵系統的業務連續性需求。
根據數據的生命周期、對I/O性能的要求、數據重要性以及數據海量特點等因素,統一存儲架構應具備分級機制,對不同數據采用不同的存儲方式和存儲介質,充分提高存儲空間的利用率和管理效率。磁盤根據其性能分為價格低、容量高的SATA盤及高性能、高可靠的FC盤,此外采用電子存儲介質進行數據存儲和讀取技術的閃盤(SSD)已開始引入高中端存儲,其I/O讀取速度遠高于傳統磁盤。在存儲結構中采用分級機制,對于被頻繁訪問和關鍵的數據,因其往往只占整個數據量的3%~5%,卻帶來超過50%的IOPS需求,應將其置于I/O性能最高的閃盤中;對于較重要的對I/O性能有較高要求的數據,將其置于FC硬盤中;把相對不活躍的海量數據置于SATA盤,以降低成本。
在OSS云平臺上,存在大量重要性及對I/O性能要求不同的虛擬機。將虛擬機進行分類,有數據庫的虛擬機為關鍵數據,放在高級存儲中;一般應用系統的虛擬機為重要數據,放在中端存儲中;而做采集機的虛擬機為一般數據,放在低端存儲上。根據第3節OSS平臺資源分析,存儲資源需求為22 283.91 GB,約計需23 TB存儲空間,考慮OSS的重要性,存儲數據需做全備份冗余并預留40%的業務擴展空間,因此23 TB×(1+1)×1.4=64.4 TB,本次存儲規劃為64 TB的有效存儲空間。
3.2.3 服務器資源設計
結合目前OSS的現狀及虛擬化條件,根據上述可虛擬化184臺服務器采集數據匯總得知,OSS總體資源需求為:所有虛擬機需要CPU資源使用量157.485 9 GHz,總內存大小333.408 1 GB,總磁盤空間22 283.91 GB。選取主機模型Dell R910,具備4顆目前主流32 nm的可虛擬化8核CPU芯片XEON E7-4830,主頻型號為2.13 GHz,配置128 GB內存,得出以下服務器資源整合方案。使用Dell R910機架服務器整合184臺OSS,其CPU完全兼容虛擬化技術。單臺R910提供資源為CPU為68.16 GHz;內存為128 GB;為滿足業務系統的正常運行,保證CPU使用率在60%以下,需要4臺R910服務器提供計算資源,能夠提供的最大CPU資源為272.64 GHz。同時為保證虛擬化平臺的高可用性,需要增加4臺R910服務器作為虛擬化集群服務器全冗余配置,提供虛擬化集群高可用性功能,即8臺R910服務器共計CPU資源545.28 GHz,內存1 024 GB,滿足需求。
3.2.4 災備架構設計
虛擬平臺利用HA技術對基礎架構組件進行全面保護,可選擇本地或異地災備。利用HA技術對虛擬平臺上的應用程序資源及組件進行災備,以確保重要系統和業務的可用性、連續性及安全性。數據庫及重要關鍵系統可部署在硬件資源性能較高的設備上,分配高可用性的技術及高性能的系統資源,如綜合使用HA和快照技術;系統性能要求不高的系統和業務可分配低性能的資源;應用空閑的系統、業務及數據可將其歸檔至磁帶系統。利用全備份和增量備份技術對不同級別的系統和業務進行高效的保護。通過使用在線介質備份方法對數據的某一時間點的狀態進行快照和備份,當數據發生邏輯錯誤時可迅速進行恢復。通過使用集群技術有效防止服務器單點故障。
目前深圳電信IT網已成功部署了4套虛擬平臺,分別承載增值業務、OSS/MSS應用、動力監控及綜合告警系統等多專業應用,其架構如圖1所示。其中,增值業務孵化平臺虛擬化改造提供了一套快速部署的測試、開發、業務交付、系統數據遷移備份的基于IaaS架構的虛擬主機平臺,其上承載了增值云平臺網上營業廳活動專區、智能終端精確營銷系統、VVGO、掌上清系統、呼叫平臺接口5個關鍵應用;MSS虛擬平臺承載了割接流程管理系統、深圳電信文檔庫、文件服務器等24個OA平臺應用;OSS虛擬平臺承載了遠程控制堡壘機、防火墻監控服務器、防病毒服務器等15個平臺應用;動力監控及綜合告警系統采集機虛擬化改造構建了基于虛擬架構的數據中心基礎平臺,實現了57臺采集機整合。深圳本地IT虛擬平臺的4套平臺作為“云計算”實驗平臺,已為深圳電信業務的云化發展、運營及技術支撐提供寶貴經驗。
深圳電信本地IT虛擬平臺目前部署于14臺實體主機設備上,年消耗電量為3.2×104kW,僅占用機房2列機柜空間,其上共運行了154臺虛擬機。本地IT虛擬平臺等效實體主機設備154臺,虛擬化改造前需占用機房20列機柜空間,年消耗電量需多達3.64×105kW。通過虛擬化改造,有效改善了深圳電信本地機房機柜位置緊缺的狀況,顯著提高了機房空間利用率,共節省18列機柜空間。此外,由于減少了大量的硬件、電力和散熱等需求,大幅降低能耗,每年本地IT網增值業務、OSS/MSS應用、動力監控及綜合告警系統4套業務平臺運行共節約電量3.32×105kW。

圖1 深圳電信本地IT虛擬平臺網絡拓撲
基于IaaS架構體系的OSS云平臺規劃改造后,降低了硬件成本、節省了機房空間、減少了電力成本、降低了制冷需求、降低了能耗、提高了IT資源利用率。參照深圳本地IT虛擬平臺已有的實踐案例,并根據對深圳電信OSS平臺可虛擬化的184臺服務器的各項資源評估:改造前年消耗電量約為4.35×105kW,占用機房約23列機柜位置,368 U的機架空間;預計通過規劃改造,以Dell R910為實體主機模型,部署于8臺實體主機設備上,年消耗電量為6.3×104kW,僅占用機房4列機柜位置,32 U的機架空間,具體信息對比見表5。

表5 OSS平臺云規劃改造前后消耗電量及機架空間信息對比
由表5可見,運行于實體主機的OSS平臺的年消耗電量及機架空間資源均顯著降低,能夠大幅節約能耗,并直接改善深圳電信本地機房機柜位置緊缺的狀況。
基于本地IT虛擬平臺的實踐經驗,根據OSS平臺當前狀況的分析和改造效果評估,基于IaaS架構體系的OSS云平臺規劃將顯著提高IT資源和應用效率。同時本文提出的規劃將為未來深圳電信IT平臺虛擬化改造、機房節省空間、能耗降低的評估提供有效的參考依據,且對解決本地IT機房資源緊缺狀況及UPS電源和空調不足等問題具有建設性意義。
1 趙立威,方國偉.讓云觸手可及:微軟云計算實踐指南.北京:電子工業出版社,2010
2 許輝陽,李劼,羅霄翔.面向業務的云計算IaaS研究.移動通信,2011(9):20~25
3 鄧孟城.基于云計算IaaS的IT基礎架構建設方案探討.科技風,2011(11):53~53
4 涂艷麗.云計算及在IT支撐系統中的應用.中國通信學會第六屆學術年會論文集(上),2009