黃 磊
(中國電信股份有限公司上海研究院 上海 200122)
云計算(cloud computing)是分布式計算技術的一種,透過網絡將龐大的計算處理程序自動分拆成無數個較小的子程序,再交給由多部服務器組成的龐大系統搜尋、計算分析,之后將處理結果回傳給用戶。透過這項技術,網絡服務提供者可以在數秒之內,實現處理數以千萬計甚至億計的信息,達到和“超級計算機”同樣強大效能的網絡服務。這種由多部服務器組成的可以自我維護和管理的虛擬計算資源就是“云”。“云”通常為一些大型服務器集群,包括計算服務器、存儲服務器、寬帶資源等。云計算將所有的計算資源集中起來,并由軟件實現自動管理。
廣義云計算是指服務的交付和使用模式,指通過網絡以按需、易擴展的方式獲得所需的服務。這種服務可以是與IT和軟件、互聯網相關的,也可以是任意其他的服務,它具有超大規模、虛擬化、可靠安全等性能,適用于“公用云”。“公用云”一般由第三方運行,而且可以把來自許多不同客戶的作業在云內的服務器、存儲系統和其他基礎設施上混合,最終用戶不知道運行其作業的同一臺服務器、網絡或磁盤上還有哪些用戶。
狹義云計算是指IT基礎設施的交付和使用模式,指通過網絡以按需、易擴展的方式獲得所需的資源。與廣義云計算不同,狹義云計算適合于“私有云”。“私有云”往往是由單個客戶所擁有的按需提供基礎設施,由該客戶控制哪些應用程序在哪里運行。它們擁有服務器、網絡和磁盤,并且可以決定允許哪些用戶使用基礎設施。
如果說由“公用云”來推動云端服務的創新與應用是錦上添花,那么通過“私有云”來解決目前大部分大型企業IT困惑就可謂是雪中送炭了。2009年上半年,麥肯錫管理咨詢公司就云計算的應用情況作了一份報告,在報告中提出若大型企業將所有的運算外包到云端上,可能會付出更高的成本。與其轉移到云端服務,不如參考云端運算業者的作法,提升服務器利用率,可降低逾50%的服務器整體擁有成本。對于大型企業來說,在經歷了振奮人心的ITSP、轟轟烈烈的信息化大規模建設后,本應松口氣的CIO和IT人卻發現他們面臨另一個困境:IT投入不減反增,業務期望無法有效滿足。
首先,龐大復雜的基礎設施需要較高的投資和維護成本。現今大型企業IT建設通常以針對系統的項目來運作,再加上生產環境中各業務與應用均十分重要,獨立設計利于提高系統的安全穩定性,但導致企業往往擁有十幾甚至幾十個縱向、相對獨立的IT支撐系統,應用系統之間彼此獨立,即“煙囪現象”較為嚴重。每個系統都有各自一套專有的生產運行環境:數據庫服務器、應用服務器、接口服務器、Web服務器……再加上配套的開發、容災等環境,使得IT硬件投資和維護成本居高不下。IT硬件投資和維護成本的投入很大程度上制約了企業在軟件、應用上的IT投入。
其次,資源利用率普遍偏低,IT資源使用存在不均衡現象。大型企業的IT支撐系統的服務器利用率非常低,很多企業服務器平均使用率低于 30%,部分甚至低至5%~8%。資源使用不均衡存在兩種情況:一是服務器間不均衡,主要應用服務器的使用率較高,而接口服務器、中間件服務器應用率普遍偏低;二是峰值與非峰值間不均衡。IT系統需要具備面對周期性高峰壓力的處理能力,如電信運營商網上營業廳存在月底大規模客戶轉套餐、月初大批量客戶進行賬單和詳單查詢等使用高峰情況。忙時/峰值時的應用需求對服務器配置提出了很高要求,而在非忙時資源就呈閑置狀態。因此,大型企業IT都存在這樣的情況,老業務擴容加上新開發的業務對資源提出了更多需求,一部分服務器處理能力明顯不足需擴容,另一部分服務器的處理能力被大量閑置。
那么,大型企業應如何通過“私有云”提升服務器利用率,從而降低其擁有成本呢?前文中提到過云計算將所有的計算資源集中起來統一使用,而這種計算資源的集中是通過虛擬化技術來實現的。虛擬化是云架構的一種基礎性設計技術。虛擬化允許將服務器、存儲設備和其他硬件視為一個資源池,而不是離散系統,這樣就可以根據需要來分配這些資源。虛擬化既可以將單個服務器視為多個虛擬服務器和群集(clustering),又可以把多個服務器視為單個服務器。企業可以通過以大化小(單個服務器拆分成多個虛擬服務器)和以小聚大(將多個服務整合成單個服務器)來降低IT采購和運維投入。
第一步,以大化小。整合開發測試環境及接口服務器、Web服務器等利用率較低的服務器,將高端服務器劃分成多個虛擬服務器,提供給開發測試、接口服務器等使用,可以大幅度降低采購和維護成本。顯性收益方面,一個高端服務器比同效能的幾臺低端服務器的整體成本要低很多,另外開發測試機、接口服務器等的資源利用率普遍偏低,通過以大化小方式做到 “實用實得”可以大幅減少資源閑置狀況,替換下的服務器可以派做他用。隱性收益方面,通過減少服務器數量可以減少動力空調耗能以及數據中心機房空間。
第二步,以小聚大。通過虛擬化技術使企業內部已擁有的豐富計算資源實現池化共享,通過IT資源共享和動態分配,使閑置資源得以充分利用,從而提高資源利用率。虛擬化技術使得整合多個 IT資源成為可能,除服務器和存儲整合之外,虛擬化還可整合系統架構、應用程序基礎設施、數據和數據庫、接口、網絡、桌面系統甚至業務流程,因而可以節約成本和提高效率。在虛擬化之前,企業數據中心的服務器和存儲利用率一般平均不到50%(實際利用率通常為 10%到15%)。通過虛擬化,可以把工作負載封裝一并轉移到空閑或使用不足的系統,這就意味著可以整合現有系統,因而可以延遲或避免購買更多服務器容量。
企業要搭建“私有云”,還有幾項基礎工作需要準備。
第一,摸清家當,進行服務器資源梳理分層。不同應用對服務器的要求也不一樣,如對計算速度的要求較低的訪問級服務器、對計算速度要求非常高同時有較高的I/O和內存的應用級服務器以及作為客戶數據和交易數據等核心數據庫處理需求承載的數據級服務器,“私有云”需支持不同類別的服務器“級”自動選擇和服務器組的負載均衡。
服務器方面,通常可分為訪問級、應用級、數據級三類。訪問級服務器群通常用作Web服務器、E-mail服務器、文件服務器、打印服務器等,其特點是對計算速度的要求較低,要求有一定的冗余和可擴展性,I/O、內存的要求視服務的具體規模和要求而定。應用級服務器群通常作為ERP/SCM、CRM、BI等應用程序和中間件的承載,特點是對計算速度的要求非常高,通常要求它們處理大量的復雜的業務邏輯,同時要求有較高的I/O和內存。數據級服務器群通常作為客戶數據和交易數據等核心數據庫處理需求的承載,作為最高端的服務器組,具有非常高的處理性能、I/O帶寬和非常高性能的內存。
存儲方面,可分為數據交易型、數據共享型、數據分析型、數據備份存儲型4類。交易型存儲設備群主要應用于交易型數據等實時性要求非常高的數據的存取,特點是存取速度非常快,I/O吞吐能力非常高,穩定性非常好。數據共享存儲設備群主要應用于SID/ODS等需要大量讀取的數據,特點是讀取速度非常快,并發處理能力非常好,I/O吞吐能力非常高,穩定性非常好。數據分析存儲設備群主要應用于OLAP、數據挖掘等需要海量存儲的數據,特點是存儲容量非常巨大,而對I/O、并發處理的要求相對不會那么高。數據備份存儲設備群主要應用于數據備份,包括廉價磁盤備份和磁帶備份等,其容量非常巨大,但是對讀寫和吞吐的要求非常低。
另外,在分類分層時,還應考慮到所對應的應用的業務特性:是面向外部客戶使用的還是面向內部員工使用的,是支持生產運營的還是支持內部管理的。總之,各種企業應用對基礎設施會有不同要求,層次化能滿足各種應用的個性需求。比如,對于海量數據,存儲網絡中有數據分析存儲來加以滿足;對于高并發的處理請求,數據級服務器群能夠很好地滿足性能要求,針對高性能讀寫,存儲網絡都能相應地支持;對于OCS超高速的處理要求,可通過在數據級服務器內存建立內存數據庫的方式解決,穩定性方面,數據級服務器足以滿足OCS的要求。
第二,規范制度,轉變硬件采購模式和資源調配流程。首先,要轉變IT硬件采購模式,實現統一規劃集中采購,要杜絕項目獨立采購物理機的要求。其次,采購的物理機要適合虛擬化,計劃納入云中的服務器需采用PC server。因為業界在小型機虛擬化方面沒有統一的標準,并且在使用中利用率一般較高,而PC server在虛擬化方面比較成熟,支持跨廠商、跨機型的虛擬化整合。PC server采購盡量選用高端成熟產品,而已出保的低端服務器在考慮總體擁有成本情況下應停止使用。然后,需制定虛擬資源調配流程。原有資源調配流程中調配對象為PC服務器,完成后需要進行系統安裝部署;實現PC服務器虛擬化后,調配的對象為虛擬機,可以在調配過程中直接實現系統快速安裝和部署。
第三,強化管理,建立“私有云”智能化管理平臺。智能化管理平臺是數據中心智能化管理能力的基礎平臺,它提供虛擬化技術環境的信息采集和數據交換界面,實現資源的智能化調度。要實現智能化管理中心,首先需建立IT統一動態配置庫。隨著“私有云”的建立,以前業務應用與底層承載的基礎設施的緊耦合模式被打破,基礎層的計算、存儲資源實現虛擬化,與業務應用層沒有直接綁定關系,而是根據需要可以進行動態調配。因此,IT基礎設施的配置信息從以前的按系統獨立向統一轉變,從以前的靜態配置向動態配置轉變。為支持這種轉變,必須建設統一的IT配置信息庫(CMDB),并且配置信息庫與服務器、存儲等設備的網管系統連接,能實時從IT網管中獲取配置信息。在CMDB基礎上,建立規則配置中心,可以用于自動化處理、監控報警、安全策略的規則配置。另外,還要為管理人員提供統一的用戶界面,以圖形化視圖展示云環境運行狀況的所有信息。
“私有云”也許沒有”公眾云”那么引人注目、影響深遠,但它卻能切實可行地解決目前大型企業面臨的IT發展瓶頸問題。“行到水窮處,坐看云起時”,迫切的需求才是“云計算”應用的最大驅動力。