陸小銘,曹維華,余勇昌
(中國電信股份有限公司廣東研究院 廣州 510630)
隨著云計算概念在國內的興起,三大運營商先后提出了自己的云計算項目,如中國移動的“大云”計劃,其主要目標是為了滿足IT支撐系統發展和提供互聯網業務和服務的需要;中國聯通推出了“互聯云”的概念,其目的是要把網內的IDC實現互聯和資源共享;中國電信則是聯合了在云存儲領域有成功經驗的EMC,以Mozy為原型推出了“e云”云存儲業務。云存儲既可以為云計算提供存儲能力,也可以單獨成為一種服務。e云業務就是面向公眾客戶和企業客戶的定位于數據備份的云存儲業務。
云存儲業務是通過IP網絡為個人和企業提供服務的,所以,網絡質量對用戶的業務體驗有著直接的影響。電信運營商有必要分析在何種網絡環境下能實現較好的業務體驗,同時如何利用自己可控的網絡部署和優化云存儲的組網,從而實現用戶體驗的提升,促進云存儲業務的發展。
云存儲是在云計算概念上延伸和發展出來的一個新的概念,它是指通過集群應用、網格技術或分布式文件系統等功能,將網絡中大量各種不同類型的存儲設備通過應用軟件集合起來協同工作,共同對外提供數據存儲和業務訪問功能的一個系統。從根本上來說,云存儲是一種實用型服務,它可以為眾多用戶提供一個通過網絡訪問的共享存儲池。從業務交付方式看,云存儲與SaaS服務有些類似,所不同的是云存儲所提供的是存儲管理和服務。云存儲池是可以靈活調整的,可以很輕松地擴展或根據客戶需求定制。
云存儲是存儲技術的集大成者,主要涉及了組織架構、數據優化、安全管理等三大方面的技術范疇。
云存儲利用了現有的存儲虛擬化、集群存儲以及SAN+NAS等技術。從架構上看,云存儲可以借助存儲虛擬化技術構建龐大的存儲池,屏蔽底層存儲差異,從而對外提供一致的服務。目前,云存儲系統結構模型主要由存儲層、基礎管理層、應用接口層和訪問層等4層組成。
·存儲層:它是云存儲最基礎的部分。存儲設備可以是FC光纖通道存儲設備,可以是NAS和iSCSI等IP存儲設備,也可以是SCSI或SAS等DAS存儲設備。
·基礎管理層:基礎管理層通過集群、分布式文件系統和網格計算等技術,實現云存儲中多個存儲設備之間的協同工作,使多個存儲設備可以對外提供同一種服務,并提供更好的數據訪問性能。
·應用接口層:不同的云存儲運營單位可以根據實際業務類型,開發不同的應用服務接口,提供不同的應用服務。
·訪問層:任何一個授權用戶都可以通過標準的公用應用接口來登錄云存儲系統,享受云存儲服務。云存儲運營單位不同,云存儲提供的訪問類型和訪問手段也不同。
云存儲同時需要具備重復數據刪除、壓縮和其他形式的數據優化手段,在備份、歸檔和主存儲上減少現有數據的總容量,并且使數據也得到最大程度的優化。
安全、基于策略的管理等也是云存儲應該具備的能力。云存儲應該能實現數據加密傳輸、冗余備份,并可以對免費用戶或付費用戶采用不同的存儲策略,從而實現服務的差異化,包括存儲速度、數據管理、存儲容量等。
根據用戶連接云存儲方式的不同,云存儲可以分為公有云存儲和私有云存儲。
如果用戶通過Internet連接到云存儲池,則屬于公有云存儲的概念。如亞馬遜的Simple Storage Service(S3,簡單存儲服務)、EMC的Mozy、中國電信的e云等。目前,公有云存儲業務還可以根據面向客戶的不同細分為以下兩類。
·面向企業用戶的公有云存儲業務:如亞馬遜的S3服務,其特點除了宣稱的可靠性、擴展性更好之外,最大的特點是面向開發,并提供了豐富的接口,開發者可以把它當作一個在線存儲解決方案,而不僅僅是一個獨立的網絡應用,因此比較適合增值業務商向客戶提供互聯網增值業務(如視頻分享、在線游戲、SNS等)。該類業務一般會按存儲容量按月收費,同時還會根據傳輸數據量收取一定的帶寬使用費。
·面向公眾用戶的公有云存儲業務:如Mozy、Dropbox、e云等,該類業務以面向個人客戶為主,當然也會有專門針對企業級用戶的方案(主要是增加了管理、統計和分析功能),但其最大的特點是以數據的存儲備份為主,并不提供應用開發的接口。該類業務一般會向用戶提供一個免費的存儲額度,如果要增加容量則要收費,或者企業級應用也要收費。另外,還有一些應用,如納米盤、Mofile等,則是以文件分享為主,其共享文件在存儲池存儲的時間長短與下載次數有關,下載得越多,存儲時間越長。
如果用戶通過Intranet連接到云存儲池,則屬于私有云存儲的概念。私有云存儲通常建立在一家公司的防火墻后面,需要用到該公司所有或授權的硬件和軟件,所有的企業數據都保存在公司內部并完全由內部IT員工控制。目前,私有云存儲已經有比較成熟的技術方案,如直接連接 存 儲 (direct access storage,DAS)、附 網 存 儲 (network attached storage,NAS)、存儲區域網 (storage area network,SAN)等。
云存儲作為一項互聯網增值業務,可以由專門的增值業務商提供,也可以由電信運營商提供,相比較而言,電信運營商擁有很多先天的競爭條件以及無可比擬的資源優勢。
·網絡資源優勢:云存儲是依賴IP網絡存在的業務,IP網絡的質量是決定存儲速度的關鍵因素,目前,國內絕大部分的網絡資源都由運營商掌控,因此,由運營商提供云存儲業務比較容易保證業務體驗。
·IDC資源優勢:電信運營商還控制著大量的托管機房業務,這為運營商快速部署分片區的云存儲數據中心提供了極好的基礎。
·良好的用戶信任感:電信運營商作為老牌的企業,用戶對其有比較好的信任感。
·牌照問題和內容審計:云存儲可能會面臨業務牌照的問題,同時也存在“內容審計”的潛在要求,電信運營商在這兩方面都有獨特的優勢。
目前是云存儲的發展初期,云存儲還不能安全可靠地處理那些需要一直保持快速網絡連接的交易文件或數據庫,因此云存儲并不適宜參與到網絡交易過程。同時,對于數據分享功能,內容難以管理和控制,將不可避免地遇到審計問題。因此建議云存儲業務定位于個人和公司的數據備份、歸檔和災難恢復,有條件嘗試數據分享功能(如只對企業內用戶開通)。
對于企業用戶,可以結合MPLS VPN業務推動云存儲的發展。企業開通MPLS VPN業務的目的是為了方便地組織企業內部網絡。但在開展MPLS VPN業務過程中發現,對于地區跨度比較大的電路,由于分支機構距離總部的網絡時延比較大,如中美越洋電路的網絡時延甚至超過200 ms,此時數據傳輸的速率就會一直維持在一個較低的水平,導致用戶投訴不斷。對此,可以采用云存儲滿足企業用戶的數據存儲和傳輸問題。
對于公眾用戶,建議著眼于移動互聯網用戶,由于無線信道不可避免帶來的長時延、丟包以及資源的有限分配,云存儲的速度肯定不會很高,所以只適合備份少量的數據,可以結合移動互聯網增值業務來推廣云存儲業務,如備份手機通信錄、日程計劃、照片、視頻等。
3.3.1 業務流量模型分析
在大多數的BS架構下的網絡應用,如HTTP、FTP、網絡視頻等都是以下行為主的非對稱模型,因此,作為電信服務的寬帶接入方式,都是按照此類模型設計的,如ADSL、EV-DO、WCDMA等。而云存儲應用作為一個特例,無論是在初始數據備份階段,還是在以后日常數據備份階段,都是以上行流量為主。
同時,由于云存儲業務注重數據的安全性和完整性,因此在數據的上傳和下載過程中,需要采用加密技術和校驗技術,這樣必然要求增加相應的數據包頭和校驗幀,從而增加了帶寬的消耗,在一定程度上影響數據備份速度。
以下對e云業務進行測試分析。測試方法是采用特定大小的文件進行備份,通過WireShark軟件抓包并分析。從分析結果得知,目前e云是由位于上海IDC機房的云存儲池提供的業務,對外只提供惟一一個地址,通過負載均衡技術將存儲任務分配到云存儲內的若干臺磁盤服務器內。
客戶端和存儲云之間采用TCP的傳輸層協議,所傳輸的數據采用了SSL加密。表1對備份文件大小和實際數據傳輸量進行了比較。
由此可見,由于采用了數據加密,數據包頭和校驗等需要額外的開銷,由此造成的備份過程中傳輸的數據流約為原始備份文件的1.4倍。
表1 備份文件大小和實際數據傳輸量的比較
3.3.2 云存儲速率測試及分析
在足夠的出口帶寬(155 Mbit/s)的情況下,選擇在不同網絡時延(不同的網絡時延取決于當時數據傳輸所經的路徑)的情況下進行測試,測試結果如下。
如圖1所示,在雙向時延為26 ms,丟包率為10-3級別的網絡情況下,備份存儲10 MB大小的文件需要約12 s,平均速率約為8 Mbit/s。
如圖2所示,在雙向時延為75 ms,丟包率為10-3級別的網絡情況下,備份存儲10 MB大小的文件需要約25 s,平均速率約為4 Mbit/s。
以上情況可視作企業用戶采用e云業務時所可能遇到的情況,由此可見,e云業務作為典型的TCP應用,其傳輸速率和網絡時延、丟包率有著重要的關系,實際測試結果也比較符合TCP吞吐率的計算公式(見式(1)):
其中,TPT為吞吐量,MSS為最大段尺寸,RTT為往返傳輸時延,P為丟包率。
如圖3所示,如果采用EV-DO上網卡作為接入方式進行備份,由于無線資源的共享使用特性,備份存儲5 MB大小的文件需要長達700 s的時間,平均的存儲速率只有60 kbit/s。
以上是公眾用戶在使用e云業務的典型情況,由此可見,3G上網用戶受限于共享性質的無線接入帶寬,其應用速率更低,用戶的接入線路部分成為云存儲業務的瓶頸,ADSL用戶也會遇到同樣的問題。
云存儲是與IP網絡密切相關的業務,對于用戶而言,云存儲在使用上面臨的最大瓶頸就是數據備份速度問題,下面分析了影響云存儲業務的因素并提出了應對策略。
網絡可用性:直接影響云存儲業務的可用性。該問題主要取決于網絡的健壯性,現網主要通過設備和路由冗余實現。
用戶的接入帶寬:會影響存取數據的速度,影響業務體驗,取決于用戶采用的接入技術。從目前的情況看,公眾用戶大量采用ADSL和3G上網的方式,數據上行速度并不會很高,只能依靠提升用戶的接入速度解決。而對于租用專線的企業用戶,可以在業務路由器和云存儲IDC多開一條高速直通鏈路(如圖 4所示),確保企業用戶訪問云存儲的速度,而企業訪問Internet的速度還是按照所購買的帶寬來進行。
網絡時延和丟包率:這兩者會直接影響到存取數據的速度,建議RTT應低于50 ms,丟包率應低于0.1%。網絡時延一般和線路的傳輸距離相關,因此存儲云可以采用二級網絡結構(如圖 5所示),數據IDC可以分區部署,通過負載分擔和就近接入的方式把數據預存儲在本區的數據IDC,各個數據IDC通過MPLS VPN網絡實現互聯,數據在完成本地備份之后,選擇在閑時進行數據的整合,包括冗余數據刪除、壓縮和磁盤整理等工作。
減少數據傳輸量也是提升業務體驗的重要手段,采用增量備份方式也可減少數據的重復傳輸,同時,在采用專用客戶端的情況下,可以在數據備份前做壓縮和加密,取代傳輸過程中的SSL加密,減少傳輸開銷。
在數據初始備份階段,受限于連接云的網絡連接能力,企業與云存儲之間GB、PB以上數量級數據的上傳就已經是一個很大的挑戰。所以,在初次備份時,可以采用物理遷移的方法,也可以提供從云存儲節點到企業用戶的臨時專線連接,從而完成大量數據遷移到“云”里。在初始備份之后,日常數據的備份可以采用增量備份的方式,從而降低網絡帶寬壓力以及提高數據備份速度。
可靠的網絡和良好的部署方案是開展云存儲業務的重要保證。電信運營商同時擁有網絡和IDC資源,在開展云存儲業務中處于優勢地位。在發展云存儲業務的時候,一方面要考慮存儲數據的壓縮和優化,另一方面要考慮優化網絡組織,從而實現較好的業務體驗,同時也需要面向不同的客戶為云存儲找準業務定位,結合主營業務去進行有針對性的推廣,才能取得應有的效果。
1 Jitendra Padhye,Victor Firoiuy,Don Towsley,et al.Modeling TCP throughput:a simple model and its empirical validation,www.sigcomm.org/sigcomm98/tp/paper25.pdf
2 馮翔.電信運營商的云計算戰略.通訊世界,2009(5)
3 李磊,王金倫,王薇等.電信運營商發展云計算的安全問題剖析.信息安全與通信保密,2009(10)
4 馮丹.網絡存儲關鍵技術的研究及進展.移動通信,2009(11)
5 鄧仲華,喻越.云環境下的信息服務等級協議研究.圖書與情報,2009(4)
6 陳康,鄭緯民.云計算:系統實例與研究現狀.軟件學報,2009(5)