彭飛

摘要:解析高校數據中心基礎設施建設的演化歷程,論述全新的數據中心解決方案——超融合技術的實現原理和實際的應用場景,說明超融合技術適合高校的數據中心建設,比較三個廠商的超融合平臺,為高校技術選型提供參考。
關鍵詞:超融合;數據中心;分布式;SDS;SPOC
中圖分類號:TP311? ? ? 文獻標識碼:A
文章編號:1009-3044(2019)19-0014-02
云計算、大數據的迅猛發展和信息技術的不斷進步,促使傳統IT必須革新現有架構,以滿足不斷增長的數據和業務需求。數據中心作為IT的重要組成部分,已經多次進行了改進,高校的數據中心基礎設施也從最初的大型機系統逐步演變為融合系統,隨著軟件技術的發展,現在又開始走向分布式云平臺。經過總結一些高校的實施案例,本文提出,在現階段高校數據中心改、擴建前期,需要綜合考慮數據中心能夠承載的業務規模大小以及其具備隨業務需求而不斷動態擴張的能力,建議選擇超融合技術[1],它是一種基于大型互聯網企業數據中心的最佳實踐,實現了一種全新的web-scale(互聯網規模擴展架構)理念,包含當前及未來一段時間數據中心需要的關鍵技術:分布式計算、存儲系統、系統的自恢復能力等。
1 高校數據中心基礎設施建設演化
數據中心是由一組設備構成的,包括服務器、存儲、網絡及電力制冷等,提供業務應用所需要的計算、存儲和網絡這三項最重要的能力,經過不斷變革,今天的數據中心逐步形成軟件定義的模塊化、智能化,取代以往的硬件模式。在近20年的高校數據中心的發展歷程中,數據中心的基礎設施主要經歷了分散式、整合式、虛擬化、融合系統這四個階段,如圖1所示。
在高校數據中心的發展初期,業務系統通常部署在單臺服務器中,使用服務器自帶的磁盤或外部DAS(直連存儲)提供存儲能力,這樣直接導致其計算、存儲能力被束縛在單臺服務器內,無法有效的擴展。于是高校便開始將數據中心存儲設備由DAS變為集中式共享存儲SAN,這種架構有效地提高了存儲利用率、可管理性,加之系統軟件和應用軟件的集群功能,可用性也進一步提高,但隨著服務器增多,導致服務器資源利用率降低[2],不同的服務器品牌和型號使得運維困難,這時服務器虛擬化技術引入了整合式架構,進化為虛擬化架構,這樣便提高了資源利用率和運維效率[3]。但隨著虛擬機對于存儲空間的巨大消耗,導致數據中心需要的存儲設備不斷增多,成本越來越高,為了解決這些問題,有些資金充足的高校開始引入融合系統,即在一個大的機架中集成了服務器、存儲設備、存儲交換機和網絡交換機等設備,可以通過疊加模塊的方式進行橫向擴容,降低了用戶自行集成的復雜度,但融合系統通過硬件堆砌和軟件集成的方式,在集成效果上十分不理想,且只能使用同一標準的指定廠家設備,這樣造成高校的數據中心成本相比虛擬化架構也是有增無減。
通過演化歷程發現,高校數據中心始終處于服務器、集中式共享存儲和存儲網絡這三層架構,其成本、性能、可擴展性、可靠性、可維護性等都存在許多問題,所以現在高校急需選擇一種成本較低、性能優越、擴展性強等優點融為一身的體系結構來建設數據中心。超融合技術通過分布式架構、軟件定義存儲(SDS)[4]及自修復等核心體系結構,具備更小顆粒的擴展性、較高的性價比和方便統一的運維平臺,使得其很快成為高校數據中心新建、更新的首選解決方案。
2 超融合技術實現原理和應用場景分析
2.1 實現原理
超融合通過軟件定義存儲,將分布在各個節點上的磁盤形成一個虛擬的存儲系統,理論上存儲可以不受橫向擴展的限制,這樣就涉及一些基本的技術實現。
(1)元數據(MetaData)
所謂元數據,簡而言之就是數據的數據,例如原始數據的分布位置等原始數據的屬性描述信息。元數據是超融合平臺的核心,對于集群的擴展性及彈性起到了至關重要的作用。由于分布式架構原因,根據CAP理論 (Consistency/Availability/Partition Tolerrance,分區容錯性理論)? 和BASE原則[5],超融合平臺一般會把元數據復制成n份副本(元數據和n個副本一般為奇數個,即3、5或7等),并保存在不同的節點上,當元數據寫入內容(包括更新),會將內容同時復制到其他對等節點上,多數節點同意后,內容才會被提交,內容的提交采用Paxos算法(也可以選用Raft算法)強制一致性,確保數據的強一致。
(2)冷熱數據分層
權衡成本和性能,節點的本地磁盤有時候會使用SSD和HDD組合的形式,這樣SSD就變成緩存層。超融合一般會智能的將冷熱數據進行分層。基于程序訪問的局部性等原理,將經常訪問的熱數據放置到SSD層,當熱數據不經常被訪問,就會當成冷數據遷移到HDD。冷熱數據可以根據訪問的頻度智能遷移,當順序I/O或者單個文件體積比較大時,會跳過SSD直接寫入HDD。
(3)副本
元數據具備n份備份,原始數據也會保存多個副本,這樣當磁盤或節點發生故障,所有數據均會得到保護,集群會重建數據。此時正常元數據會掃描得到發生故障的設備上的數據副本的位置,進而進行數據重建任務。副本機制可以理解為數據備份,是分布式系統保證數據一致性和可靠性的基礎。在設備故障中,又可以分成磁盤故障、控制虛擬機故障和節點故障等不同的情況,但所有的故障,只要處于副本機制的可控閾值內,系統都會正常運行。
(4)數據本地化
傳統的共享存儲的方式,所有數據都不會如分布式存儲這樣離散的保存。在分布式架構下,數據訪問模式發生了改變,數據不再集中在一個或幾個存儲中,而是會離散到集群中的不同節點上,虛擬機訪問的數據有可能不在一個節點上,尤其是經過網絡傳輸時,會帶來一定的延時(如果采用Infiniband這種高帶寬低延時,則基本不存在這方面問題)。
超融合技術一般還包括存儲容量優化技術(糾刪碼、壓縮和重復數據刪除)等,以上技術實現都使得超融合技術可以將計算、存儲快速橫向擴展,也具備企業級可用性和安全性等特點。
2.2 應用場景分析
作為一種先進的高校數據中心基礎設施建設方案,超融合技術不強求用戶廢棄之前的投資和架構,而是可以與現有架構共存,也不需要對資源進行提前采購,而是按業務增長而不斷擴容,所以高校可以從小規模采用超融合技術并逐步擴展。本文經過分析實踐案例,認為以下場景適合引入超融合技術:(1)數據中心更新換代,(2)新數據中心建設,(3)空間與電力不足,(4)性能瓶頸,(5)可用性困難,(6)新應用上線,(7)災備數據中心,(8)高校分支機構建立需要集中管理,(9)快速上線應用等。在某些高校,超融合技術已經應用于其核心業務、大數據、桌面云及私有云和混合云等場景,在超融合平臺上部署和運行著諸如OA、網站群、小規模限制性在線課程(簡稱SPOC)等系統,并且十分穩定。
2.3 三種超融合技術對比
超融合優越的技術特點使得其市場迅猛發展,許多廠家也紛紛加入,高校需要根據自身需求對眾多超融合技術進行選型,本文選取市場上的常見的三種超融合技術進行詳細的分析介紹,如表1所示。
通過表1可以看出,路坦力、思科和華為分別實現了超融合技術里的分布式存儲,雖然這些技術實現有所區別,但技術原理與本文所述一致。
路坦力的超融合技術,采用定制或者OEM的X86服務器,每個節點安裝虛擬化軟件,并在虛擬化層運行著路坦力的控制虛擬機(CVM),這個控制虛擬機是路坦力技術的核心,其主要負責跨越不同節點之間的存儲信息的溝通及節點本地磁盤的管理等。路坦力解決方案中,本地落盤策略、SSD緩存、冷熱數據分層及設備高密度都是其優點所在,雖然本地落盤及SSD緩存保證高I/O,但硬盤的帶寬無法得到保證,故而路坦力的超融合技術適合應用于高IO需求的業務,不適合應用于低IO、高帶寬的業務,而且其CVM會消耗比較多的資源,也不能使用原有的舊設備,使其性價比大大打折。
思科的超融合技術除了計算、存儲分布式之外,還實現了底層網絡的分布式,但其HXDP主要部署在UCS服務器之上,一般還必須使用其SDN技術ACI,所以售價十分昂貴,成本比較高,不建議高校場景使用。
華為的超融合技術是由其原有的一體機方案演變而來,從架構上與其它超融合平臺還是存在一些差距,但華為不斷創新,依托其強勁的硬件也可以提供較為出色的計算速度和性能,此外,其還支持Infiniband網絡架構,使其超融合技術獨樹一幟,十分具有競爭力。
以上除了這三家超融合技術以外,還有基于vSAN技術的VMware、基于開源Ceph或GlusterFS等技術的一些國內廠商[6],根據技術實現的不同,他們的產品各有自己的優缺點,在高校數據中心建設的技術選型時期,一定要多對比,按照自己實際需求來選擇適合的超融合平臺。
3 結論
在高校的信息化建設過程中,數據中心始終處于中心地位[7],如果能將計算資源、存儲資源、網絡資源等有效的整合在一起[8],突破現有技術瓶頸,實現資源的最大化共享和利用,將是數據中心建設一直追求的目標。可以預見在未來的一段時期內,高校數據中心會逐步向超融合階段邁進,本文僅對于超融合實現的機理和應用場景進行論述,希望可以為高校的數據中心建設起到一定的參考作用。
參考文獻:
[1] 林勇.探究云化時代背景下的IT基礎架構——超融合架構[J].電子元器件與信息技術,2018(10):33-35,45.
[2] 張瑛.虛擬化云計算平臺的能耗管理[J].電子技術與軟件工程,2019(5):168.
[3] 李梓菥.云計算終端虛擬化平臺設計與實現[D].河北工業大學,2015.
[4] 錢朝陽,陸明勝.淺談超融合基礎架構[J].數字技術與應用,2016(09):216-217,220.
[5] 王乃和 大數據環境下數據復制的基本原則初探 數字技術與應用 2015(11):223.
[6] 王東明,錢朝陽.超融合技術在數字化醫院建設中的應用[J].數字技術與應用,2018,36(02):62-63.
[7] 鄭雅賓.淺析高校信息化建設亟待解決的幾個主要問題及對策[J].教育信息化,2005(17):19-20.
[8] 王成磊. 面向服務可信的服務資源自主組織研究[D].河南科技大學,2017.
【通聯編輯:李雅琪】