郭濤
英特爾在推動整個行業的創新,以及將行業的一個創新點變成整個行業的普適標準方面具有非常豐富的經驗,也有許多成功的案例,“天蝎計劃”和整機柜服務器就是成功的例子。
目前,中國用戶部署的“天蝎”整機柜服務器的機柜數量超過了1萬個。雖然從絕對數據量上來說并不多,但就像是星星之火,整機柜服務器已經形成了一個細分的服務器市場,也是互聯網巨頭、運營商的新寵。
整機柜服務器已步入正軌
“相對于傳統服務器來說,整機柜服務器是一大創新。而這種創新的原動力來自于用戶的業務需求。”作為整機柜服務器的典型用戶,開放數據中心委員會(ODCC)騰訊服務器平臺組長曹潯峰最有發言權,“2008年前后,騰訊就發現服務器機架的高度整合,可以更有效地整合供電、散熱,從而帶來整體擁有成本的降低,實現彈性部署并節能,這對我們的業務發展來說非常有益。”
近幾年,隨著云計算的快速落地,騰訊的云業務也得到了高速發展,而數據中心資源池化成了推動云業務成長的重要動力。騰訊從2010年就開始研究整機柜服務器,那時還沒有“天蝎計劃”。在后來的“天蝎1.0”“天蝎2.0”中,騰訊主要參與的是機柜基礎架構方面的研究,集中在供電和散熱兩個方面。
目前,騰訊部署的整機柜服務器數量并不多,大約有幾百個機柜,主要部署在一些自建與合建的條件相對較好的數據中心機房。因為整機柜服務器對地板承重有特殊要求,所以機房的基礎設施必須達到一定要求。“我們之所以采用整機柜服務器,就是希望整個基礎架構對于應用和用戶來說是透明的。”曹潯峰表示,“目前,部署在整機柜服務器上的主要是一些核心應用,包括游戲、QQ、微信等,不過從整體的應用數量來說還不太多。”
騰訊是最早提出整機柜服務器概念,又是行業中第一個部署整機柜服務器的,但為什么到現在也只采用了幾百個機柜?這是因為騰訊現有的數據中心基礎架構所限。騰訊的機房數量多、分布廣,而且業務類型非常多,資源調配比較復雜,部署整機柜服務器涉及大量設備和系統搬遷轉移的工作。畢竟整機柜服務器是一種全新的架構,它不像是標準的服務器機柜,互通性還存在一些問題。
整機柜服務器帶來明顯的收益主要是從2015年云計算大規模興起后開始的,大量的云業務對機器的性能、硬件的彈性要求非常高,同時又要降低成本。不過,“天蝎1.0”“天蝎2.0”在基礎架構資源池化方面的能力很難滿足云業務增長的需求,所以即將出臺的“天蝎3.0”的核心內容之一是資源池化3.0。
中國信息通信研究院的數據顯示,最近幾年,我國IDC產業快速發展,年增長率超過30%。2015年,國內IDC市場整體規模達到500億元左右,數據中心逐步呈現規模化、集中化的趨勢。
在2016開放數據中心峰會上,ODCC發布了“天蝎2.5+”設計規范和下一代公板規劃,以及天蝎整機柜服務器冷存儲技術規范。另外,“天蝎3.0”規范的制定也取得了很大進展。“天蝎3.0”面向云計算、人工智能等多樣化需求,通過對服務器、存儲和傳輸資源進行解耦和池化,從根本上改變了現有服務器的架構。
面對大數據、人工智能的快速發展,ODCC正致力于海量冷數據存儲方面的研究。中國電信、百度、阿里巴巴、騰訊、英特爾、中國移動等都參與了天蝎冷存儲服務器項目。與普通服務器相比,單臺天蝎冷存儲服務器的密度提升50%,單機柜存儲密度提升2倍,節能35%,成本節約超過43%。“天蝎計劃”正穩步向前發展,整機柜服務器市場前景廣闊。
RSD與RSA是互補關系
作為應用方,騰訊從業務的角度出發,提煉出產品的需求,而最終將想法變成產品落地還是要依靠像英特爾這樣的廠商。“ODCC建立了一個良性互動、多方參與的大生態體系。”曹潯峰表示,“英特爾在‘天蝎1.0時代就扮演了技術顧問的角色,為我們的產品創新提供了強大的支持。與其他供應商不一樣,英特爾對我們的支持是長期的,而且主要體現在生態系統方面。”
英特爾數據中心事業部云服務商部門總監Steve Berg表示:“英特爾一直以來都鼎力支持ODCC和‘天蝎計劃的發展。作為ODCC技術委員會唯一的技術顧問,英特爾致力于提供各種各樣的技術支持,并將開放數據中心推向行業市場,同時支持開源軟件的發展。”
英特爾專注的是軟件方面,這與ODCC推出的整機柜服務器的硬件規范是互補的。英特爾認為,SDI(軟件定義基礎架構)是數據中心未來的發展方向。整機柜服務器可以更好地滿足SDI的需求。英特爾一直致力于生態圈的發展,與合作伙伴廣泛地協作。基于英特爾RSD(Rack Scale Design)架構的商業化服務器產品將由英特爾的合作伙伴分別推出。
在2016年9月于上海舉行的HUAWEI CONNECT 2016全聯接大會上,華為正式發布了支持Intel RSD(Rack Scale Design)架構的服務器。華為FusionServer E9000融合架構刀片服務器、FusionServer X6800高密度服務器成為率先支持Intel RSD架構的產品。這兩款服務器均采用全模塊化架構設計,集計算、存儲等資源于一體,能夠全面提升客戶的運營效率和數據處理能力。
英特爾與騰訊之間的合作關系是非常緊密的。很多時候,英特爾與騰訊的工程師都是坐在一起,將用戶的需求“翻譯”成軟硬件的設計需求,一起進行設計和開發,最近雙方的合作主要集中在NVMe、Fabric、PCIe等方面。
“在我們提出第一代‘天蝎概念的時候,英特爾正好也提出了整機柜的概念,與我們的理念十分相似。英特爾當時提出的是整個軟件的框架——將多系統組合起來的接口框架。‘天蝎1.0將供電、散熱基礎設施進行池化,然后與英特爾的軟件框架相結合,即將硬件的需求與軟件的標準結合在一起,才真正統一了BAT三家企業的需求。一個標準的軟件框架,再加上統一的硬件需求和目標,‘天蝎1.0就這樣確定了下來。”曹潯峰表示,英特爾在推動“天蝎”標準的實施和相關產品落地方面起到了至關重要的作用。
早在2013年,英特爾就提出了“重塑數據中心”的口號,其目標是將服務器、存儲、網絡等部件整合在一起,實現徹底的資源池化,而RSA是實現這一目標的關鍵節點。RSA是英特爾提出的一種先進的設計,能夠大幅度提升數據中心的利用率和靈活性。在2016年4月深圳舉行的2016英特爾信息技術峰會(IDF)上,來自國內的九州云(99Cloud)展示了基于英特爾RSA(Rack Scale Architecture)架構的OpenStack Animbus產品,它增強了對硬件感知的能力,具備更加高效、快速的硬件資源調度能力。
Steve Berg解釋說:“RSA與RSD兩者之間是互補的關系。英特爾在定義RSD的時候,更注重的是邏輯架構。它是一個軟件框架,通過API能夠將底層硬件的能力釋放到軟件層面。而RSA更注重的是硬件架構的定義。所以,兩者是非常好的互補關系。”
最開始,英特爾做的是整機柜架構,現在英特爾正式將它開源并貢獻給社區,它也因此變成了整機柜設計的實施參考,可以讓更多的開發者在此基礎上開發自己所需的解決方案和應用。現在,RSD 1.0軟件已經可以供廣大開發者下載和使用。一些軟件提供商正基于RSD 1.0做后續的產品研發。
“以前,我們更多地談論整機柜服務器的架構,而現在更注重的是整機柜服務器產品的開發;以前,發力主要在架構層面,現在已經進入到具體的產品設計階段。可以說,RSD是RSA的延續。”Steve Berg告訴記者。
從點到面
英特爾在推動整個行業的創新,以及將行業的一個創新點變成整個行業的普適標準方面具有非常豐富的經驗,也有許多成功的案例,“天蝎計劃”和整機柜服務器只是其中的一個例子。當用戶將業務需求提煉出來后,將這些需求變成機器語言,并最終轉化為成熟的產品,這是一件非常復雜的工作。“當初,英特爾專門派了一名上海研發中心的專家到我們公司,幫助我們把用戶需求轉換成機器語言,然后做出整機柜服務器的樣機。經檢測,該樣機的性能和功能可以滿足我們的應用需求。我們邁出了成功的第一步。”曹潯峰如是說。
Steve Berg表示:“英特爾會持續對‘天蝎計劃提供支持。作為技術領導者和創新者,英特爾的硬件架構在性能和整體擁有成本上具有獨特的優勢,這兩方面也是未來我們將重點突破的。”
目前,整機柜服務器主要還是服務于大型互聯網廠商和運營商。整機柜服務器何時才能大規模進入企業級數據中心呢?Steve Berg表示:“如果企業用戶能夠接受整機柜的架構和設計,我們將提供大力的支持。”