


云計算、大數據及社交等新的技術趨勢和業務需求,推動著中國迎來數據中心建設的又一輪高潮。而在這樣的趨勢中,傳統的數據中心開始顯示出不足。早期的數據中心都是作為一個工程項目進行,整個過程中參與單位眾多,配合界面復雜,而且缺乏靈活性和擴展性。隨著業務的發展和應用的增加,已無法滿足云計算彈性、廉價、標準化、可管控的技術要求。 在這樣的背景下,整個IDC行業都在反思和探索數據中心建設的新模式,微模塊就是在這一背景下推出的技術。
“微模塊數據中心的出現,是數據中心發展的一種新趨勢。”騰訊公司副總裁別洪濤在騰訊“數據中心分享日和開放日”上說。微模塊的技術最先是由騰訊借鑒國外模塊化數據中心經驗,再結合騰訊自身的業務特點自主創新研發出來的,具有易復制、部署快、高效靈活、標準化、節能和可靠性高等特點。因此最近幾年國內華為、中興通訊、浪潮和云立方等公司也紛紛推出各自微模塊數據中心解決方案,以抓住這個日益增長的市場所帶來的巨大潛力。比如2013年,在深圳坪山新區,騰訊、深圳聯通和中興通訊共同打造了亞洲最大的微模塊數據中心。
9月11日,騰訊首次公開自己的第三代數據中心技術,《計算機世界》記者受邀實地參觀了騰訊天津數據中心。這也是騰訊迄今為止最大的自主規劃、設計和運營的數據中心,采用了典型的微模塊設計。
事實上,在過去幾年里,騰訊已經推出了幾個版本的微模塊數據中心,經過不斷測試驗證目前已經標準化定型。騰訊對微模塊數據中心的標準定義是,以若干機架為基本單位,包含制冷模塊、供配電模塊以及網絡、布線、監控在內的獨立的運行單元。
微模雖小 但五臟俱全
從2001年開始,騰訊就開始在國內外布局自己的數據中心,截至現在已經在國內13個城市擁有超過58個數據中心,承載了數十萬臺服務器。本次參觀的天津數據中心共4棟樓,總建筑面積8萬平方米,可承載超過20萬臺服務。
通過驗證后參觀團隊先進入3號樓,這棟樓承載了10萬臺服務器,用電負荷差不多相當于8萬個城市家庭的總用電量。在一樓基礎設施層,記者看到規模龐大的水冷系統,巨大的管道用不同的黃、藍等顏色來區分,分別代表供水和回水管道。在這些管道上還可以看到有各種大大小小的閥門。騰訊天津數據高級經理閆昆介紹說,“整個天津數據中心有上千個這樣的閥門,因為冷水系統的管道設計成環形,當管道上任何一個位置出現破裂或其他故障時,就可以通過關閉附近的閥門來隔離故障點,不致于影響整個水系統的運行。”另外,水冷機組在運營過程中會消耗掉大部分的電力,當春秋冬季來臨時,天津運營團隊就會關閉水冷機組,通過板式換熱器和樓頂的冷卻塔,利用室外冷空氣對水降溫,達到節能的目的。而所有這些轉換和控制都是通過自動控制系統來實現。
三層是供電系統,在這里已經看不見傳統的UPS,而是采用“高壓直流(50%)+市電(50%)”的供電模式。“采用這種供電方案后,市電側無中間轉換損耗,效率高達100%;高壓直流側可采用節能休眠模式,全負載范圍內94%以上高效率。因此,綜合供電效率高達97%。”負責數據中心電氣設計的高級工程師李典林介紹說,“未來還可以無縫升級成市電主供+高壓直流后備的供電模式,達到99%以上供電效率。”
到達數據中心的核心區域——服務器機房,終于看到重點展示對象:微模塊。每個微模塊都包含自身的配電系統、空調系統、消防系統和監控系統等,可以簡單認為微模塊就是一個微型數據中心。據現場工作人員講解,微模塊的所有組件都在工廠預制和測試完成,到數據中心現場拼裝好即可投入使用,這個時間最短只需要兩個星期。因此,微模塊和整機柜解決了傳統數據中心建設的周期冗長、配合復雜的問題,可快速、靈活地部署,這個特點使微模塊更容易安排分期建設,保護投資。當數據中心退役時,這些微模塊還可以很方便地被拆卸下來,搬運到其他數據中心使用。此外,微模塊內部的電源模塊、行間空調數量等可以根據IT機柜功率靈活配置數量,滿足不同功率密度的需求,目前微模塊內可支持的最大機柜功率可高達15KW,而整個數據中心的PUE可保持在1.2到1.4之間。
這也是微模塊數據中心之所以獲得大型互聯網企業青睞的原因之一。物理上,微模塊數據中心將配電、制冷、機柜、冷/熱通道、橋架等設備集成到一起,舍棄架空地板、電力電池室、空調室等在傳統機房似乎必不可少的依賴條件,實現與機房環境的解耦,成為一個相對獨立的部署單元,結合微模塊整體方案和組件的標準化設計,可以實現數據中心的快速部署、彈性擴展。更為重要的是,在基礎設施集成化的基礎上,微模塊內的IT設備有了自己專享的配電和制冷單元,就可以實現二者間的智能協同工作。
“如果把服務器看成標準磚頭,機柜看成廚房、陽臺、洗手間,微模塊就是小戶型套房。通過微模塊,我們可以不斷復制堆疊,形成機房樓,乃至整個園區。”閆昆說道。
實踐高效運維 建設開放生態
隨著互聯網業務的快速發展,其數據中心除了自身數量、規模體量在快速增長外,其承載的業務也是海量增長。騰訊擁有即時通信活躍賬戶超過10億個,最高同時在線用戶超過2個億;微信/WeChat合并月活躍帳戶數達到4.38億;QQ空間月活躍賬戶數達到6.25億個;每日發送通信消息超過180億條,每日上傳圖片3.60億張。
面對如此海量的設備和需求,如何才能安全、高效、穩定的保障數據中心的運營也是重中之重。在數據中心的自動化系統方面,騰訊這兩年投入重兵,開始研發基于SDI(software defined infrastructure,軟件定義基礎設施)的控制系統,并將逐步向業界推出數據中心監管控系統的南向和北向標準。騰訊IDC平臺部數據中心高級經理郁智華在分享日上圍繞海量運營體系、安全應急保障體系、運營節能、成本控制和自動化運營平臺等方面,分享了騰訊的運營優化實踐案例及發展計劃。他將海量運營的關鍵之道歸納為:做好計劃性運營、做好自動化運營、做好外包管理和人員培養、做好預防性維護和應急演練、做好精細化運營。
在此次參觀過程中,記者還注意到一些細節。維護這個高達20萬臺服務器的超大規模數據中心,騰訊自己的運營團隊只有15人,其他管理是外包給專業人員,在現場記者看到數據中心的值班巡檢已經引入了手持PAD的電子化巡檢。而數據中心自動化運維方面,可以看到參觀通道的一根根綠色柱子上面都標注有字母或數字,是用來快速定位,并區分不同功能區域;在節能方面也可以看到無人進入的時候自動關閉白色照明燈,只保留少量藍色LED燈,保證最低照度滿足視頻錄像要求,在小處體現節約。
高效、自動化的運維,一直是騰訊數據中心的目標,但目前還只是做到半人工半自動化的運維狀態。別洪濤介紹說:“這跟整個大環境有關系,中國在這方面整體起步就比較晚,而且投入研發的數量有限,但現在隨著軟件定義數據中心概念的普及,相信真正實現自動化運維的日子不遠了,但那一天估計團隊維護人員在家通過微信就可以掌握數據中心的一切。”