當前已有越來越多的企業將目光投向了那些具有高可用等級的公共數據中心服務。為了與現有IDC數據中心業務進行區分,人們將具有高可用等級的公共數據中心服務稱為EDC。
與IDC業務相比,EDC具有更高級別的數據中心可靠性和更加完善的基礎設施平臺。以高效可靠的供電為例,EDC會提供雙路市電,外加柴油發電機的供電保護,其中每一路市電均配有N或者N+1的UPS供電保護,如此一來,任何一路市電供電中斷,都不會影響IT系統的供電。即使兩路市電同時中斷,也還有柴油發電機的供電保護。按照設計要求,柴油發電機通常有不低于72小時的油料儲備,同時,這些數據中心還與其附近的加油站簽署有油料保障協議,幾乎可以做到萬無一失。
但這樣就真的可靠了嗎?我們不幸地看到,不斷有高等級數據中心宕機事件見諸報端,如2011年12月,亞馬遜旗下英國、法國、德國和西班牙數據中心宕機時間超過一個半小時;在過去的幾年間,全球最大的支付平臺PayPal、Google gmail系統、微軟數據中心、iWeb CL數據中心、Chase.com網上銀行、knocked Intuit網站數據中心均發生過嚴重的宕機事件,有些宕機時間甚至超過了24小時。國內的高等級數據中心也不能幸免,有些具有2(N+1)外加柴油發電機的可靠供電保障的數據中心,也一度發生了電力中斷的事件。
究其原因,本人認為,數據中心高可靠性并不僅僅是高等級數據中心設計以及產品設備的簡單堆砌,高投入并不一定帶來高可靠。數據中心的高可用性需要一整套管理的方法論和指標體系,其中,很多需要進行量化。萬國數據為此提出了業界首套IT高可用管理體系方法論,從評估、規劃、實施、運行與監控等5個層面實現,并對數據中心的標準作業進行管理,從而為用戶提供專業化的指導和安全高可用的保障。
仍以高可靠供電為例,2(N+1)外加柴油發電機的保護只是基礎,還需要高可用的管理體系,依靠運行管理,及時發現系統在運行中的隱患。目前很多數據中心還停留在事后告警的階段,即發生了故障或錯誤提供告警,根本不具備主動式高可用實時監控服務的能力。如果監管水平到位,將可以有效提高數據中心的可用性,避免數據中心中斷給用戶帶來的損失。
對于用戶而言,需要挑選真正具有高可用等級保障的公共數據中心服務。有些數據中心對外宣傳具有高效可靠的供電保障,設計了2(N+1)外加柴油發電機的安全保障,但實際上,僅是在某一個特定區域按照2(N+1)設計,用做樣板工程和對外宣傳,這就需要用戶在柴油發電機配置臺數和總功率方面認真加以核算,挑選那些真正具有高水平保障的數據中心。