朗飛


阿里巴巴將數據中心建到千島湖旁邊,騰訊將數據中心深藏在山洞中,如今的數據中心除了不能上天,這下水入地似乎無所不能。這雖然是句玩笑話,但也反映出隨著規模化、集約化、綠色化等理念的深入人心,數據中心一直在向著規模更大、速度更快、能效更高且永不停頓的目標前進。
在數字經濟時代,人們關注的目光都放到了數據和業務上,但任何轉型與創新都離不開數據中心的支撐。數據中心的高效、穩定、高可用和自動化運維是業務連續性的重要保障。
“可驗證”的數據中心
這并不是危言聳聽。在大多數據情況下,數據中心保持平穩運行,我們似乎感覺不到它的存在,而一旦出現問題,就可能讓企業傷筋動骨。時間回溯到2018年5月18日晚,北京某知名數據中心運營商在亦莊的數據中心兩路市電全停,機房全部負載由柴油發電機供電維持,直到5月29日,該數據中心機房完全依靠柴油發電機帶載近260小時。這讓數據中心專業人士聽到都感到后怕。這樣的數據中心真可謂危如累卵,客戶業務的連續性又從何談起呢?
隨著云服務的興起,我們越來越頻繁地聽到某某云服務商業務宕機的消息,AWS、阿里云、騰訊云等都曝出過云業務中斷的消息,引起了社會的廣泛關注,近期還出現了客戶向云服務商索賠上千萬元的例子。
企業上云有利于未來業務的開展和創新,但是任何事情都有兩面性,企業上云后如何才能更好地保證基礎架構的穩定、可靠和連續性呢?其實,萬變不離其宗,這樣一個業務新課題落到數據中心層面,還是要依據數據中心全生命周期管理的理念,抽絲剝繭,從數據中心的規劃設計開始,在建設、運維等各個階段,做到有的放矢、精益求精,通過不斷驗證和持續優化,盡量減少故障隱患,保證數據中心在全生命周期中都能健康運行。
施耐德電氣IT業務部數據中心業務架構總監張子揚介紹說,施耐德電氣為數據中心提供的全生命周期服務主要抓住四個關鍵周期:第一,規劃設計階段,施耐德電氣可以提供咨詢設計和設計驗證服務;第二,在建設末端到接維過程中提供測試驗證,保證設計所見即所得;第三,在運營階段為客戶提供永續運營的能力;第四,為數據中心提供二次評估。
覆蓋這四個關鍵階段,施耐德電氣的數據中心全生命周期管理服務能提供端到端的全過程管理,通過標準化、可視化的工具為客戶提供全過程的規劃、運營和升級服務,從而實現可驗證性,降低運營風險。
張子揚指出:“十年前,人們關注的是數據中心的可用性,但是現在可驗證性成為更關鍵的因素。在數據中心的規劃設計和建設階段,企業應盡可能地采用一些先進的數字化技術、工具和手段,提升數據中心的可視性和可驗證性。這就需要像施耐德電氣這樣的戰略合作伙伴提供適合的解決方案、工具以及專業的技術團隊?!?/p>
施耐德電氣在中國擁有36年的技術積累和豐富的實踐經驗,為許多大型數據中心的永續運行提供堅實的保障。這也讓施耐德電氣在實踐中鍛造出一套成熟的方法論,即WHOES工作法,包含識別設計需求、檢查或發現實施路徑、優化實施路徑或技術、檢查實施工程的工程語言合理性和檢查工程文檔的標準化程度。施耐德電氣整個設計認證團隊和測試認證團隊都嚴格按照WHOSE法則推進數據中心項目的落地和實施,逐步提高數據中心的可驗證性、可用性和能效。
專業的團隊、對行業的深刻洞察、成熟的工作方法論及豐富的實踐經驗,使得施耐德電氣能提供更高質量的數據中心全生命周期管理服務。
例如,河南中原云項目是政府和企業數字化轉型的典型。當地的老鋼廠、老電廠、老紡織廠都面臨著轉型的契機,很多人選擇跨界做數字地產。在這個過程中,如何充分利用自身資源優勢是一個值得深思的問題。中原云計劃用現有電廠的余熱實現數據中心的能源梯級利用。在規劃設計的中間階段,施耐德電氣作為合作伙伴加入,憑借設計驗證服務幫助客戶對整體施工方案進行了有機梳理,使項目變成真正可以落地運營的三聯供方案。如今,該項目已投運兩年,當地政府和企業對這一成果十分滿意。
據統計,目前中國的數據中心超過50萬個,規模僅次于美國市場。隨著云計算的快速發展,IDC也在積極轉型,國內托管數據中心的兼并與收購屢見不鮮。面對數據中心的規?;l展,如何通過規范化、標準化的服務滿足客戶對數據中心基礎設施建設和管理的新要求呢?企業必須重視數據中心全生命周期管理。
十年差距如何彌補?
如果將數據中心的全生命周期再進行一下簡化,其實也可以分成前后兩個階段:一個是數據中心的規劃和建設階段,另一個是數據中心的運維階段。上文,我們主要是在談數據中心的規劃設計和建設,這是廣大用戶耳熟能詳的,也是相對比較成熟的。只要能夠跟隨技術的發展與時俱進,并且遵循正確的方法論,大多數用戶在數據中心的規劃與建設階段都可以輕松應對。
需要特別提醒的一點就是,數據中心一旦建成就很難再改動,可能要使用幾年、十幾年甚至更長時間,如果在規劃設計和建設階段留下了隱患,在數據中心投入運維后再想追溯和修復,難度比較大。所以,用戶應該在數據中心的規劃設計和建設階段,反復多次進行驗證,用張子揚的話說,就是建立一個度量衡,通過驗證不斷與最初的設計目標進行對比、修正,提前發現問題、解決問題,讓那些隱性的問題無所遁形。
2017年的統計數據顯示,50%的數據中心出現過異常,18%的數據中心曾經發生過導致應用中斷的大型事故,數據中心的業務連續性一直是個嚴峻的挑戰。歸納來說,導致數據中心中斷的原因主要包括規劃設計階段的設計質量低下,以及運維階段出現的體系流程不完善、人員資質和數量不足導致維護跟不上等。
施耐德電氣IT業務部全生命周期服務業務拓展經理蔣勝表示,數據中心運營人才各個公司儲備都不足,中國的專業數據中心運營服務商與國外相比也有差距。美國數據中心基礎設施運營經理至少擁有10年甚至更長時間的數據中心基礎設施運營經驗。
與國外相比,中國在數據中心基礎設施運營方面至少有十年的差距。
許多人混淆了運維與運營兩個概念。運維就是設備的基本運行和維護,而運營則與業務密切相關。一些數據中心用戶搞不清數據中心運維和運營的區別,因此在選擇服務供應商時,會在專業的數據中心運營服務商和普通的物業公司之間舉棋不定。
蔣勝表示,通常數據中心投入運營5年后,由于設備老化,各種問題就會逐漸顯露出來。另外,大多數客戶會將大部分資金和精力投入在數據中心建設階段,而忽視了運維,甚至將數據中心全權交由物業公司代運維,大大降低了數據中心后期維護的質量,在故障發生時,很難及時準確地反應并采用有效措施。
施耐德電氣提供的數據中心管理是“運營”而非單純的“運維”。施耐德電氣不僅關注數據中心的高可用性和高可驗證性,還重視業務連續性、設備可用性和能效管理。
以聯通數據中心為例,最初,施耐德電氣接到代運營聯通呼和浩特和廊坊云基地的需求。聯通對施耐德電氣提出的明確要求包括:第一、施耐德電氣需幫助其建立符合聯通要求的運維體系;第二,提高整個數據中心的可用性和可靠性;第三,施耐德電氣要幫助其實現節能減排和優化成本。在施耐德電氣的幫助下,聯通云數據有限公司建立了自己的運維體系,提升了數據中心的可用性,不僅實現了零中斷,而且將成本降低了30%。
蔣勝介紹說,在運營階段,施耐德電氣可為客戶提供多種分層級服務。第一層為維護集成服務,即服務的總包。這種服務適用于金融類的小型機房客戶,可幫助客戶提供對UPS、制冷、配電和安防設備的所有供應商的統一管理服務。第二層為維護管理服務,是維護集成服務的升級,施耐德電氣將派遣一名服務專家到現場監督服務過程,并進行變更管理。第三層為關鍵設施運營,這是高度咨詢屬性的服務,將由施耐德電氣的員工在現場提供數據中心運營服務。
關鍵設施運營是最高層級的運營服務,從數據中心灰白區到樓宇管理層級,施耐德電氣在后臺可根據客戶需求提供大量全方位、標準化的資源。
數據中心的建設固然重要,但是后期的運維和運營同樣不容忽視,兩者相輔相成,形成一個完整的數據中心生命周期管理閉環。