
在數(shù)據(jù)中心數(shù)以百計甚至上千、上萬臺服務器中,有一些白白消耗資源卻什么事也沒做的服務器——僵尸服務器混入其中。
基礎設施管理公司Cormant的CEO Paul Goodison說:“這對許多數(shù)據(jù)中心來說是個非常重大的經(jīng)濟問題。數(shù)據(jù)中心的服務器中大約有10%?30%是閑置的僵尸服務器,一臺服務器每年花費的成本大約是2000美元,假設一家企業(yè)有4000臺服務器,如果其中400臺是僵尸服務器,那么每年就有80萬美元花費在白白浪費資源的服務器上。這是一筆非常龐大的支出。”
Paul Goodison提到,Cormant的一個客戶原以為自己有900臺服務器設備,Cormant經(jīng)過清查后,發(fā)現(xiàn)該客戶實際上共有1300臺服務器,其中一些并沒有連接到局域網(wǎng),但是仍連接到了電源上。
僵尸從何而來?
僵尸服務器的出現(xiàn)往往有兩個原因。一是服務器被公司用來在一段時間內處理較輕的任務,成了開支電子表格中的一個單項。隨著時間的推移,慢慢不需要該服務器上的應用程序了,但企業(yè)內部并沒有停止使用該服務器的任何流程,或就算啟動了停止使用的流程,也只是完成了一部分,而不是完全停止使用。
Paul Goodison解釋說,之所以不停止使用服務器,是因為企業(yè)并非絕對確信這就是需要停止使用的那臺服務器。經(jīng)常聽到管理員說:“這臺服務暫時留著吧,到時還要用。”可之后卻再也沒用這臺服務器。
另一種原因可能是IT管理員從不記錄是哪個用戶在使用服務器上的服務。最終,服務器根本沒人使用了,卻無人知道。Paul Goodison表示,如果企業(yè)沒有部署IT管理解決方案的話,那么這種情況就很常見。服務器往往是臨時啟用的,尤其是當它們作為特別研發(fā)項目的一部分時。我們只是知道服務器擺放在那里,卻不知道它有什么用途,或者誰配置了它。
牢牢控制住數(shù)據(jù)中心
為了牢牢控制企業(yè)的數(shù)據(jù)中心,IT管理員應從詳細登記備案入手。Paul Goodison提醒說,這不僅僅意味著制作一份電子表格,而是需要先準確記錄物理設備以及用戶信息,然后記錄下網(wǎng)絡和數(shù)據(jù)連接。交換機也可能成為僵尸機器,所以同樣需要把它們記錄下來。另外,還需要一款數(shù)據(jù)中心基礎設施管理(DCIM)工具,以便提供一種通用的、實時的監(jiān)控和管理平臺,以便統(tǒng)一管理IT和數(shù)據(jù)中心基礎設施。同時,必須定期更新記錄,包括新設備添加后更新的用戶信息。
Paul Goodison說:“除非你清楚誰擁有新服務器,否則不應該讓新服務器投入運行。對流程的變更和管理,是讓大家以一種更有條理的方式記錄服務器的功能。我們需要從更全局的角度關注服務器的部署,而不再是一味地關注服務器的物理部署,同時還要確保對這些服務器做了詳細的登記備案。”
一旦登記備案和管理工具落實到位,就要開始定期查詢和分析手頭的邏輯信息,包括耗電量、處理器利用率和網(wǎng)絡流量等。這對無法立即識別的服務器來說特別重要。這些衡量標準常常可以幫助你揪出僵尸服務器,因為僵尸服務器的耗電量、處理器周期和流量常常保持不變。
Paul Goodison說,IT管理員現(xiàn)在應該注意那些不知道有什么功能的服務器,然后不妨登錄進去看一下這些服務器的標記是否正確、它們是否在處理任務,以及一段時間后,它們是不是仍在處理工作。他補充說:“不但要關注整個物理環(huán)境,還要查詢數(shù)據(jù),看看這些服務器是不是插了電源,耗電量有多少。”
最關鍵的是IT管理員要確保全面了解自己的數(shù)據(jù)中心,以及設備正在如何運行。Paul Goodison說:“就投資回報率而言,良好的管理定會收到成效。”