高曉欣
【摘要】? ? 近年來,數據中心的重要性日益突出,需要高效的運行和管理。因此,直流基礎設施管理(DCIM)成為了一個熱點話題,它可以管理 ICT 設備、電力設備、 HVAC 系統等。在本研究中,我們利用計算流體動力學(CFD)技術,提出了一種設計服務器機房 ICT 設備布局的方法。對該方法的有效性進行了評估,并對其實現高效數據中心運行和管理的能力進行了驗證。在此基礎上, 越來越多的應用程序轉移到云計算中,而云計算實際上是由地面上的大型數據中心支持的。這些數據中心是需要管理的復雜系統,集中解決方案可能無法滿足所需規模,也無法有效利用其網絡。本文提出了一種數據中心動態資源管理的層次化方法,利用數據中心網絡的拓撲結構設計管理層次結構。我們在層次結構中的各個級別定義了一組聚合度量,以將系統狀態信息傳遞給更高的管理級別,并定義了管理者的職責和交互。我們通過仿真對我們提出的方法進行了評估。實驗結果表明,該管理方法大大減少了數據中心網絡中管理數據的流量,從而降低了網絡開銷。
【關鍵詞】? ? 數據中心運營? ? 運營管理? ? 工作組織
引言
越來越多的應用程序轉移到了云中。思科預測,到2017年,將近三分之二的工作負載將在云中處理。大規模數據中心的增加為這種增長提供了支持,這些數據中心的明確目的是托管這些云工作負載。這些大型數據中心構成了一個有趣的管理挑戰: 一方面,數據中心供應商希望盡量減少能源消耗以降低成本,而另一方面,數據中心客戶希望其應用程序的資源需求在任何時候都能得到滿足。協商這兩個目標是困難的,并已成為許多研究工作的目標。
數據中心由集群組成,每個集群由機架組成,每個機架由物理服務器組成。通過使用系統虛擬化,多個應用程序可以駐留在單個物理服務器(或主機)中,每個應用程序都在自己的虛擬機(VM)中運行。此外,資源可能會被超額預訂(也就是說,在一臺主機中,可以承諾將總共更多的資源提供給共存的虛擬機組,而不是主機實際擁有的資源) ,從而大幅度提高主機的資源利用率。
然而,考慮到應用程序資源需求的動態特性,如果共用位置的虛擬機的總資源需求超過其主機的容量,這種安排可能會出現問題。如果不采取任何行動,虛擬機將無法滿足其資源需求,這將導致違反服務水平協議(SLA)。但是,通過利用 VM 實時遷移,可以將 VM 從資源壓力較大的主機重新遷移,從而在本地釋放可以分配給剩余 VM 的資源。遷移后的 VM 將在不同的主機上恢復執行,過程中只經歷了最小的停機時間。這被稱為動態 VM 管理。
大多數資源管理系統都是為集群設計的,似乎不會擴展到單個集群之外,通常都是集中式的。集中管理者的假設通常反映在提出的動態資源管理系統中。然而,這些系統可能無法滿足大型數據中心的規模以滿足現實需求。此外,通過將整個數據中心視為單一資源池,管理數據(包括通信和 VM 遷移)在不考慮管理費用的情況下通過網絡發送,導致數據中心資源的使用效率低下。
一、數據中心運營管理工作概述
近年來,信息和通信技術系統已成為支持社會生活基礎設施的重要工具。因此,數據中心(DCs)管理信息的作用變得越來越重要。此外,云計算和信通技術虛擬化的發展導致發展中國家出現高熱密度和增加能源消耗的趨勢[1]。因此,DC 運營管理者需要在考慮各種因素的同時管理復雜的環境。這些因素包括空氣調節、電力、建筑物以及虛擬服務器數量超過物理服務器數量的情況。在這樣的環境下,如何構建一個安全、節能的直流電源系統,并對其進行高效、持續的運行和維護,已成為一個重要課題。因此,這項研究的目的是檢驗一種管理方法,這種管理方法可以通過對信息通信技術設備、機架、空氣調節系統、電力、建筑物和發展中國家的空間進行單獨管理,從而有效地、持續地管理安全、節能的發展中國家。本文描述了 DC 基礎設施管理(DCIM)的概念、問題和預期作用,并報告了使用 DCIM 設計 ICT 設備布局的效果。
二、DCIM 概述
DCIM 包括監控 DCs 中各種設備故障的系統(ICT 設備、電力設備、空氣調節設備) ,并管理各種能力(空間、機架安裝狀態、 ICT 設備的負載比、電力和空氣調節)。它具有分析這些因素的信息的功能。這是一個整合和提高信息和通信技術效率以及管理單獨管理的調頻系統的工具。
在發展中國家,“資訊及通訊科技管理人員”主要負責設計、操作及維修與資訊及通訊科技有關的設備,而“設施管理人員”則負責設計、操作及維修樓宇、空氣調節系統及電力設施等。
每個基金經理各自節省能源、空間和資產管理。雖然支持集成的 DCIM 概念已經存在很長一段時間了,但許多 DCIM 供應商都是軟件公司和空氣調節設備制造商。因此,許多 DCIM 功能僅限于每家公司的專業領域,沒有一個能夠支持控制、操作和維護的所有三個領域。另一個問題是,盡管 DCIM 中注冊了大量的數據,但它還是不能解決它特有的一個問題:創建和維護數據的困難。由于這些原因,對 DCIM 的需求正在變得越來越普遍,但是沒有像預期的那樣廣泛或迅速地擴散。
資訊及通訊科技設備(例如伺服器及網絡設備)與設施(例如建筑物、空調及電力設施)彼此關系密切。例如,由于信息和通信技術設備不是簡單地安裝在一個空曠的空間里,因此重要的是要從電力供應、空氣調節容量、運行效率等方面對其做出全面的判斷。通過使用 DCIM,可以準確有效地完成這些任務。主要角色如下所示:
1、整個直流系統的管理和可視化不僅需要服務器機房內部的管理和可視化,而且需要整個直流系統的管理和可視化,包括熱源設備、電源接收設備、應急發電機和蓄電池。為此,必須能夠與建筑和能源管理系統、出入境管理系統以及其他業務管理系統等相關系統進行合作。
2、先進的數據分析和環境改善與控制為了實現各種效益,如提高節能和降低運行和維護成本,對 DCIM 收集的大量信息進行分析是非常重要的。
3、集成化管理與建設和維護信息集成化管理由 DCs 處理的信息多種多樣,變化頻繁。為了有效地利用 DCIM,必須有一個能夠適當反映信息的報表管理功能。
三、DCIM 效果實例
當增加機架和 ICT 設備到直流電,不僅要考慮物理空間和容量,而且要考慮對安全的影響(溫度環境的變化)和節能(空氣調節消耗)。
首先,一個可以添加 ICT 設備的機架是從物理空間、負載、現有電力容量和空氣調節中選擇的。其次,利用 DCIM 收集的信息進行熱流體模擬。在發展中國家,ICT 設備進氣溫度的上限和下限被歸納為 SLA。基于 DCIM 收集的信息和將要添加的 ICT 設備的功耗,進行了熱流體模擬,預測了 ICT 設備在假定的最壞情況或年份下的進氣溫度,滿足 SLA 的位置是有限的。
四、現有云數據中心計算平臺
目前最先進的云基礎設施,如亞馬遜 EC2既不支持考慮消費者對節能計劃偏好的能源效率資源分配,也不利用復雜的經濟模型設定正確的激勵機制,讓消費者準確地披露有關其服務需求的信息。因此,供應商無法與消費者進行必要的信息交換,因此無法實現有效的服務分配,而這種分配滿足了消費者對綠色云計算的節能偏好的需求和期望。
在本文中,我們研究了一種層次化的方法來管理數據中心。分層方法提供了更高的可伸縮性,但代價是只有系統的部分視圖。
我們將管理域劃分為管理范圍,每個范圍包含一個托管元素子集,并在其中封裝管理數據和管理操作。我們利用數據中心網絡的拓撲結構來定義范圍,范圍包括主機、機架、集群和數據中心。通過使層次結構具有拓撲感知性,我們限制了跨越數據中心的管理數據流。我們假設,這種組織將導致更有效地使用數據中心,大大減少網絡流量。
使用分層方法進行動態數據中心管理的挑戰包括: (Ⅰ)定義一組度量標準來表示機架和集群的系統狀態。集群管理器可以向數據中心管理器發送關于其所有主機的信息,但這將代表需要傳輸和分析的大量數據; (Ⅱ)確定管理器的職責以及它們之間的交互。這兩個挑戰都在這項工作中得到了解決。
目標基礎設施由一組集群組成,每個集群是一組機架,每個機架是一組物理服務器。虛擬機(vm)被托管在物理服務器(或主機)中,在那里它們被分配資源來運行。數據中心有兩個網絡: 數據網絡和管理網絡。
虛擬機使用數據網絡進行應用程序的通信,而管理網絡則用于管理數據(即通信和 VM 遷移)。兩個網絡具有相同的架構。機架中的主機通過放置在機架中的兩個交換機(每個網絡一個交換機)連接到網絡。集群中的機架通過集群級交換機相互連接,集群級交換機連接到數據中心級的中央交換機。從現在開始,當我們談論數據中心網絡時,我們將指的是管理網絡。
使用分層管理方法背后的思想是對主機集合進行邏輯分組,并將每個主機集合作為一個單元進行管理,盡可能在單元內封裝詳細的監控和管理操作。此外,每個級別的元素再次組合,形成上面級別的元素。這些結果導致了管理范圍的創建,從而限制了管理數據在整個數據中心的傳播。在每個范圍內收集監控數據,并與上級管理層共享數據摘要。盡可能多的 VM 遷移也限制在它們自己的范圍內。我們決定利用數據中心網絡的組織,使用主機、機架和集群來劃定管理范圍。此外,數據中心作為一個整體形成了一個龐大的、包羅萬象的管理范圍。
主機管理器定期從主機和(托管)虛擬機收集監視數據。收集的數據包括每個虛擬機和主機本身的資源利用率(CPU、內存、網絡帶寬和存儲)、主機功耗以及當前傳入和傳出的虛擬機遷移次數。這些信息被打包并以狀態更新的形式發送給主機所屬的機架的管理員。機架管理員處理各主機管理員在其范圍內發送的狀態更新,并根據所收到的信息更新其知識庫。
五、小結
未來,數據中心(DC)業務將在全球范圍內蓬勃發展。信息和通信技術的發展可望使發展中國家的規模更大、密度更高,但也可望帶來對更廉價和更可靠的發展中國家服務的需求。為了實現這一目標,管理和分析綜合信息和節能方法以降低運行和維護成本將變得越來越重要。我們相信,通過使用直流基礎設施管理來管理和分析 ICT 設備以及空氣調節、電力和建筑設施,不僅有可能實現本報告所示的 ICT 設備放置計劃,還有可能實現直流設備和設施的高效運行/維護。
參? 考? 文? 獻
[1]毋江波. 競合環境下基于信息和關系的企業戰略匹配研究[D].山西大學,2019.
[2]趙瑞勝. 內蒙古鐵塔公司運營流程優化研究[D].內蒙古工業大學,2019.
[3]黃圓圓. 跨界破產承認與救濟制度研究[D].對外經濟貿易大學,2019.
[4]劉壯. 西非水務工程項目中推進人力資源屬地化進程的研究[D].湖南大學,2019.
[5]何秋. 美國氣候變化法律制度研究[D].中南財經政法大學,2018.