王磊
[摘 要] 經過多年的探索與實踐,大港油田云計算建設已經取得了豐厚的成果。通過建立基礎設施云,實現基礎設施、關鍵應用的集中管理,提高資源利用率,降低維護成本與能源消耗,極大地促進信息化建設步伐。但隨著關鍵生產應用對于高可用性要求不斷提高以及當前機房承載能力日趨飽和,建立分布式云計算數據中心成為必然趨勢。因此,以云計算架構對大港油田三個信息化機房資源統一管理及容災進行了整體規劃,為后續逐步實施提供依據。
[關鍵詞] 云計算;虛擬化;大二層互通;云計算管理平臺;分布式數據中心;分級容災體系
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 03. 076
[中圖分類號] TP311 [文獻標識碼] A [文章編號] 1673 - 0194(2018)03- 0184- 02
1 大港油田云計算建設情況
從2010年開始,為適應油田勘探開發信息化建設的需求,針對基礎設施管理現狀,大港油田著手開展了服務器、存儲虛擬化集中管理平臺建設,搭建了由核心交換機、光纖磁盤陣列、冗余光纖交換機、高性能服務器集群構成的虛擬化集中平臺。該平臺以VMware VSphere系列軟件為核心,利用經過整體規劃、實施的高性能、高可用的網絡、計算和存儲資源,完成了數據中心資源的虛擬化工作;并部署了集中管理軟件,對物理主機的運行狀態、虛擬資源的使用情況、資源調度等相關策略進行統一監控與管理。按需求劃分出不同的資源池支撐專業數據管理、數字油田應用、生產數據采集等多類勘探開發相關應用以及綜合辦公應用,通過統一管控平臺的協調管理,通過策略制定與優化,可實現隨時、隨需的在油田范圍內提供CPU、內存、I/O等資源的動態共享與分配。
虛擬化整合的服務器群,在統一管理中心的協調與權限控制之下,對于上層應用來說,所有框架內的資源,包括CPU、內存、I/O、網絡等都是共享的,以資源池的方式提供給虛擬服務器,協調管理中心根據運行情況、用戶訪問量,能實時動態調整資源分配情況,保障資源在所有虛擬化體系中的服務器的均衡分布,確保信息系統的平穩、順暢運行。并且應用了高可用特性,通過策略的訂制,確保硬件和虛擬資源的自動化故障轉移,出現故障能夠立即完成切換恢復故障,保障業務延續性尤其是關鍵生產應用的不間斷運行。
大港油田基礎設施云全面支撐了油田信息系統的穩定運行,其中包括勘探開發生產應用系統、綜合辦公應用系統、礦區生活相關應用系統等共100余套應用系統。通過云計算的應用,將在用信息系統逐步遷移至云環境,關閉了100多臺耗能低效的舊服務器,節約了能源,同時提升了系統安全,2010年至今,油田各單位不再采購單體服務器,均采用統一部署的基礎設施云服務支撐自建系統,促使各單位的機房數量正逐步減少。同時,云計算技術的應用,使得項目建設過程中系統開發環境、測試環境、生產環境分離方便快捷,并使得系統備份、容災等難度大大降低。
2 分布式數據中心的概念及背景
由于不同行業領域之間的業務屬性和流程存在較大差異,各行業對所要構建的數據中心也有自己的需求和思路,但無論如何變化,高可靠性、連續性以及業務彈性都是最基本,也是最核心的數據中心訴求。
在傳統觀念中,為了讓數據中心所承載的業務“永不宕機”,尤其是在遭遇火災、地震等不可抗拒力的狀況下,業務依然可以保持其一貫的連續性,數據中心的管理者們選擇了“兩地三中心”的建設方式。其好處在于“一主雙備”,同城災備或異地災備的方式可以有效保證數據中心的業務連續性,一旦主數據中心發生故障,其業務和數據將立即轉移至備用數據中心中繼續運行。劣勢則是需要前期投入大量的IT成本,由于數據中心故障本就屬于低概率事件,也許1年也不會發生一次,所以2/3的IT資源長期處于閑置狀態,這在無形中增加了企業的IT成本壓力,造成了IT資源的極大浪費。
因此,在正視該問題后,一些行業企業嘗試采用“兩地三中心”的升級版,也就是互為備份,三個數據中心之間不存在絕對的主用和備用,都有承載不同的業務而互為備份。這在某種程度上確實提高了數據中心的整體資源利用率,但這也僅僅是過渡方案。
那么,如何能夠在安全可靠的前提下,確保數據中心的IT資源最大化,一些較為領先的設備企業開始借助云的理念——分布式數據中心的概念順勢而出。
在分布式數據中心的架構里,三個甚至更多的數據中心間不再是主備關系,而是通過虛擬化、大二層互聯等技術,形成一個可以跨中心、跨地域的“云”資源池,所承載的業務和數據都可以被動態分配到不同數據中心里,并且實現動態調度和自動化配置,由此實現真正意義上的“雙活”甚至“多活”數據中心。
據悉,目前電信行業的一些運營商正在規劃基于云資源池的分布式數據中心架構,而走得較快的運營商已經率先實現了多數據中心的云化,通過網絡互聯和負載均衡等多種技術手段,使分布式的數據中心形成了一個統一的“云資源池”,虛機可在多個“分布式”節點中靈活遷移與恢復。這不僅使得IT資源得以充分利用,同時資源的動態遷移與應用交付的加速,也為用戶帶來了更加良好的使用體驗。
3 分布式數據中心整體規劃
3.1 機房業務定位
隨著大港油田信息化建設的不斷深入,現有機房承載能力已經接近飽和不能滿足未來需求,因此,信息中心決定對原有港西機房進行改造,以滿足未來信息化建設需求。
隨著港西機房的改造,逐步遷移、歸并系統,其中,現有的數據機房逐步以承載勘探開發主營生產數據采集、勘探開發協同研究為主的主營業務機房,網絡機房,以綜合辦公應用系統為主,改造后的港西新城機房作為計算和存儲資源的補充,三個機房網絡二層互通,同城互備,物理分離,邏輯統一,形成統一的資源調度與容災體系。
3.2 云計算資源統一管理及容災規劃
為構建分布式云計算數據中心,必須實現三個數據中心云計算資源的統一管理,并建立網絡、計算、存儲等各層面的容災保障體系,因此,對分布式云計算數據中心進行了整體規劃。
數據中心的容災模式包括主備和多活兩種,大港油田分布式云計算數據中心整體規劃,首先確定了主備的容災模式,即各數據中心各自運行不同的應用系統,出現問題應用系統可以切換到其他數據中心運行。其次本規劃的技術方案主要體現在三個層面:網絡、計算、存儲。
網絡層面,網絡機房核心網絡節點與數據機房核心交換機利用虛擬大二層和雙機熱備等技術互聯,港西機房以二層方式接入兩個網絡核心,實現三個機房網絡層面主備方式的容災。
存儲層面,首先對現有兩個機房存儲網絡進行梳理和整改,形成層次化的存儲網絡架構;然后打通機房之間的光纖通道,實現跨機房的存儲資源共享,并對關鍵應用實現存儲層面的高可用性。
利用存儲虛擬化技術,每機房部署存儲虛擬網關,并接管存儲資源,實現機房內部存儲資源的統一管理;機房之間的存儲虛擬網關互連,利用虛擬化鏡像技術實現異地存儲數據的實時同步以及并行讀寫服務;出現問題后,由第三方仲裁站點判定具體問題及切換方案,實現故障切換,確保存儲層面的高可用性。
計算層面,在實現網絡、存儲層面的大二層連通、資源統一管理及容災的基礎上,建立跨數據中心的基礎設施云平臺,用來承載應用系統,并確保關鍵業務跨數據中心的高可用性。
然后,基于openstack構建云計算管理平臺。首先,與現有云平臺、數據庫集中環境進行對接,同時,也將物理機納入管理,實現底層基礎設施資源的統一管理;其次,基于多租戶對現有資源進行劃分,實現資源的共享,并對權限進行精細化管理,實現資源的分權分域管理;最后,通過構建自助化服務門戶及服務目錄,將計算、存儲、數據庫等資源以服務的方式提供給租戶,提升資源申請效率。
按照應用系統的關鍵程度以及對于業務延續性的重要程度,對應用系統進行梳理與分類,建立管理集群、關鍵集群與非關鍵集群承載對應的應用系統。確保關鍵集群的虛擬服務器,在物理主機出現故障時,優先遷移到本地數據中心關鍵集群內的其他物理服務器上。如果本地數據中心沒有存活的計算資源,則遷移至其他數據中心;對于非關鍵集群的虛擬服務器,只保證虛擬服務器在本地數據中心內部的高可用性。
4 總 結
分布式云計算數據中心的建立盤活了IT資源,提升資源利用率,降低了運維成本,提升了應用交付效率,同時,最大限度的保證了業務的高可用性。無論是云計算技術發展趨勢,還是基于大港油田的企業信息化建設現狀,構建分布式云計算數據中心都是有必要的。通過對云計算技術的不斷研究與實踐,大港油田已經具備了一定的技術實力,積累了豐富的實踐經驗。通過大港油田分布式云計算數據中心整體規劃的編制,初步摸清了相關架構,掌握了相關技術;隨著項目的后續實施,將不斷完善其技術架構,逐步建成大港油田分布式云計算數據中心。
主要參考文獻
[1]張為民 唐建峰. 云技術:深刻改變未來[M].北京:科學出版社,2009.
[2]毛文波.x86服務器虛擬化的三種技術[J].華南金融電腦,2009(7):84.
[3]鄭葉來 陳世峻.分布式云數據中心的建設與管理[M].北京:清華大學出版社,2013:46-49.