黃澤星
(中鐵武漢勘察設計研究院有限公司,武漢 430074)
中國鐵路武漢局集團有限公司(簡稱武漢局)近年來在信息化建設中取得了良好效果,但隨著鐵路業務逐步拓展,多年分布實施的信息化建設存在多種品牌的物理服務器、虛擬化以及數據庫等應用系統信息共享程度不高,產生了諸多的“豎井型”和“信息孤島”,導致很多設備利用率得不到充分發揮,造成大量資源浪費,多年分布實施的信息化系統及設備給管理帶來的弊端逐步顯現。因此,重新規劃、升級武漢局的云管理平臺,保持統一架構、統一接口,才能符合鐵路信息化總體規劃要求。
1)武漢局以私有云模式為基礎設施層服務建設的局級云管理平臺,能對局內實現云資源和服務的自動化調度和部署,并預留未來與總公司級云管理平臺的互聯互通以及其他系統平臺對接的能力。能夠為用戶提供IaaS層服務、部分PaaS層服務、云運維管理。根據未來業務需求的增加,局級云管理平臺能夠根據需求逐步擴容計算節點或存儲節點,滿足不斷發展的業務需要。其整體技術架構如圖1所示。

圖1 整體技術架構圖Fig.1 Whole technical architecture diagram
2)虛擬化云計算管理平臺升級以基礎設施層及部分平臺服務層功能升級為主。
基礎設施層包括物理層、虛擬化和云操作系統。物理層包含服務器、存儲和網絡等多種類型的硬件設備,支持多品牌、多架構的硬件設備;虛擬化是在硬件資源基礎上通過虛擬化技術,實現包括服務器、存儲等基礎資源的池化,將資源與物理設備解耦,資源按需分配和靈活調度;云操作系統最終調用這些資源承載相應的應用業務系統。
平臺服務層是在基礎設施層的基礎上,通過軟件實現基于計算和存儲的各類服務、基礎服務、數據服務平臺和集成服務平臺等其他服務的能力。云管理平臺主要是面向用戶和資源管理員,實現用戶管理、資源管理和調度等服務功能,在管理上可靈活按需編排多種服務目錄并通過云服務門戶中對外提供服務,云用戶可以按需自助挑選和使用云服務,基礎設施和平臺服務則通過云管理平臺展現給用戶。管理平臺技術架構如圖2所示。
a.物理層
物理層主要包括硬件服務器、存儲、網絡設備,通過虛擬化軟件將硬件資源解耦,向上層提供計算資源、存儲資源、網絡資源。通過云管理平臺對計算資源池、存儲資源池、網絡資源池的統一管理、調度。
b.基礎設施層(IaaS)
基礎設施層云引擎可以為用戶提供所有基礎設施資源的利用,包括虛擬計算資源(CPU、內存)、物理計算資源、存儲資源(分布式存儲、集中式存儲)、網絡資源(虛擬交換機、虛擬路由器、VLAN、VXLAN),用戶可以通過云管理平臺調度,選擇計算資源、存儲資源和網絡資源快速部署Windows、Linux等操作系統及應用程序。
c.平臺服務層(PaaS)
平臺服務層可為生產和開發提供運行支撐環境,通過IaaS層API向下可以調用計算、存儲、網絡資源,向上可以提供業務管理能力和服務能力,PaaS層服務本期項目提供Mysql、Hadoop服務,后期根據業務需求將大數據服務、中間件服務、應用容器服務、數據庫服務、存儲備份服務等通用應用組件進行整合封裝,方便為用戶提供生產和開發環境支撐。

圖2 管理平臺技術架構圖Fig.2 Technical architecture diagram of management platform
d.云安全
云安全提供包括訪問安全、主機安全、系統安全、數據安全、網絡安全、應用安全等,并通過靈活、全面和模塊化設計可以為用戶提供全面的保護能力,保障云管理平臺數據、流程的安全性和完整性,同時具備對接其他安全平臺的能力。
e.云運維
云運維提供從底層硬件環境到上層應用環境的全方位綜合智能運維管理,用戶可以通過云管理平臺對資源進行統一運維管理,包括資源管理、權限管理、運維管理、全局管理、配置管理、資產管理等功能服務。
3)計算資源池
虛擬化技術能夠提高現有物理服務器的利用率,大幅削減物理服務器購置的需求、數量。通過虛擬化軟件將服務器中CPU、內存、IO等資源建設成計算資源池。計算資源池包括虛擬機資源池和物理機資源池。虛擬機資源池是指通過虛擬化軟件實現的虛擬服務器資源集合,如KVM、VMware以及小型機虛擬化等針對不同硬件的虛擬化軟件。物理機資源池是指以X86架構為主的各品牌物理服務器。
升級計算資源池包括KVM虛擬機資源池以及現有VMware虛擬機資源池。通過新增基于KVM的虛擬化軟件對現有的物理服務器進行服務器虛擬化,形成KVM計算資源池,已有的VMware虛擬化保持不變形成VMware計算資源池。通過云管理平臺對算資源池資源的動態調度,實現對業務應用資源需求的動態響應,以服務的方式提供給使用部門。新增的KVM采用高可用架構設計,云主機可以在KVM資源池跨物理服務器動態遷移、調度等,保證云主機更好的可用性和可靠性。同時可以根據云管理平臺架構的特點,高負載數據庫等應用系統運行到性能更好的物理服務器。
通過升級計算資源池建設提供現有部分業務系統的基礎計算能力,并提供根據應用、項目的增加,動態的對計算資源池橫向擴容。
4)存儲資源池
增加分布式存儲,使武漢局數據中心形成集中式存儲與分布式存儲共存,滿足不同應用需求,完善基礎架構中存儲類型。
分布式存儲主要以提供塊存儲服務為主,塊存儲是云化過程中最基礎的存儲資源,云管理平臺在和存儲資源池對接時,需要能支持高可用部署、鏡像在多后端分別存儲、備份到第三方存儲等特性,對鐵路內部現有存量FC-SAN設備具有良好兼容性。后期通過升級可提供對象存儲、文件存儲。同時根據未來業務需求,采購標準X86架構硬件及分布式存儲軟件,將多個服務器硬盤資源整合到一起并抽象化,形成分布式存儲資源池,使X86架構硬件平滑擴容存儲資源。
5)云管理平臺網絡
云管理平臺網絡總體上主要基于大二層網絡搭建,支持跨資源池、跨機房、數據中心虛擬資源的分配使用,同時保證整個計算資源池帶寬充足,以滿足業務應用靈活部署、按需擴展、高效運行等基本需求。武漢局未來承載的業務復雜多樣,云管理平臺網絡架構也應根據業務特點和需求進行相應調整。
為實現對云管理平臺中的計算資源、存儲資源和網絡資源的統一管理和調度,并提供業務服務,需要將服務器接入的網絡細分為對外業務網絡、對內服務網絡、分布式存儲網絡和云管理網絡4部分,并根據實際情況對4個網絡平臺做網卡綁定,提高鏈路冗余,并通過劃分不同VLAN實現。升級的網絡物理設備,部署在武漢局內部服務網,云管理平臺服務器通過萬兆交換機接入既有網絡,并上聯內部服務網匯聚交換機,與原有網絡安全策略不變。
6)云運維管理平臺
云數據中心運維管理平臺由多個相互支撐的子系統組成,包括資產管理系統、云監控系統、運維數據管理系統、自動運維系統、運維智能分析系統。
云運維管理系統通過透明化企業IT基礎架構和透明化企業IT運維過程來滿足IT運維工作在操作層、管理層、決策層等不同層次的需求,達到延長企業應用服務的在線時間以及提高客戶對業務服務的滿意度的目的。
第一步:鐵路局現有的虛擬化平臺接入交換機是電口千兆交換機,虛擬機的遷移和備份速率為50 MB/s,150 GB(標準虛擬機的物理容量)的數據備份需要51 min,而萬兆網絡則僅需5 min;8 GB(平均傳輸數據量)虛擬機遷移需要近3 min,而萬兆網絡則僅需十幾s。首先將網絡帶寬擴展到萬兆,無論是對外提供服務、數據備份,還是虛擬機切換、恢復都能更加高效。
第二步:根據本次平臺升級架構,并結合平臺既有服務器數量以及占用資源情況,本次升級需增設相應的管理節點服務器和分布式存儲服務器。
武漢局的應用項目都將陸續遷入到虛擬化平臺,將有更多的應用服務器加入到計算資源中,需要對現有的機位進行擴充。按照鐵路局計算資源計劃規模,兩個信息機房按照各200臺物理服務器來規劃。應用服務器的補充結合各應用系統建設來逐步實施。
第三步:在內部服務網建立一套云管理平臺,對云管理平臺計算資源、存儲資源、網絡資源進行統一管理,同時具備現有VMware環境和小型機環境進行統一的納管能力。通過云管理平臺,從資源接管、資源建模、資源申請、資源調度、資源使用、資源監控、資源回收等方面形成閉環的IT基礎資源管理體系。實現信息系統軟硬件資源的統一管理、統一分配、統一調度、統一運維,優化資源管控模式,提高資源利用率。保證資源容量的可控有序增長,為業務應用提供穩定的、高效的、可動態調整的基礎設施資源。
通過對武漢局現有兩個機房軟硬件設施進行調整、升級、改造,充分利用并整合現有硬件、VMware虛擬化,初步建成為武漢局提供基礎設施層服務的云管理平臺以及云運維管理平臺,解決了現階段部分應用系統計算、存儲需求以及云運維需求,實現業務系統與底層物理硬件解耦,IT基礎資源集中管理、統一調度和綜合利用,改善了武漢局信息缺乏統籌利用、分散建設的局面,降低IT信息系統建設及運營成本,滿足武漢局信息化業務快速發展、資源按需擴容的需求。