孟娜娜,王志心,竇 剛
(國電南京自動化股份有限公司,江蘇 南京 211100)
云化綜合監控系統部署方案主要是依據軌道交通行業標準完成的私有云方案[1]。業務上云后,應重點考慮可靠性,基于超融合云平臺架構的綜合監控系統部署方案設計時,需要考慮并解決以下技術難題:對于單業務或者單節點,能否自動檢測故障并實現無感切換;對于多業務或者整個主中心云出現重大故障時,能否在最短時間恢復或者啟用備中心云;對于部署在中心云的車站云服務器故障后,車站的業務是否受到影響,能否自動降級運行,如何降級運行。
系統采用超融合云計算平臺架構,在主備中心分別構建超融合云平臺,為中央級實時服務器、站級服務器、接口服務器、應用服務器等提供計算、存儲資源;主備中心也可以部署在同一個超融合云內,車站服務器可以選擇全云化或者部分云化[2]。如圖1所示為一種典型的部署架構。
圖1 綜合監控系統云化部署架構
云化綜合監控系統從邏輯上可以分3層結構,如圖2所示。
圖2 綜合監控系統“云化”平臺邏輯架構
云IT基礎設施層:包括虛擬資源、硬件資源。系統內的所有資源都由云平臺統一管理,并對各類資源進行監控,同時提供報警和分析;在資源池中使用虛擬化技術分配計算、歷史存儲等資源。用戶在使用該系統時對硬件無感知,能夠在熱遷移時,不影響綜合監控系統的使用。
利用云平臺的虛擬化技術從資源池中指定計算、存儲和網絡資源,使用戶在使用硬件資源時對硬件無感知,在虛擬機發生熱遷移時,用戶業務能夠無中斷地平滑過渡。
綜合監控系統平臺層:包括平臺基礎和平臺支撐服務,主要是利用虛擬資源部署綜合監控系統的各類平臺軟件,并對應用程序提供平臺支撐。
綜合監控系統應用層:部署綜合監控系統的應用軟件,按專業劃分有PSCADA、BAS、FAS、AFC、PA、PIS、ATS、NMS等。
在綜合監控系統中,使用云平臺將控制中心和車站的服務器進行虛擬化,集中完成綜合監控系統的各種業務。在實際的安裝部署過程中,可根據不同現場的需求,搭建不同的硬件架構,常見的有以下兩種架構。
1.3.1 純虛擬化架構
在純虛擬化架構方式下,將綜合監控系統所有的物理機進行虛擬化,在中心云中整合歷史服務器、中心實時服務器和車站服務器,然后在控制中心部署運算能力、歷史存儲能力強大的云平臺資源集群。在該集群中劃分出中心歷史服務器、中心實時服務器、車站服務器等,然后安裝云桌面服務,通過云桌面對綜合監控系統進行管理,完成綜合監控系統的各種業務[3]。
此種方式下,中心歷史服務器和中心實時服務器仍然采用的是一主一備的冗余方式,和傳統物理架構下的綜合監控系統一致。和傳統的綜合監控系統進行比較,這種虛擬化架構下主備服務器的冗余可靠性增加,因為在劃分虛擬機時,將主備服務器劃分在不同的物理機上,依靠云平臺自身的遷移和重生功能,在主服務器失效時會迅速遷移到其他物理機上。但是,此種方式將所有的服務器均部署在中心云上,對主干網絡和云平臺的可靠性提出了更高的要求,一旦云平臺故障或者主干網絡發生異常,綜合監控系統將不能正常采集和控制站下的設備,車站無法做到降級運行,因此不太適合工程場景,適合用于測試場景。
1.3.2 云中心+車站云服務器+車站降級物理服務器架構
這種方式構建了一個中心云,虛擬中心的所有節點,此外將綜合監控系統各車站均部署一臺物理服務器,另一臺物理服務器進行虛擬化,集中在中心云管理。當主干網絡或者云平臺發生故障時,車站能夠降級運行,保證正常的綜合監控系統業務不受影響。此外,車站還需要部署一臺物理工作站,用來對綜合監控系統進行操作。
此種方式可實現降級運行,即使中心云失效,也可通過綜合監控系統的應用層實現運營模式切換,保障了車站業務的可靠性。但是只適合用于只有一個控制中心的綜合監控應用現場,而且中心云或者網絡異常會導致中心的業務不可用。
對比這兩種綜合監控系統云平臺方案,結合主備中心分層分布式現場的實際需求,提出了一種適用于主備中心異地部署和車站降級需求的云化部署方案:主、備雙云中心+車站云服務器+降級物理服務器架構[4]。
綜合監控系統云平臺采用主備云的方式實施,總體結構如下:在中心設立兩個云平臺集群,分別為主云和備云,主備云之間通過主干網絡進行數據交互。主云和備云對部署的地理位置要求不高,將主云部署在主控制中心,備云部署在備控制中心,能夠實現遠程異地部署,使得備云平臺起到備控制中心機監控的效果。主云的虛擬機包括中心歷史主服務器、中心實時主服務器和車站(包括停車場、車輛段)主服務器;而備云平臺上的虛擬機主要是中心、車站(包括停車場、車輛段)的備服務器。此外,為了滿足綜合監控系統可靠性的要求,在主干網絡發生問題時,綜合監控系統能夠順利降級運行,需要將各車站的一臺工作站兼用作車站的備用服務器。其主要責任是在主干網或云平臺出現問題時,該工作站能承擔器車站服務器的工作,實現車站服務器的功能,收集和處理車站數據,并且在主干網和云平臺故障恢復后,能實現實時、歷史數據的同步。
此種架構方式能夠保證主中心完全失效的情況下,備中心順利接管車站和中心的業務,部分車站虛擬節點失效也可以實現降級運行。現在的軌道交通綜合監控現場都是異地雙中心模式,更加符合工程現場使用,但是也存在一定缺點,在車站較多的情況下,備中心虛擬車站備服務器節點過多會造成一定資源浪費,主備中心之間的業務遷移需要同時遷移節點過多,對云平臺的性能要求較高。
對比這3種綜合監控系統云平臺方案,不難發現方案三的可靠性最高,最適用于工程現場的部署;方案二適用于無備云中心的現場;而方案一適用于實驗室測試驗證。
本設計方案中,主中心構建超融合云平臺,為中央級實時服務器、站級服務器、接口服務器、應用服務器等提供計算、存儲資源;備中心云平臺,為中央級實時服務器、接口服務器、培訓運維服務器等提供計算、存儲資源;車站僅配置一臺物理實時服務器作為主服務器,同時在主中心超融合云平臺上設置一臺虛擬實時服務器作為備服務器,當中心云失效時,由車站物理機承擔降級運行任務。云化綜合監控系統平臺的硬件拓撲如圖3所示。
圖3 綜合監控系統“云化”平臺硬件拓撲
本文提出的綜合監控系統云化部署方案,能夠結合主備中心+車站降級運營的需求,在主中心完全失效的情況下,備中心順利接管車站和中心的業務,部分車站虛擬節點失效也可以實現降級運行。該方案能夠減少系統成本,降低硬件的安全隱患,極大程度地提高了系統的可靠性、安全性。