謝末
[摘 要] 使MES系統盡少地出現故障及出現故障之后的快速恢復是系統運維人員面臨的一個巨大挑戰。本文通過對MES系統關鍵服務的深入研究,針對MES系統3個關鍵服務,能夠在系統出現故障時及時地恢復系統,幫助運維人員很好地保障MES系統的平穩運行。
[關鍵詞] Oracle;WPKS;PHD;備份;恢復;冗余
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 17. 039
[中圖分類號] TP307 [文獻標識碼] A [文章編號] 1673 - 0194(2017)17- 0080- 02
0 引 言
煉油與化工運行系統(MES)是中國石油向地區公司推廣的重點項目之一,它是處于企業資源計劃系統和現場自動化系統之間的執行層,主要負責車間生產管理監控和調度執行,在統一的平臺上集成諸如生產監控調度、物料平衡、統計報表等管理功能,使用統一的數據庫通過網絡可以同時為生產部門、質檢部門、工藝部門等提供管理信息服務和監控服務。MES已經成為各地區公司每天運行的必不可少的應用系統。系統一旦出現問題,如果不能盡快進行恢復,會給地區公司的生產和經營造成一定的影響。如何能夠使MES系統盡少地出現故障及出現故障之后的快速恢復是擺在我們運維人員面前的一個巨大課題。
1 Oracle數據庫的備份恢復策略
1.1 Oracle數據庫的基本情況
MES系統的Oracle數據庫一共有3個,一個是LIMS系統需要的,存儲著LIMS系統的配置數據和每天的業務數據;一個是我們所說的UNIFORMANCE數據庫,存儲著MES系統需要的所有生產過程實時點的配置信息和RDI接口的配置信息;數據量最龐大最核心的一個就是我們所說的TOTALPLANT數據庫,其存儲著系統的核心的模型數據和每天產生的業務數據。如Oracle數據庫出現問題,整個MES系統就失去了數據支持,系統就將癱瘓,所以在Oracle數據庫出現故障的時候,能夠快速地進行數據恢復就是非常重要的。
1.2 Oracle數據庫的備份策略
通過對Oracle數據庫聯機備份恢復的研究,對原備份腳本進行改造,開發出一套新的備份恢復策略,新策略創新的功能是將每天備份的歸檔日志存儲在當天數據備份目錄的log子目錄下,這樣在自動刪除過期數據備份時一并將過期的日志刪除,新策略能夠自動聯機備份數據,并保留我們所需要天數的備份(假如5天),并自動刪除過期的數據備份和日志備份(5天之前的),不需要人為參與,一旦Oracle數據庫出現故障,就算所有的數據文件、控制文件、歸檔文件及聯機日志文件損壞或丟失的情況發生,我們都可以通過備份數據在本機或另一臺安裝了Oracle數據庫軟件的新機器上將數據庫恢復到備份期間5天之內的任意時間點,只要歸檔日志和聯機日志好用的狀態下,就可以將數據庫恢復到5天前到故障點之間的任意時間點并能實現完全恢復。
2 WPKS服務器的冗余運行
WPKS服務器是整個MES系統的界面展示服務器,是MES系統各個模塊的統一集成平臺,負責各個模塊的發布和用戶權限的管理,同時WPKS服務器也是各個模塊程序發布的Web服務器,如:物料平衡(PB)、生產統計報表(PA)、實時數據庫及應用(PHD)、統計平衡(SB)、共用工程(Utility)及總部煉化MES項目的Web程序都發布在這里。一般情況,SqlServer數據庫也安裝在WPKS服務器上,SqlServer數據庫中主要存儲著WPKS服務器系統配置信息、安全設定信息、桌面配置信息及數據源配置信息。所以WPKS服務器在MES系統中是非常重要的一個服務器,如果它一旦出現故障,我們就沒有入口訪問MES。為了提高系統的可靠性和穩定性,在出現故障后能夠及時切換,通過研究按照HoneyWell提供的安裝文檔安裝一臺新的WPKS服務器(備用服務器),在安裝過程中需要注意的事項有以下幾個方面:安裝用戶使用生產環境用的域賬戶wpksadmin;在安裝實時數據庫PHD客戶端時需要提供PHD Host Name時指定生產環境PHD服務器的IP地址或機器名;在安裝Experion Desktop Server時必須在備用服務器上新建SqlServer數據庫,在指定SqlServer賬戶sa的密碼時必須和生產環境的SqlServer數據庫賬戶sa的密碼一致;在安裝Business FLEX Base Components、OL、OM等軟件時在需要指定連接實時數據庫PHD的PHD Node Name時都必須指定生產環境PHD服務器的IP地址或機器名,在需要指定連接Oracle數據庫的Oracle TNS時都必須指定TOTALPLANT,同時在備用服務器建本地Net服務名為TOTALPLANT的指向生產環境Oracle數據庫的連接串。安裝完成后,用瀏覽器打開備用服務器的主Web頁面,只有HoneyWell默認的公共工作空間,在數據源服務中配置好BaseBFDatabase、BaseBusiness數據源和添加配置PHD數據源后,查看OM模塊功能正常,這說明備用服務器安裝正常,接下來進行界面的漢化,然后將SqlServer生產環境的數據庫的備份恢復到備用服務器的SqlServer中,就會奇妙地發現所有生產環境服務器的應用模塊共用工作空間及組件和用戶權限配置在備用服務器上都有了,剩下的只需要將發布在生產環境WPKS服務器的Web應用程序(如:PB、PA、PHD等)同樣發布到備用服務器WPKS上,將兩個WPKS服務器共用工作空間用到的組件的Web地址引用都改成相對地址就大功告成了。這樣就擁有了兩個同時運行的具有相同功能的WPKS服務器。
3 實時數據庫PHD的歷史恢復及備份恢復
實時數據庫PHD為整個MES系統提供所有的過程歷史數據和實時數據的采集,是DCS控制系統到MES的中間橋梁,為整個MES系統提供數據支持,所以對PHD實時數據庫做好維護是至關重要的。實時數據庫一般都采用buffer-shadow架構,buffer機有多個,架設在各個生產裝置的控制室,shadow機只有一個,架設在公司的中心機房。在各裝置的控制室安裝的buffer機連入DCS控制網絡,通過RDI采集現場的數據存儲在本地硬盤的基礎上也同時通過RDI將采集到的數據上傳到中心機房的主PHD服務器shadow上。MES系統各個應用模塊用到的數據都是來自中心機房的PHD主服務器shadow,為了保證shadow機出現故障后能夠及時恢復,要做好兩個方面的工作:PHD的歷史恢復、PHD的備份與恢復。
4 結 語
MES是一個非常龐大和復雜的應用系統,其在統一的集成平臺上所涉及的應用模塊和服務器也非常多,如何能夠有效地維護好MES系統的平穩運行是對各地區公司運維人員的巨大挑戰,本文對MES系統三個關鍵服務器-Oracle數據庫服務器、WPKS服務器、PHD實時數據庫服務器所實施的維護策略都是通過研究了HoneyWell有關MES系統方面的說明文檔和Oracle的有關數據庫備份恢復方面的文檔之后,經過了多次測試實踐,成功實施到我公司生產環境的MES系統當中的成果,通過這些策略的實施大大提高了MES系統的穩定性和故障恢復能力,從而保障了MES系統的平穩運行。endprint