王洪鐘
(四川啟明星鋁業有限責任公司,四川 成都 610021)
當今以計算機為代表的工業自動控制技術,已經滲透到現代企業生產的各個生產環節。對于鋁電解等工業企業來說,如何確保其工業自動控制平臺系統與數據的安全性與可靠性已成為重中之重。一旦發生各種故障,輕則影響正常生產,重則給企業造成巨大經濟損失。
目前普遍采用的挽救方法是在故障已經發生后再去被動處理。該方法不僅消極被動,而且不可靠。這將不可避免地延長故障處理時間,從而影響正常生產。
本文采用了高可靠的數據快速安全恢復系統,能夠化被動為主動,實現系統與數據在線實時備份與恢復,并能夠在盡可能短的時間內將其恢復正常,從而將災難性損失控制在最小范圍內。
及時、高效率地存儲與備份是鋁電解等工業自控平臺能否快速安全恢復的基礎和前提。下文從數據存儲方式、數據備份與恢復這兩方面展開介紹。
最基本的3種數據存儲模式包括直接連接存儲、網絡附加存儲和存儲區域網絡模式。
①直接連接存儲模式(direct attached storage,DAS),是指將存儲設備通過SCSI接口或光纖通道直接連接到一臺計算機上。
② 網絡附加存儲模式(network attached storage,NAS),這種專用文件服務器去除了通用服務器原有的大多數計算功能,只提供存儲服務用的文件系統功能,將存儲設備通過標準的網絡拓撲結構(如以太網)連接到特定的計算機群。
③ 存儲區域網絡模式(storage area network,SAN),是一種通過光纖集線器、光纖路由器、光纖交換機等連接設備,將磁盤陣列、磁帶等存儲設備與相關服務器連接起來的高速專用子網。該網絡提供了多主機連接,但并非通過標準的網絡拓撲。
數據備份技術包含軟件與硬件兩大部分。
①軟件方面:數據存儲與備份軟件方面主要有通用備份軟件技術(操作系統中所提供的備份功能)和專用備份軟件技術兩種。備份軟件技術在整個數據存儲備份過程中起到非常重要的作用,它不僅關系到是否支持磁帶等的各種先進功能,而且在很大程度上決定著備份的效率。由于操作系統自帶備份功能較弱,因此其不能滿足生產過程中實時性、可靠性以及突發性的要求。
②硬件方面:數據存儲與備份硬件方面主要有磁盤陣列、磁帶機與磁帶庫、光盤庫以及本地硬盤等存儲介質。
系統與數據的恢復就是存儲與備份的逆向過程。
為了便于討論鋁電解等工業自控平臺系統和數據在線備份與快速安全恢復系統,下面就以四川啟明星鋁業公司鋁電解自動控制系統為平臺,說明該系統的快速安全保護和應對災難性后果的功能。鋁電解自動控制系統示意圖如圖1所示。

圖1 鋁電解自動控制系統示意圖Fig.1 Schematic of automatic control system for aluminum electrolysis
系統由槽控機、通信機、接口機、工作站、SQL服務器、文件服務器、工控網絡以及以太網絡組成。除現場控制設備和網絡設備外,接口機、工作站、SQL服務器組成了重要的工業自動控制平臺,但這同時又是容易出現故障的地方。一旦這些重要設備出了問題,生產將處于癱瘓狀態。為確保這些平臺所運行的系統和數據的安全性與可靠性,應采用高可靠的系統與數據快速安全恢復系統進行處理,從而盡可能地將企業生產風險降到最低。
系統與數據的在線備份與快速安全恢復系統(以下簡稱快速安全恢復系統)由硬件和軟件兩大部分組成。
硬件部分,即本地存儲設備(包括本地硬盤)或者網絡存儲設備(包括網絡磁帶機、磁盤陣列以及網絡硬盤),用于存儲在線實時備份的系統和數據。
軟件部分能夠實現系統與數據的實時在線自動備份和恢復。使用手工備份和恢復是不可取的,一是工作量太大,二是不能做到實時在線備份。軟件部分是比較關鍵的,最好選擇一些專業備份軟件,經過測試和比較,最終選擇了 Symantec/Symantec Backup Exec System Recovery 8.5在線備份與恢復軟件(以下簡稱Symantec備份與恢復軟件)。該軟件功能強大,不僅可以實時在線備份操作系統與數據,而且還能實時自動備份計算機所有硬盤分區,并能夠方便地將其快速安全恢復,無論在界面、適用性、易操作性方面都比較讓人滿意。
快速安全恢復系統的原理如下。首先準備好一塊硬盤,把它掛在計算機上作為數據存儲從硬盤;當然也可以把主盤的某一個分區作為存儲設備(這就是DAS存儲與備份模式),但是從存儲數據安全性與可靠性方面來講是不妥的,這是因為其對主盤崩潰或完全損毀無能為力。如果網絡有存儲設備或者文件服務器,可以將這些數據存儲在網絡設備上,這就是NAS存儲與備份模式。DAS與NAS可以混合使用,也就是將備份數據放在本地的同時,在網絡存儲設備上再復制一個副本,確保數據萬無一失。存儲設備與方式確定后,在目標工控機或服務器上安裝Symantec備份與恢復軟件,并根據存儲容量和數據的重要程度,設置調度時間,也就是一天需要自動備份多少次,理論上可以做到幾分鐘就備份一次。
系統與數據備份完成后,如果系統出現崩潰或者其他災難性結果,就用Symantec Recovery Disk光盤啟動計算機,迅速將系統與數據恢復至最近備份點;如果系統能正常運行,只是數據丟失,那么就啟動Symantec備份與恢復軟件,將丟失數據或文件實時在線恢復到最近備份點,這些系統與數據就能在最短時間內恢復正常,從而將生產風險盡可能地降到最低限度。
快速安全恢復系統理論上是可行的。下面對其在企業實際生產中所起到的關鍵作用進行介紹。
以下是工業控制平臺系統與數據比較容易出現的幾種較為典型的災難性情況,試驗以四川啟明星鋁業鋁電解自動控制系統為平臺。
2.3.1 系統數據崩潰快速處理
首先接口機上安裝Symantec備份與恢復軟件客戶端,再掛接一個從硬盤作為數據存儲設備。本試驗采用DAS存儲與備份模式[1];設置好各種參數,該軟件理論上可以做到幾分鐘自動備份一次;最后等待該系統與數據自動完成實時在線備份與存儲。這是快速恢復系統的前期準備工作。
①接口機操作系統出現崩潰故障。操作系統崩潰有可能是由軟件沖突、系統中毒造成的,也有可能是硬盤故障引起。其中,硬盤故障最具有毀滅性。若為硬盤損壞造成,則用一塊新硬盤替換原主硬盤掛在接口機,用Symantec Recovery Disk光盤啟動接口機,將剛才已經在線備份并存儲在從硬盤的系統與數據予以恢復。10多分鐘后,接口機Windows XP操作系統重新啟動,系統狀態和鋁電解控制程序均能運行正常,各參數與原來相同。這說明接口機系統災難性問題已成功解決。
②接口機放在D盤的SQL數據庫以及其他重要數據丟失問題。由于本次故障只是SQL數據庫以及其他生產數據丟失,不是操作系統引起的,因此直接啟動Symantec備份與恢復軟件客戶端,將已經備份并存儲在從硬盤的數據實施在線恢復,幾分鐘后所有數據即完成恢復。恢復過程并沒有影響正常生產,說明本次數據恢復試驗取得成功。
2.3.2 硬件故障快速處理
工作站安裝在作業現場的操作和監控平臺,同樣裝有電解自控軟件。由于現場作業環境惡劣,極有可能發生工作站系統崩潰,特別是工控機主板燒壞的情況。使用該快速安全恢復系統處理該類硬件故障的程序與方法如下[2-3]。
準備工作與接口機前期準備工作相同,在工作站上安裝Symantec備份與恢復軟件客戶端,同樣準備一個從盤作為備份數據存儲硬盤,自動在線備份系統與數據。采用一臺聯想楊天T3900辦公計算機作為臨時工作站,用Symantec Recovery Disk光盤啟動辦公計算機,將工作站的系統和數據恢復到這臺辦公計算機主盤上,并重新啟動計算機,這臺辦公計算機即成為新的工作站,系統和工控軟件均運行正常。
以上事例表明,快速安全恢復系統能夠對工業控制系統異構平臺進行很好地恢復與處理,使用一臺普通辦公計算機,即可將主板燒壞的工控機系統與數據重新無障礙地移植到新的計算機上。
2.3.3 系統數據異構平臺轉換
鋁電解自控系統采集和處理過的大量生產數據均存儲在SQL服務器上。由于這些數據很重要,系統采用了HP DL380專用服務器。該服務器采用RAIN5磁盤陣列。硬盤同時出現問題的幾率較少,但是如果突然因其主板等硬件損壞而導致服務器癱瘓,生產無法停止,此時可以用一臺聯想楊天T3900作為臨時替代。
采用快速安全恢復系統處理上述問題的步驟如下。準備工作同前,先在服務器上安裝Symantec備份與恢復軟件客戶端。由于是磁盤陣列,因此沒必要再掛從盤,但從安全和穩妥的角度出發,仍同時啟用非現場復制方式,即在網絡上文件服務器上再存放一個系統與數據備份副本。Symentec備份與恢復軟件可以自動完成這個工作。首先從文件服務器中將數據副本復制到聯想辦公計算機硬盤上,接著用Symantec Recovery Disk光盤啟動辦公計算機,將系統和數據恢復到辦公計算機主盤上,重新啟動計算機,系統和SQL服務器均運行正常。這樣,這臺辦公計算機就臨時充當起了HP SQL服務器的角色。
以上事例表明,快速安全恢復系統能夠在工業控制異構平臺之間,即使像專用服務器與普通辦公計算機跨度如此之大的異構平臺,也能夠實現系統與數據的相互快速轉換,從而最大限度地降低控制系統的風險性[4]。
2.3.4 虛擬機運行轉換
準備工作同前,用Symantec備份與恢復軟件客戶端將備份好的系統與數據轉換成VMware虛擬磁盤,并在一臺聯想辦公計算機上安裝VMware?Workstation7.1.1 build-282343虛擬機軟件。啟動新虛擬機,工控系統與數據都能正常運行,如在聯想辦公虛擬機軟件上能正常運行工作站的電解工控軟件,就可以在新虛擬機進行生產監控和實際操作。
由于虛擬轉換功能不依賴于原有平臺與硬件,直接實現了系統的跨平臺和跨硬件運行,因此具有重要作用。
快速安全備份恢復系統不僅已經成功運用于四川啟明星鋁業電解自動控制系統,而且在其他工控系統以及比較重要的場所也都有所應用,效果較好。該快速安全恢復系統能夠安全快速地實現系統與數據存儲備份與恢復功能。當控制系統平臺出現各種災難性后果時,能夠較好地拯救系統與數據,從而將生產風險性降到最低,同時其投入成本又相對較低。因此,其具有較好的經濟性、實用性、安全性和可靠性,這對于中小企業來說尤其比較實用。
系統能在工業控制系統中成功運用,則在其他場合同樣也可以推廣應用,為企業生產和經營增加一道可靠的安全屏障,從而做到防患于未然。
[1]羅慶超.分布式數據存儲與備份的研究與實現[D].成都:電子科技大學,2004.
[2]李文計.企業數據存儲與備份解決方案[J].衛星電視與寬帶多媒體,2011(7).
[3]曾愛華.網絡數據存儲與備份探析[J].電腦知識與技術,2006(5):81,172.
[4]魏強.一種網絡備份系統的存儲優化研究與實現[D].鄭州:解放軍信息工程大學,2009.