摘要:本文對操作系統的備份恢復現狀中遇到的問題進行了分析,對相關軟件的功能、優勢、備份所需要的環境、備份的模式、實施流程進行了介紹。
關鍵詞:操作系統備份;CSM
中圖分類號:TP309.3 文獻標識碼:A 文章編號:1674-7712 (2012) 10-0103-01
一、操作系統備份恢復現狀
在日常維護過程中,根據內控的要求,對于主機的操作系統要三個月備份一次,除此之外在操作系統發生重大變化的前后都要進行備份,整個信息支撐系統的需要備份的主機多在達200多臺,而且還在不斷地增加,利用現在傳統的磁帶備份模式,重復的工作量是非常巨大的。而且磁帶的備份模式本身就存在很大的不穩定性,能否可恢復都是不可預知的。其中以IBM的設備為例,涉及到的系統多,機型多,包含P4、P5、P6等,有的有內置磁帶機,有的沒有。這么多的主機,為保險起見,每臺至少需要兩盤小磁帶做備份,操作系統大的需要的更多,導致了磁帶數量多,而且磁帶本身存在不易保存、安全性差等問題,關鍵有的時候可能無法恢復。
如何解決目前操作系統存在的問題呢,我們對操作系統集中備份恢復的技術進行了研究,下面以IBM的操作系統為例進行說明和測試。
二、CSM(Cluster Systems Management)軟件
(一)CSM軟件介紹
CSM是AIX自身的軟件包,客戶端/服務器模式,客戶端(Managed Node)安裝csm.client軟件包,服務器(Management Server)安裝csm.server軟件包。可以通過Management Server單點控制所有節點,包括IBM p5,power4,power3機型運行AIX5L的節點。CSM和AIX緊密結合,系統開銷很小,和其它第三方的管理軟件比,更安全穩定。AIX5L缺省安裝中已經包含 csm.client 軟件包,要使用CSM功能,需購買CSM軟件許可證,配置CSM服務器,然后通過CSM服務器單點控制所有節點,實現各種功能。CSM服務器的宕機對所管理的節點不會造成任何影響。通過單一控制臺控制進行硬件控制,通過CSM服務器進行硬件開關機操作查看節點開關機過程中LED的代碼顯示。
(二)CSM軟件功能
系統安裝:配置好CSM服務器后,在4小時內可以完成可以50臺節點的安裝所有節點配置參數相同,便于管理增加新機器時,不僅安裝迅速,而且不用擔心配置和原來機器有所不同。
系統管理:CSM提供的dsh功能可以在所有機器上執行同一條命令并可對返回結果格式化,方便高效通過單點維護各節點補丁版本,配置參數CSM提供CFM(Cluster File Manger)功能,能夠保證用戶所需要的文件在所有節點上的一致。用此功能可以實現統一的用戶管理。
系統備份:將各節點的操作系統備份保存到CSM服務器上,恢復時通過網絡安裝,安全快速高效。
系統監控:結合AIX的RSCT組件的功能,CSM能夠實現通過單點監控所有節點的運行狀況,并可定義動作對錯誤自動進行糾正
其中一個非常實用的就是通過網絡來完成操作系統的備份和恢復。只要是主機和HMC控制臺網絡可達都可以實現。
在使用了這個軟件之后,可以分擔備份系統的工作,實現系統管理方面的技術更新,減輕管理員的日常工作量,建立集中的,統一的,標準的現代化系統備份管理方式,提高安裝大量新系統的效率。
三、CSM集中備份
(一)CSM集中備份介紹
CSM通過網絡提供AIX軟件的安裝,升級,恢復等管理服務,CSM提供一種簡單高效的軟件安裝和維護方式。
舉例:當有兩個以上的IBM P系列主機時,我們可以找到一種安裝和升級AIX系統而且不需要光驅和磁帶機的方式,我們需要一種對AIX系統遠程管理的方式(不用到達機房,在辦公室或家中就可以實現),我們需要一種標準模式來維護多個AIX版本的主機。
(二)CSM集中備份功能
統一備份client的rootvg
恢復client的rootvg
維護client(升級系統補丁,硬件診斷)
定制SOE后快速安裝新系統
系統遷移(rootvg從舊機器遷移到新機器)
(三)CSM集中備份的優勢
實現真正意義上的遠程管理系統,系統安裝,升級,備份和恢復等操作,無須到達現場。
并發性好:同時給多個系統做安裝,升級和備份。
管理范圍廣:同時管理AIX5.1,AIX5.2,AIX5.3,AIX6.1及各個小版本的客戶端
災難恢復:CSM服務器可以在最短的時間內恢復多個操作系統(無須光盤和磁帶)。
定制rootvg后,方便多系統的安裝和管理。
恢復mksysb速度快(平均比磁帶速度快15-30分鐘)。
使用簡單,方便。
支持openSSL(更加安全的網絡通訊)。
可以實現系統定時自動備份,減輕管理員的工作量。
(四)CSM集中備份環境
一個基本的CSM集中備份環境包含TCP/IP網絡和多個p系列小型機。
TCP/IP網絡可能會橫跨多個網段,在多個網段中可以建立一個或多個CSM集中備份環境。
CSM集中備份環境中至少要有一個服務器和一個客戶端。
CSM集中備份的術語:
Master:建立和維護CSM集中備份環境的主機
Client:CSM服務器進行操作的主機,比如:安裝,升級等
Resource server:擁有某種軟件資源的主機,一般把CSM master當作resource server
(五)CSM集中備份的工作流程
為了保證CSM集中備份能夠正常使用,有兩個資源是必須的:LPP resource和SPOT(Shared Product Object Tree),SPOT:是存放系統引導啟動的文件,它的作用是引導客戶端啟動,如果SPOT比mksysb的版本低,則不能正常恢復系統
LPP_source:與AIX的安裝光盤相似,包含AIX的安裝文件。
四、集中備份系統的測試
我們利用測試機器,安裝了CSM的服務器軟件和客戶端軟件進行了測試,取得了很好的效果:
1.操作系統的備份僅需要3分鐘的時間,恢復也只用了10分鐘。相對于磁帶的備份恢復過程要簡短得多。
2.備份和恢復的操作都是通過網絡傳輸的,由于是經過壓縮,數據量很小,不會對網絡的流量造成較大影響。
3.所有的操作都可以定時自動完成,不需要人為的干預,大大減少了維護人員的工作量。
4.備份的數據是存放在硬盤上的,相比磁帶來說數據的安全性是有了很大的提高。