張旭明 李曼麗 趙永平 韓興龍
?
航天信息化數據集中備份管理平臺研究
張旭明 李曼麗 趙永平 韓興龍
(北京衛星環境工程研究所,北京100094)
研究了對不同類型信息化系統進行集中備份管理的方案,采用基于LAN-Based的主從服務器硬件基礎架構,根據信息化系統的自身特點采用完全備份、增量備份、差異備份等備份方法,以及子循環、父循環、祖父循環等介質循環策略,并采用與之對應的數據恢復方式,通過并行備份緩解備份作業的網絡和I/O壓力,搭建了多點多類別信息化數據集中備份管理平臺,該平臺提升了備份工作的管理效率,并且有助于及時發現備份作業的異常狀態。
航天信息化數據;集中備份管理;備份策略;備份數據
在航天器型號研制的設計、總裝、試驗等各個環節中,信息化系統都發揮著十分重要的作用,需要采取合理有效的措施對信息化系統的數據進行備份,增強航天信息化系統數據存儲的可靠性,避免數據災難所帶來的損失,從而保障各型號研制任務的順利開展。
航天單位的信息化系統建設發展迅速,類型多樣,業務范圍廣,針對不同類型的系統需要采用不同的備份策略。隨著近年來航天信息化系統建設數量和規模的爆發式增長,若仍然采取傳統的單獨備份每個信息化系統的方式,則要求備份管理員對每臺服務器逐臺登錄、操作、檢查、記錄,效率低下,因此,需要建立多點多類別的集中備份管理平臺,對服務器放置地點分散、應用類型各異的大量信息化系統集中備份,實現備份作業的統一管理,充分利用資源,提高備份工作的可靠性和工作效率,及時發現備份過程當中產生的錯誤和問題,通過備份能力的提升,為信息化系統在航天領域的應用提供可靠穩定的運行環境。
2.1 航天信息化系統
航天器的研制是一項綜合性系統性的工程,需要應用到功能與特點各異的信息化系統,涵蓋航天器的設計、裝配、試驗、行政管理等諸多業務范圍,針對信息化系統不同的應用需要和架構設計,應采取不同的備份策略。備份策略指對數據對象進行備份的工作規則,其中包括完全備份、增量備份、差異備份等備份方法[1],以及子策略、父策略、祖父策略等介質循環策略[2]等。例如,用于航天器設計、裝配的一些信息化系統,由于數據更新較為頻繁,數據十分重要,損壞后影響較大,需進行較高頻率的備份;用于行政管理類和型號試驗的一些信息化系統,數據更新頻率較低,且發生數據損壞后可通過人工錄入方式重新獲取近期數據,對這類系統按照一定時間間隔進行備份即可滿足要求;用于發布新聞、管理文件的一些信息化系統,由于圖片、視頻等文件較多,數據結構耦合性不強,可采用父子策略等完全備份與增量備份相結合的備份策略[3]。
功能靈活、類型多的信息化系統支撐著航天企業各項工作的開展,針對不同的信息化系統,采取的備份策略也應有所區別,需要對這些特點各異的備份作業進行合理的配置與統一的管理。
2.2 集中備份管理
人工手動備份方式有可能由于人為原因造成未能及時備份,操作出現失誤等情況;而一些信息化系統雖建立了自動備份機制,但卻是相互獨立的備份作業,導致備份數據較為分散,備份策略千差萬別,不利于備份數據的管理與恢復。
隨著信息化系統規模和數量的增加,人工手動備份與獨立備份顯現出了管理效率低下的缺點,因此,需要對各信息化系統的備份作業進行集中管理和監控[4],根據每個信息化系統各自的特點設計與其相適應的備份策略,并且通過合理安排備份時間、升級硬件架構等手段,對集中起來的大量備份作業進行數據傳輸和數據存儲的統籌和規劃,對分散在不同地點,類型多樣的信息化系統數據進行多點多類別集中的備份管理,從而能夠統一配置所有航天信息化系統的備份策略,同時觀察所有系統的數據備份作業運行情況,提升數據備份工作的效率和管理水平。
3.1 基礎架構
信息化備份系統的架構有多種形式,其中Host-Based[5]、LAN-Free、Server-Free[6]、LAN-Based[7]架構較為常見。
Host-Based是傳統的數據備份的結構,備份介質直接接在服務器上,且只為該服務器提供數據備份。此種備份架構通常是采用服務器自帶的磁帶機或本地存儲,一旦系統服務器損壞則備份數據也會無法挽回,同時備份方式也多為手工備份和獨立備份,備份效率和管理便捷性上都無法滿足大量的航天信息化系統備份的要求。
如圖1所示,在LAN-Free架構中,備份對象所在的存儲介質和備份介質位于共同的SAN(Storage area Network)[8]中,各自作為獨立的光纖點,數據流不經過網絡,直接從備份對象所在的存儲介質通過光纖傳輸到備份介質,備份速度較快,網絡傳輸壓力較小,但需要為每一臺應用中的服務器添加光纖卡,并且通過光纖連接到另外的存儲介質,而原有的系統服務器數量眾多,擺放位置分散在不同機房的各個位置,采用此方案需要重新規劃各機房服務器的位置,對機房設備的架構變動較大,不利于信息化系統的穩定運行,因此,采用LAN-Free備份架構對機房進行改造會產生較大的硬件成本、管理成本和風險成本。同時,許多LAN-Free架構的產品并不支持文件級或目錄級恢復,僅支持映像級恢復,單獨恢復某個文件的操作十分復雜。

圖1 LAN-Free備份架構
Server-Free架構是對LAN-Free架構的一種擴展,架構上與LAN-Free基本相同,只是實現技術上采用無服務器(Serverless)備份技術,可使數據能夠在SAN結構中的兩個存儲設備之間直接傳輸,減少對服務器CPU的占用,但同時也存在著LAN-Free架構下對機房設備變動大、部署成本高、多支持映像級備份、恢復單個文件操作復雜等缺點。
LAN-Based的備份系統架構如圖2所示,備份服務器負責整個系統的備份操作,備份介質連接在備份服務器上,備份服務器通過網絡把備份對象數據傳輸到備份介質中實現備份。其優點在于設備成本低,備份介質共享,備份集中管理;缺點在于對網絡的傳輸壓力大。

圖2 LAN-Based備份架構
在備份對象較多且較為分散的情況下,與LAN-Free和Server-Free備份架構相比,LAN-Based的備份架構的缺點僅在于,數據通過網線傳輸,速度較慢,但可通過在系統空閑時進行備份等手段規避此問題;優點在于,可充分利用現有信息化設備資源,不需要為每個備份對象配備相應的存儲設備,可在機房中單獨開辟一個區域供備份服務器使用,對現有網絡架構的改動小,而不影響眾多運行中的重要信息化系統,部署成本、硬件成本、管理成本都要更節省,同時LAN-Based備份架構的軟件產品較為豐富,能夠較好支持文件級數據的備份與恢復,應用更加靈活。因此,對于已經極具規模的航天信息化系統,更加適合采用LAN-Based架構作為集中備份管理平臺的基礎硬件架構。
3.2 備份管理
3.2.1 備份策略制定
若備份文件累加式的生成而不對其做任何處理,不斷增加的數據文件將給備份介質存儲空間帶來巨大的壓力,當有限的介質存儲空間成為備份信息系統數據的瓶頸時,可在備份作業中按照一定的備份策略用新的備份文件覆蓋舊的備份文件,有效抑制備份文件容量的無限膨脹,增強備份系統的可用性。
對于一個備份策略,通常需要確定備份方法、介質循環策略、覆蓋保護周期等要素。備份方法通常包括完全備份、增量備份、差異備份;介質循環策略包括子循環策略、父子循環策略、祖父循環策略;覆蓋保護周期是指備份介質(或備份文件)自生成之時起不可被覆蓋的時間跨度[9]。可通過以上方法的綜合應用,達到循環利用備份介質,節約備份存儲空間的目的。
對于具有相似特征的備份作業,可統一設定備份策略,從而有利于備份數據的管理。對于含有較多網頁和文件的系統,例如門戶網站等系統,可采用父子策略,即每天進行一次增量備份,每周進行一次完全備份;對于數據較為重要,且應用量較大的系統,例如生產管理系統、環境試驗系統,可采用子策略,即每天進行完全備份;對于既含有數據庫數據,又有較多的增量實體文件的系統,例如表單審批、文檔管理等系統,可采用數據庫與實體文件分別備份的辦法,即對數據庫部分采用子策略每天進行完全備份,對實體文件部分采用父子策略增量備份與完全備份相結合。集中備份管理平臺將針對每一個航天信息化系統的特點,分別設計相應的備份策略進行備份作業。
3.2.2 備份數據存儲

圖3 備份系統數據存儲的邏輯架構
在對信息化系統進行備份的過程中,會在備份介質上生成大量的備份文件,無序存放的備份文件難以彼此區分,給信息化系統的數據恢復造成困難,需要搭建合理的數據存儲架構,對備份文件的存放方式進行設計,從而有利于信息化系統的數據恢復。
對于一個信息化系統,可能在其上運行了一個或多個備份作業,圖3描述了備份系統的數據存儲邏輯架構,針對每個備份作業,采用獨立的目錄保存該作業所生成的所有備份文件,同時,對特征相似的備份作業采用相同的備份策略,降低整個備份系統的耦合性,增強了備份文件管理的規范性,有利于備份文件的查找定位以及信息化系統的數據維護與恢復。
3.2.3 數據恢復方法
當發生軟件系統故障、硬件設施損壞等事件,導致航天信息化系統的數據丟失時,需要利用備份數據恢復原有系統的數據。根據備份策略的不同,數據恢復的方式有所差別。對于完全備份,需在原有系統重新搭建后,將備份作業對應目錄中最新生成的備份文件恢復到原有系統;對于差異備份,需要首先恢復最后一次的完全備份作業產生的數據,再恢復最后一次的差異備份產生的備份數據;而增量備份需要在恢復最后一次完全備份的基礎上,恢復該完全備份后所產生的每一次的備份文件。
3.3 并行備份
LAN-Based的存儲架構能夠節約硬件成本和維護成本,但是,如圖4所示,采用此架構時數據通過網絡傳輸,備份作業同一時刻的集中運行將會造成網絡擁塞。當單一通道傳輸,在備份對象數據量較大,且備份作業較多的時候,會出現作業調度困難的管理瓶頸和備份效率低的性能瓶頸。為了使大量備份作業能夠及時快速的進行數據傳輸,需要對基本的LAN-Based備份架構進行優化,從而能夠并行處理備份作業。

圖4 單臺服務器備份
如圖5所示,在備份作業不斷增多,占用介質空間逐漸加大,作業的備份時間彼此沖突的情況下,可通過配置備份子服務器的方式,進行備份數據分散式存儲、集中式調度、并行式傳輸的備份作業。為中央控制服務器配備子服務器,由中央控制服務器統一調度,備份子服務器與備份對象所在服務器之間直接進行數據的傳輸,多路并行備份提高備份作業的效率。

圖5 子服務器備份
在LAN-Based架構基礎上應用子服務器備份的方式與Free-Based架構相比,即使Free-Based架構能夠合理的規劃部署為多臺服務器提供統一的備份存儲設備,總的硬件成本兩者相差也并不大;若Free-Based架構由于布線等原因為每臺服務器都增加了備份存儲設備,則硬件成本將遠高于能夠靈活為多臺服務器提供統一備份存儲設備的LAN-Based架構;同時,在網絡的配置與拓展上,LAN-Based架構能夠將新增的子服務器架設在機房的任意位置,還可采用原有閑置的服務器設備作為子服務器,對網絡的改動性更小,管理更加靈活方便,仍然要優于LAN-Free架構。
航天信息化集中備份管理系統的硬件設備采用LAN-Based作為基礎架構,多個信息化系統的備份數據存儲于統一的存儲設備當中,實現備份數據的統一管理。搭建子介質服務器對備份數據進行多路并行傳輸,解決對大量應用系統進行備份的性能瓶頸。備份介質服務器的網絡采用雙通道傳輸機制,網絡數據并行傳輸,提高數據的傳輸速率。同時,對存儲設備進行帶有校驗的RAID5校驗機制,增強備份數據的安全可靠性。
在備份的軟件實現上,采用備份領域中的專業軟件Symantec Backup Exec作為管理軟件,保障備份平臺的穩定性,根據備份對象的不同特點制定相應的備份作業計劃。同時,為備份管理員制定管理規章與操作準則,保證航天信息化系統的備份工作平穩有序進行。
在配置備份作業之前,針對Oracle、SQL Server等數據庫、數據文件等不同備份對象,以及信息化系統的備份需求,對備份作業的備份方法、介質循環策略、備份時間等各項參數配置進行合理的設定,按照設定對備份作業進行配置,實現備份作業的自動化管理。
備份作業完成配置后按計劃運行,對于備份作業的運行情況,通過郵件推送機制進行監控,在每次備份作業運行后,該次備份作業的運行狀態信息將通過郵件系統自動推送給備份管理員。備份管理員對備份作業的運行時間、成功與否、磁盤占用空間情況等要素進行監控,在發現備份作業的異常后,可及時調整備份策略或者相關參數,以適應新的備份環境。
每個信息化系統特點的不同,需要針對其特點采用與其相適應的備份策略,而一些特點相同或相近的信息化系統,則可以使用相同的備份策略,實現備份策略的共享,以簡化備份作業的管理,降低備份工作的管理成本。
表1概括了航天信息化系統數據備份平臺的顯著特點,實現了備份作業的集中管理,通過子介質服務器實現多任務并行備份、單臺服務器網絡雙通道數據并行傳輸提高了數據傳輸效率,通過備份介質的冗余和專業軟件的使用提高了備份工作的可靠性,通過備份作業備份策略的統一規劃、設置、監視和管理提高了備份工作的工作效率,為航天信息化系統的安全運行提供了更加良好的保障。

表1 航天信息化系統數據備份平臺實現方案
論述了建立航天信息化系統備份平臺的相關研究,備份平臺的基礎硬件采用LAN-Based架構,針對不同航天信息化系統特點采用子策略、父子策略、祖父策略等備份策略數據的備份與恢復,對備份作業的數據進行統一管理,以利于信息化系統的數據恢復。對于大量的備份作業,應用子備份服務器,通過中央備份服務器的控制調度達到多個作業并行備份的效果,有效節省網絡帶寬。
在備份平臺的實現上,采用Symantec Backup Exec作為備份管理軟件,如第4節所述,制定相應的策略配置、優化措施以及管理制度,實現多點多類別集中備份,促進了航天信息化系統的備份自動化規范化,保證各信息系統數據的安全可靠性。
本文中構建的備份管理平臺能夠實現對大部分航天信息化系統的多點多類別集中備份,今后將在此平臺的基礎上拓展更多方式的備份技術,比如,對于一些十分重要的信息化系統,需要進行快照[10]、CDP(Continuous Data Protection)[11],一些系統需要對整個操作系統進行鏡像備份或建立災備中心[12]。同時,對于備份平臺的優化與擴展也將是未來研究的重點。
1 Nakamura S, Qian C, Fukumoto S. Optimal backup policy for a database system with incremental and full backups[J]. Mathematical and Computer Modeling, 2003(11): 1373~1379
2 Symantec Corporation. Symantec backup exec 12.5 for Windows servers管理指南[G]. 2008: 191~194
3 張旭明,李曼麗,趙永平,等. 航天信息系統數據備份策略的研究[C]//中國航天結構強度與環境工程專業信息網2011年技術信息交流會. 廣東佛山:北京強度環境研究所,2011:495~498
4 孟向向,蘭雨睛. 中小企業數據安全管理解決方案[J]. 電子科技大學學報,2009,38(z1):45~48
5 張偉燕,馬軍,陸海. 企業信息化中的備份整合應用[J]. 計算機科學,2009,36(4A):71~73
6 張寧,張習平,閻萍. SAN環境下更有效的數據備份[J]. 艦船電子工程,2004,24(5):85~87
7 汪軼楨. 航天企業數據存儲備份設備及架構的比較與選擇[J]. 航天制造技術,2011(6):37~38
8 張建中,陳松喬,方正,等. 一種基于SAN架構的存儲網絡系統的設計與實現[J]. 中南大學學報(自然科學版),2008,39(2):350~355
9 張旭明,李曼麗,趙永平. 計算機輔助工藝設計(CAPP)系統數據備份模式的研究[J]. 航天器環境工程,2013,30(1):107~111
10 牛超,楊英杰,代向東. 一種新的復合快照技術的研究與設計[J]. 計算機應用與軟件,2013,30(7):164~167
11 余承龍,李戰懷,侯利曼,等. 基于連續數據保護的多策略數據恢復機制[J]. 計算機工程,2010,36(12):61~63
12 閆黎. 企業信息系統容災技術架構分析與應用[J]. 信息技術,2013(5):145~153
Research on Aerospace Information Data Centralized Backup Management Platform
Zhang Xuming Li Manli Zhao Yongping Han Xinglong
(Beijing Satellite Environmental Engineering Institute, Beijing 100094)
This paper researches and designs a project with proper infrastructure for backing up different type information systems. According to the feature of an information system, use backup methods such as full backup, incremental backup, and differential backup, and use the medium circulation strategy, such as child strategy, parent-child strategy, and grandparent strategy. Responding to the backup methods, adopt the relevant data recovery pattern. Reduce the pressure of network and I/O by parallel backup. By the research on this paper, build a multi-point, multi-type, centralized information data backup management platform, which can increase the capacity of data backup management and find the exception state of backup work.
aerospace information data;centralized management backup;backup strategy;backup data
張旭明(1986),碩士,計算機軟件與理論專業;研究方向:AIT信息技術設計。
2017-07-28