


摘 要:石油行業(yè)地質(zhì)資料數(shù)據(jù)具有數(shù)據(jù)量大、增長快和數(shù)據(jù)種類復(fù)雜等特點,如何備份這些海量的數(shù)據(jù)成了一大難題。以中國南海東部海域石油勘探數(shù)據(jù)為例,結(jié)合石油行業(yè)數(shù)據(jù)特點,設(shè)計了“兩地三中心”的數(shù)據(jù)備份系統(tǒng)架構(gòu),建成了三級數(shù)據(jù)備份系統(tǒng)。該系統(tǒng)以NAS存儲數(shù)據(jù)快照技術(shù)為基礎(chǔ),各級備份系統(tǒng)采用不同的備份策略,對應(yīng)不同的風險級別,通過對各級備份數(shù)據(jù)進行恢復(fù)驗證,各級備份數(shù)據(jù)都是完整有效的,取得了預(yù)期的效果,達到了系統(tǒng)建設(shè)的目的。
關(guān)鍵詞:NAS;數(shù)據(jù)備份系統(tǒng);異地容災(zāi);數(shù)據(jù)恢復(fù)
中圖分類號:TP309.3 文獻標識碼:A
Abstract:The geological data of petroleum industry has the characteristics of large data volume,fast growth and complex data types.How to backup these huge data is a difficult problem.Taking the data of oil exploration in the eastern South China Sea as an example,combining with the characteristics of the oil industry data,the paper designs the Three Centers for Two Places data backup system architecture,and constructs the three-level backup system.The system is based on NAS storage data snapshot technology,and different backup strategies at all levels are adopted,corresponding to different levels of risk.Through the study of recovery verification,all levels of the backup data are complete and effective,and the expected results and the purpose of system construction are achieved.
Keywords:NAS;data backup system;remote disaster recovery;data recovery
1 引言 (Introduction)
隨著中國南海東部海域石油勘探逐漸進入深水領(lǐng)域,勘探所涉及的海域面積越來越大,由此產(chǎn)生的石油勘探開發(fā)數(shù)據(jù)量也越來越大,這些數(shù)據(jù)是進行石油勘探開發(fā)的基礎(chǔ),也是企業(yè)最重要的財富。因此,為了保障勘探開發(fā)科研數(shù)據(jù)的安全,降低因人為誤操作導(dǎo)致數(shù)據(jù)丟失的風險,防范因各種自然災(zāi)害而造成硬件設(shè)備損毀導(dǎo)致的數(shù)據(jù)丟失,建設(shè)一套有效的數(shù)據(jù)容災(zāi)備份系統(tǒng)顯得尤為重要。
傳統(tǒng)的數(shù)據(jù)備份多以磁帶庫為介質(zhì),這種備份模式具有介質(zhì)不易管理、存儲容量有限和數(shù)據(jù)查找恢復(fù)不便等缺點,已不能滿足新形勢下的企業(yè)級數(shù)據(jù)備份需求。文中設(shè)計的數(shù)據(jù)容災(zāi)備份系統(tǒng)以NAS存儲為基礎(chǔ),建立了多級備份系統(tǒng),可滿足從過去幾小時到幾年內(nèi)的數(shù)據(jù)恢復(fù)需要,并在異地建立了數(shù)據(jù)災(zāi)備中心,為企業(yè)的重要數(shù)據(jù)建立了多重安全保障[1]。
2 現(xiàn)狀分析(Analysis of the situation)
南海東部海域經(jīng)歷30余年的勘探開發(fā),已實現(xiàn)連續(xù)20年油氣產(chǎn)量超千萬方,經(jīng)過多年的積累,形成了海量的勘探開發(fā)數(shù)據(jù)資料庫,目前共有數(shù)據(jù)大約170TB,數(shù)據(jù)類型及數(shù)據(jù)量如表1所示。
從上表來看,勘探開發(fā)數(shù)據(jù)主要是GeoFrame應(yīng)用數(shù)據(jù),該類數(shù)據(jù)是GeoFrame軟件應(yīng)用平臺下的綜合地質(zhì)資料數(shù)據(jù),采取結(jié)構(gòu)化的存儲形式,結(jié)合Oracle數(shù)據(jù)庫,利用GeoFrame軟件平臺進行地質(zhì)資料綜合解釋,其次是Eclipse油藏數(shù)據(jù),該類數(shù)據(jù)用來進行油田數(shù)值模擬,采取非結(jié)構(gòu)化的存儲形式。
由于數(shù)據(jù)量大,數(shù)據(jù)種類多,數(shù)據(jù)增長快,數(shù)據(jù)讀取頻率高,目前所有數(shù)據(jù)的存儲使用模式已由過去的單一機器存儲,變成了分布式的網(wǎng)絡(luò)存儲,其存儲形式為NAS存儲(網(wǎng)絡(luò)附屬存儲),利用磁盤陣列和專業(yè)的軟件來管理數(shù)據(jù)[2,3]。以此為基礎(chǔ)再結(jié)合應(yīng)用服務(wù)器、數(shù)據(jù)庫服務(wù)器、應(yīng)用客戶端和千兆光纖網(wǎng)絡(luò),形成了分布式的應(yīng)用系統(tǒng)架構(gòu)[4],其系統(tǒng)架構(gòu)圖如圖1所示。由于所有數(shù)據(jù)都是存儲于NAS設(shè)備上,應(yīng)用人員只需要一臺瘦客戶機(PC)即可使用各種專業(yè)軟件,調(diào)用所有數(shù)據(jù)。
3 系統(tǒng)建設(shè)(System construction)
3.1 設(shè)計要求
根據(jù)目前的系統(tǒng)架構(gòu)和數(shù)據(jù)容量,以及每天的數(shù)據(jù)增量,綜合考慮建設(shè)成本和網(wǎng)絡(luò)帶寬限制,結(jié)合系統(tǒng)故障風險承受能力和需求分析,提出了“兩地三中心”的系統(tǒng)架構(gòu)設(shè)計方案,即在深圳建設(shè)兩套數(shù)據(jù)備份系統(tǒng):近線備份系統(tǒng)和同城備份系統(tǒng),在北京建設(shè)異地數(shù)據(jù)容災(zāi)備份中心,其數(shù)據(jù)流圖如圖2所示。
按照“兩地三中心”的系統(tǒng)架構(gòu)設(shè)計方案,需要在深圳和北京建設(shè)三套備份系統(tǒng),其中近線備份系統(tǒng)是對生產(chǎn)應(yīng)用系統(tǒng)的在線備份系統(tǒng),部署在與生產(chǎn)應(yīng)用系統(tǒng)的同一地點,同城備份系統(tǒng)為近線備份系統(tǒng)的半同步備份系統(tǒng),部署在與近線備份系統(tǒng)同一城市的不同地點,異地容災(zāi)中心為同城備份系統(tǒng)的異步備份。三級備份系統(tǒng)分別對應(yīng)不同的風險等級[5],其中近線備份系統(tǒng)對應(yīng)一級風險,主要包括人為誤操作和軟硬件及系統(tǒng)故障導(dǎo)致的短期內(nèi)數(shù)據(jù)丟失,需要利用近線備份系統(tǒng)恢復(fù)數(shù)據(jù);同城備份系統(tǒng)對應(yīng)二級風險,主要是水災(zāi)、火災(zāi)等災(zāi)難導(dǎo)致主機房硬件設(shè)備損毀導(dǎo)致的數(shù)據(jù)丟失,需要利用同城備份系統(tǒng)恢復(fù)數(shù)據(jù),以及需要找回過去更長周期內(nèi)的數(shù)據(jù);異地容災(zāi)中心對應(yīng)三級風險,主要是地震、恐怖襲擊等不可抗力因素導(dǎo)致所在城市毀滅,繼而導(dǎo)致當?shù)厮杏布O(shè)備損毀和數(shù)據(jù)丟失,需要利用異地容災(zāi)中心恢復(fù)數(shù)據(jù)。三級備份系統(tǒng)分別采取不同的備份策略進行數(shù)據(jù)備份:近線備份系統(tǒng)的備份策略是數(shù)據(jù)保留周期短密度高,同城備份系統(tǒng)的備份策略是數(shù)據(jù)保留周期長密度適中,異地容災(zāi)中心的備份策略是數(shù)據(jù)保留周期短密度低[6]。
3.2 技術(shù)方案
根據(jù)設(shè)計要求,備份數(shù)據(jù)流傳輸路徑依次為生產(chǎn)應(yīng)用系統(tǒng)至近線備份系統(tǒng),近線備份系統(tǒng)至同城備份系統(tǒng),同城備份系統(tǒng)至異地容災(zāi)中心。目前生產(chǎn)應(yīng)用系統(tǒng)數(shù)據(jù)采用NetApp存儲設(shè)備,通過進行調(diào)研和需求分析,并結(jié)合前期的各項測試結(jié)果,最終決定近線備份系統(tǒng)也采用NetApp存儲設(shè)備,同城備份系統(tǒng)和異地容災(zāi)中心采用DELL Compellent存儲設(shè)備,生產(chǎn)應(yīng)用系統(tǒng)至近線備份系統(tǒng)之間數(shù)據(jù)傳輸利用NetApp Data ONTAP的SnapMirror模塊實現(xiàn),近線備份系統(tǒng)至同城備份系統(tǒng)的數(shù)據(jù)傳輸利用Nexenta NexentaStor的Auto-Tier模塊實現(xiàn),同城備份系統(tǒng)至異地容災(zāi)中心的數(shù)據(jù)傳輸利用DELL ENTERPRISE MANAGER的Replication實現(xiàn),其架構(gòu)圖如圖3所示。
3.3 方案實施
近線備份系統(tǒng)采用NetApp存儲設(shè)備,主要硬件配置為NetApp FAS8020 控制器,以及配套的NetApp DS4243磁盤柜,磁盤柜配置4T/7200RPM的sata硬盤,軟件許可配置為SnapMirror、SMO、OSSVhe和FlexClone等模塊。
由于近線系統(tǒng)采用NetApp存儲設(shè)備,與生產(chǎn)系統(tǒng)存儲設(shè)備屬于同構(gòu)設(shè)備,因此數(shù)據(jù)傳輸可利用SnapMirror實現(xiàn)。SnapMirror是NetApp ONTAP的一項集成功能,可在各存儲端之間提供一種高效的數(shù)據(jù)復(fù)制解決方案,通過配置SnapMirror參數(shù),可滿足從幾分鐘到幾小時不等的數(shù)據(jù)恢復(fù)點目標要求,從而滿足了近線備份系統(tǒng)周期短密度高的數(shù)據(jù)備份需求。
同城備份系統(tǒng)采用DELL存儲設(shè)備,主要硬件配置為Dell Compellent SC8000控制器,Dell Compellent SC200磁盤柜和3T/7200RPM的sata硬盤,由于近線備份設(shè)備與同城備份屬于異構(gòu)設(shè)備,因此還配置一臺Dell Powerdge R720控制器,用于安裝Nexenta公司的NexentaStor軟件產(chǎn)品,該軟件能夠解決不同廠商的設(shè)備兼容和數(shù)據(jù)傳輸問題,其中的Auto-Tier模塊實現(xiàn)了數(shù)據(jù)從近線備份系統(tǒng)至同城備份系統(tǒng)的傳輸,并能對數(shù)據(jù)進行重復(fù)刪除和壓縮,Auto-Snap模塊能對文件系統(tǒng)做快照備份,從而滿足了同城備份系統(tǒng)數(shù)據(jù)保存周期長的需求。
異地容災(zāi)中心也采用DELL存儲設(shè)備,硬件配置與同城備份系統(tǒng)一樣,作為同城備份系統(tǒng)的異地備份,通過iSCSI協(xié)議利用DELL ENTERPRISE MANAGER的Replication模塊從廣域網(wǎng)進行數(shù)據(jù)傳輸[7]。
4 關(guān)鍵技術(shù)(The key technology)
4.1 磁盤陣列
RAID是英文Redundant Array of Independent Disks的縮寫,中文簡稱為獨立冗余磁盤陣列,簡單來說,RAID就是一種把多塊獨立的硬盤按不同的方式組合起來形成一個大的存儲資源池,從而提供比單個硬盤容量更大、可靠性更高的數(shù)據(jù)存儲技術(shù)。硬盤的不同組合方式,對應(yīng)RAID不同的級別,提供了不同的數(shù)據(jù)讀寫速度和可靠性。
在此次數(shù)據(jù)備份系統(tǒng)建設(shè)中,各級備份系統(tǒng)都采用了RAID技術(shù),通過RAID技術(shù),有效保障了各級備份系統(tǒng)的數(shù)據(jù)安全。近線備份系統(tǒng)采用RAID 5,即將所有硬盤形成一個大的存儲池,將所有數(shù)據(jù)和奇偶校驗信息條塊化的存儲在所有硬盤上,并通過設(shè)置Hot-Spare(熱備份)盤來提高數(shù)據(jù)的安全性,即使RAID有硬盤出現(xiàn)故障,也能保證存儲數(shù)據(jù)的安全。同城備份系統(tǒng)和異地容災(zāi)中心由于采用了ZFS文件系統(tǒng),因此使用了RAIDZ解決方案,RAIDZ可以利用ZFS文件數(shù)據(jù)的校驗和其他機制進行錯誤檢測和更正,可以對所有數(shù)據(jù)進行校驗,并可在有正確副本時對錯誤數(shù)據(jù)進行恢復(fù)。
4.2 存儲快照技術(shù)
存儲網(wǎng)絡(luò)行業(yè)協(xié)會SNIA(StorageNetworking Industry Association)對快照(Snapshot)的定義是:關(guān)于指定數(shù)據(jù)集合的一個完全可用拷貝,該拷貝包括相應(yīng)數(shù)據(jù)在某個時間點(拷貝開始的時間點)的映像。快照可以是其所表示的數(shù)據(jù)的一個副本,也可以是數(shù)據(jù)的一個復(fù)制品。快照的作用主要是能夠進行在線數(shù)據(jù)備份與恢復(fù),當存儲設(shè)備發(fā)生應(yīng)用故障或者文件損壞時可以進行快速的數(shù)據(jù)恢復(fù),將數(shù)據(jù)恢復(fù)至某個可用的時間點的狀態(tài)。
同樣,在此次數(shù)據(jù)備份系統(tǒng)中都采用了存儲快照技術(shù),通過對備份系統(tǒng)中的數(shù)據(jù)卷按時間點做快照,即可形成該時間點的數(shù)據(jù)保護點(CDP),若該時間點以后出現(xiàn)數(shù)據(jù)丟失,則可利用快照恢復(fù)至該時間點,從而找回丟失的數(shù)據(jù)。快照的頻率和保存時間長短決定了對數(shù)據(jù)的保護程度,在此次備份系統(tǒng)建設(shè)中,根據(jù)需要制定了不同的快照策略,即對近線備份系統(tǒng)采取密度高保存周期短的策略,滿足近線備份系統(tǒng)短期的數(shù)據(jù)保護需求,而對同城備份系統(tǒng)和異地容災(zāi)中心,則采取密度低保存周期長的策略,滿足數(shù)據(jù)保存時間長的要求。
4.3 數(shù)據(jù)卷克隆
數(shù)據(jù)卷克隆主要是針對數(shù)據(jù)恢復(fù)的,一般來說,數(shù)據(jù)快照是只讀不可寫的,因此要真正使用快照恢復(fù)的數(shù)據(jù),需要進行數(shù)據(jù)卷克隆,即利用快照克隆出一份與相應(yīng)數(shù)據(jù)集一樣的可讀可寫的數(shù)據(jù)卷,從而達到數(shù)據(jù)恢復(fù)并可用的目的。
5 數(shù)據(jù)恢復(fù)與驗證(Data recovery and validation)
數(shù)據(jù)容災(zāi)備份系統(tǒng)建成后,還需要配備相應(yīng)的備用服務(wù)器,搭建應(yīng)用軟件環(huán)境,以便對備份數(shù)據(jù)定期進行數(shù)據(jù)恢復(fù)驗證,確保備份數(shù)據(jù)是有效和可靠的。此次數(shù)據(jù)容災(zāi)備份系統(tǒng)包括三級備份系統(tǒng),系統(tǒng)架構(gòu)復(fù)雜,實施難度大,在系統(tǒng)建成后,制訂了詳細的備份系統(tǒng)日常管理辦法和應(yīng)急恢復(fù)預(yù)案及數(shù)據(jù)恢復(fù)操作手冊,形成了完整的制度規(guī)范。
按照制度要求,除了日常對各級備份系統(tǒng)進行日常維護、故障預(yù)警、日志記錄和運行評估外,還需定期進行數(shù)據(jù)恢復(fù)驗證,其中對近線備份系統(tǒng)每月進行一次數(shù)據(jù)恢復(fù)驗證,同城備份系統(tǒng)每季度進行一次數(shù)據(jù)恢復(fù)驗證,異地容災(zāi)中心每年進行一次容災(zāi)恢復(fù)演練,通過模擬生產(chǎn)應(yīng)用系統(tǒng)出現(xiàn)數(shù)據(jù)丟失或系統(tǒng)崩潰,從備份系統(tǒng)恢復(fù)丟失的數(shù)據(jù)或進行系統(tǒng)切換,并對恢復(fù)過程和結(jié)果進行記錄。
6 結(jié)論(Conclusion)
此次容災(zāi)備份系統(tǒng)的建設(shè),從前期的需求分析、調(diào)研測試、方案設(shè)計,到方案的實施、軟硬件的安裝部署,前后歷經(jīng)半年時間,目前系統(tǒng)運行狀態(tài)良好,所有數(shù)據(jù)都能按照設(shè)計的鏈路進行傳輸,數(shù)據(jù)壓縮和重復(fù)刪除功能也都得到了實現(xiàn),各級備份系統(tǒng)的數(shù)據(jù)經(jīng)過驗證都是有效的,均符合前期設(shè)計要求。該系統(tǒng)建成后,為企業(yè)的重要數(shù)據(jù)建立了多重保障,已多次利用備份系統(tǒng)找回因誤操作和系統(tǒng)故障而丟失的數(shù)據(jù),受到了廣大應(yīng)用人員的好評,極大的提高了南海東部海域勘探開發(fā)數(shù)據(jù)的安全性。
在數(shù)據(jù)容災(zāi)備份系統(tǒng)的建設(shè)及日常維護過程中,筆者有幾點經(jīng)驗體會:一是前期要做好調(diào)研,結(jié)合自身的應(yīng)用需求和現(xiàn)狀,制訂一個符合自身需求的建設(shè)方案;二是系統(tǒng)建設(shè)要通盤考慮,要結(jié)合軟件、硬件、存儲、網(wǎng)絡(luò)、機房等因素,確保方案從技術(shù)層面是可行的;三是備份系統(tǒng)數(shù)據(jù)一定要進行恢復(fù)驗證,要定期進行數(shù)據(jù)恢復(fù)演練,檢驗備份數(shù)據(jù)的可用性;四是系統(tǒng)建設(shè)和日常維護要進行記錄,要制訂相應(yīng)的管理規(guī)定和操作手冊,形成系統(tǒng)的技術(shù)文檔和總結(jié)報告,并歸檔保存。
參考文獻(References)
[1] YU J,REN K,WANG C,et al.Enabling Cloud Storage Auditing with Key-Exposure Resistance[J].IEEE Transactions on Information Forensics and curity,2015,10(6):1167-1180.
[2] YU Y,LI Y N.Public Integrity Auditing for Dynamic Data Sharing with Multiuser Modification[J].IEEE Transactions on Information Forensics & Security,2015(10):1717-1726.
[3] YU Rongwei,WANG Lina,WANG Dejun,et al.Study on Security Enhancement Technology for Disaster Tolerant[J].Wuhan University Journal of Natural Sciences,2009,14(1):019-023.
[4]鄭如秋,梁庭瑋.一種分布式并行文件系統(tǒng)的介紹及在海洋地震數(shù)據(jù)處理中的應(yīng)用[J].電腦與信息技術(shù),2015,23(4):44-46.
[5] 汪生珠,何慶兵,歐陽欣.集群NAS存儲技術(shù)在石油勘探高性能計算中的應(yīng)用[J].中國科技信息,2016(6):29-31.
[6]陳勝華,伍德雁.異地數(shù)據(jù)容災(zāi)備份與恢復(fù)的應(yīng)用研究[J].科技訊,2012(13):45.
[7]王春才,閆磊,李英韜.基于iSCSI的網(wǎng)絡(luò)數(shù)據(jù)存儲技術(shù)研究[J].吉林師范大學(xué)學(xué)報(自然科學(xué)版),2014(4):98-100.
作者簡介:
葉虹余(1984-),男,本科,工程師/信息系統(tǒng)項目管理師.研究領(lǐng)域:信息系統(tǒng)開發(fā)、運維及管理.