鄭朋飛 高淼 鄭朋舉
摘 要:隨著信息技術的快速發展及公司業務逐漸走向快速、靈活、多變,河南中煙對于存儲解決方案的要求也更加靈活。通過對現有存儲系統的整合,構建能夠支撐河南中煙未來業務發展的核心存儲系統,通過雙活數據存儲系統的建設,初步形成本地高業務連續性解決方案,保障煙草生產調度指揮體系的安全運轉。
關鍵詞:存儲虛擬化;雙活;異構存儲
中圖分類號:TP308 文獻標識碼:A 文章編號:1671-2064(2017)22-0023-02
1 虛擬化存儲系統建設的背景
根據建設時期和年代不同,以及一些歷史原因,不同的系統分別部署在不同的集群。每個集群都有相對獨立的服務器集群系統、SAN網絡及存儲系統。由于業務系統的不斷發展,管理水平的不斷增強,隨著與計算技術的不斷應用,IT系統集中化進程的加快,現有的存儲環境,已經無法滿足現有業務系統的發展的需要,主要問題如下:
1.1 現有存儲容量擴展性不高
現有存儲系統都為各個廠商的中端存儲,存儲容量擴展性不高,且在應對大數據量和復雜的容災架構的時候能力較弱,無法滿足未來數據中心的大數據量需求。
1.2 存儲孤島不利于數據統一管理
目前,雖然在兩臺AMS2500上實現了重要業務系統相對集中存儲,但仍存在現有存儲系統各自形成孤立的數據孤島,在資源統一管理上捉襟見肘。每套存儲系統只能利用自身的空間,而無法利用其它存儲的空間,造成很大的存儲資源浪費和重復投資。
1.3 異構存儲整合問題
現有存儲系統由不同廠商的不同存儲系統構成,擴容成本大,不同業務應用和廠商的設備獨立擴容,無法集中選擇性價比更高和服務更優的產品;共享難,各業務系統獨立使用存儲資源,即使其他存儲設備有閑置容量也無法加以利用,導致額外的容量浪費;管理難,各廠商的存儲管理軟件互不兼容,無法統一管理,導致運維難度大;業務和數據保護難,各廠商數據保護技術多樣,部署新功能困難,成本高昂。
1.4 缺乏業務連續性
目前存儲系統的部署方式存沒有實現高可用性架構,存在單點故障,不能夠有效的保護數據安全和業務連續性。
2 雙活虛擬化存儲系統技術的設計與實現
針對目前存儲系統存在的問題,通過構建雙活存儲系統實現存儲系統的高可用性,并利用存儲虛擬化技術對存儲孤島和異構存儲進行整合,實現存儲資源的統一管理。
2.1 整體架構設計
雙活存儲系統其中一臺使用智能異構虛擬化功能,將現網兩臺磁盤陣列進行接管,并通過LUN遷移功能,在保證原有上層業務無感知的情況下,把磁盤陣列中核心生產系統的LUN遷移到新購高端存儲上,利用新購存儲更好的性能,提升業務質量,同時將非核心業務系統的LUN部署在原磁盤陣列上,實現數據分級存儲,使得整體資源合理利用。這樣通過存儲異構虛擬化技術,接管現有存儲,實現存儲資源的大整合,通過建立虛擬存儲資源池,統一為業務提供存儲空間服務,實現基于虛擬化的統一存儲平臺,完成存儲整合任務。
2.2 存儲虛擬化詳細設計
異構虛擬化技術就是著眼于客戶的存量設備,為異構設備提供豐富的異構虛擬化功能。通過異構接管功能降低用戶管理不同異構陣列的復雜度并提升異構LUN性能;通過提供異構LUN在線遷移實現在不斷業務的情況下實現異構LUN之間數據平滑的遷移;通過提供異構遠程復制技術實現異構LUN間的容災;通過提供異構快照技術實現異構LUN的快速備份。
2.3 雙活存儲詳細設計
雙活存儲解決方案指兩個存儲均處于運行狀態,可以同時承擔生產業務,從而提高數據中心的整體服務能力和系統資源利用率。
雙活數據中心解決方案為AA雙活架構,以業界領先的OceanStor V3 HyperMetro功能為基礎,與Web、數據庫集群、負載均衡、傳輸設備和網絡等組件相結合,為客戶提供100km內的端到端雙活數據中心解決方案,確保業務系統發生設備故障、甚至單數據中心故障時,業務無感知,自動切換,實現RPO(Recovery Point Objective)=0,RTO(Recovery Time Objective)=0(RTO與應用系統及部署方式有關)。
2.3.1 存儲層雙活架構
(1)并行結構。HyperMetro特性基于兩套存儲陣列實現AA(Active-Active)雙活,兩端陣列的雙活LUN數據實時同步,且雙端能夠同時處理應用服務器的I/O讀寫請求,面向應用服務器提供無差異的AA并行訪問能力。當任何一臺磁盤陣列故障時,業務自動無縫切換到對端存儲訪問,業務訪問不中斷。
(2)免網關設計。HyperMetro雙活架構無需額外部署虛擬化網關設備,直接使用兩套存儲陣列組成跨站點集群系統。最大支持32個存儲控制器,即兩套16控存儲陣列組建雙活關系。
(3)I/O訪問路徑。HyperMetro在應用主機側,通過Ultra Path主機多路徑軟件,將兩臺存儲陣列上的雙活成員LUN聚合為一個雙活LUN,以多路徑vdisk方式對應用程序提供I/O讀寫能力。應用程序訪問vdisk時,Ultrapath根據選路模式,選擇最佳的訪問路徑,將I/O請求下發到存儲陣列。
2.3.2 高可靠技術
HyperMetro在繼承OceanStor存儲系統高可靠設計的基礎上,全新設計了一些解決方案級高可靠技術,最大化提高了存儲雙活方案的可靠性。
(1)跨磁盤陣列集群。兩套獨立的存儲陣列組建成本地高可用集群,提供雙活存儲架構,向應用服務器提供無差異的并行訪問,處理應用服務器的I/O請求。集群節點具有并發訪問能力。當出現單個控制器故障時,其承接的業務將被切換到本陣列的其它工作控制器;當陣列的工作控制器全故障時,則切換至另一個陣列。在跨磁盤陣列集群基礎上,HyperMetro以雙活Pair或雙活一致性組為單位提供服務和進行狀態管理。
(2)數據實時鏡像。HyperMetro 通過實時鏡像功能,保證兩個存儲陣列之間數據的實時同步。主機寫操作通過實時鏡像技術同時寫入兩個數據中心的雙活成員LUN,保持數據實時一致。
HyperMetro支持斷點續傳功能。當某些故障場景(如單套存儲故障)導致雙活Pair關系異常斷開時,HyperMetro通過記錄日志的方式,記錄主機新產生的寫I/O。當故障恢復時,HyperMetro將自動恢復雙活Pair關系,并且將所記錄的增量數據自動同步到遠端,無需全量同步所有數據,整個過程對主機“透明”,不會影響主機業務。
(3)跨磁盤陣列壞塊修復。硬盤在使用過程中可能因為掉電等異常情況出現壞塊,如果是可修復錯誤但是本端已經無法修復時,HyperMetro將自動從遠端陣列獲取數據,修復本地數據盤的壞塊,進一步提高系統的可靠性。
(4)沖裁設計。當提供雙活LUN的兩套陣列之間的鏈路故障時,陣列已經無法實時鏡像同步,此時只能由其中一套陣列繼續提供服務。為了保證數據一致性,HyperMetro通過仲裁機制決定由哪套存儲繼續提供服務。
2.3.3 高性能技術
在雙活鏡像數據的初始同步或者恢復過程中的增量同步過程中,差異數據塊通常有大量的零數據塊,無需逐塊復制,通過硬件芯片,對數據拷貝源端進行快速識別,找出零數據,在拷貝過程中,對全零數據特殊標識,只傳輸一個較小的特殊頁面到對端,不再全量傳輸。該技術可有效減少同步數據量,減少帶寬消耗,縮短同步時間。
2.4 原有存儲系統利舊使用
對于原有的存儲系統可以分兩類來用:對于購置時間較長和性能不高的存儲系統用來組件集中備份系統。對于性能較好的2臺原核心存儲,用新購置的華為OceanStor 18500 V3存儲系統的異構存儲虛擬化功能進行接管,繼續作為生產存儲使用,可以存儲一些非關鍵應用的數據。
3 實施效果
通過本項目的實施,利用雙活存儲解決方案提供了存儲系統的高可用性架構,雙活存儲的高可用性架構消除了數據中心存儲系統的單點故障,當任一存儲系統發生故障時,另一存儲系統可自動接管業務,能夠充分保證業務系統連續性,任意單個存儲系統發生故障時,業務數據無丟失,業務系統不會中斷。雙活存儲解決方案還提供了全自動的故障處理機制,故障切換無需人工干預,大幅降低容災系統維護成本,使得維護與管理變得更加規范。并通過對現有存儲系統的整合,充分利用現有資源,構建能夠支撐河南中煙未來業務發展的核心存儲系統,初步形成本地高業務連續性解決方案,保障河南中煙應用系統的安全運行。