遲松特
(遼河油田勘探開發研究院,遼寧 盤錦 124010)
云環境下的數據運行能夠為企業或者個人用戶提供多樣化、個性化的數據存儲服務,同時具備可擴展性特點,為國民經濟的發展預留了較大的空間。基于云計算的廣泛應用,云存儲服務出現,借助分布式文件系統、網絡存儲等關鍵性技術,其能夠整合多方面的云計算資源,構建一個高效可靠的云存儲系統,并面向用戶開放存儲服務。與傳統存儲技術相比,分布式存儲技術能夠使不同類型的存儲設備協同工作,并配合數據隔離技術,為用戶提供性能強大的云存儲服務。分布式存儲技術極大地滿足了海量規模、高擴展性的數據處理需要,然而隨著社會經濟發展對數據處理的要求越來越高,分布式存儲技術也面臨新的挑戰。
云計算環境下分布存儲關鍵技術的應用,需要處理快速增長的數據和信息,這就需要高性能的網絡存儲技術作為支撐。傳統網絡存儲技術在應用中存在各種問題,如利用效率低、成本高、易產生“信息孤島”等,人們急需一種效率高、成本低、可共享信息的新技術,而網絡附屬存儲(Network Attached Storage,NAS)技術的出現正好迎合了這一需要。NAS 技術結構主要包括網絡接口、數據操作系統、存儲接口以及專屬文件共享服務協議等[1]。在此技術架構下,通過網絡接口接收用戶的數據,之后由操作系統進行處理,將其轉化為一個個數據塊并予以分類,用戶在進行特定操作后就可存儲和調用數據。NAS 技術能夠滿足一對多、多對一的數據服務需要,極大地提高數據存儲的利用效率,并簡化數據存儲流程,從而提高云存儲的成本優勢。
分布式文件系統(Distributed File System,DFS)將海量的數據分布在不同的節點存儲在系統里,并基于此構建一個整體的文件存儲系統,方便用戶隨時調用,極大地提高了分布存儲技術的擴展性。DFS 技術的應用也有利于提高數據存儲的安全性,當個別節點的存儲設備發生故障時,其他節點的存儲設備能夠進行數據恢復,避免數據丟失,從而保證整個云存儲系統順利運行。
P2P 存儲(Peer-to-Peer Storage)技術充分結合了計算機網絡和分布式系統的優勢,并解決了傳統分布式存儲技術將服務器與用戶端分離的問題,使各個節點的存儲設備都處于平等的地位,突破了角色的限制,提高了存儲資源的利用效率,能夠最大限度滿足網絡數據和資源共享需求。同時,P2P 存儲技術具有極高的自組織性,不管從哪一個節點接入,都不會影響整體存儲系統的運行,保證了云存儲服務的可靠性[2]。另外,云計算環境下,在分布存儲的運行中應用具有明顯成本優勢的P2P存儲技術,并借助網絡存儲系統整合可用的存儲資源,極大地降低了存儲成本。
隨著云計算環境趨于成熟,分布存儲關鍵技術的發展也越來越成熟,各種新型存儲技術不斷涌現,如對象存儲技術(Object-based Storage Device,OSD)、統一存儲技術等。其中,OSD 存儲技術能夠通過特定的算法實現存儲對象的加密,將抽象數據看作一個對象,并能夠在不同的存儲平臺之間實現流通共享,具有較高的私密性、擴展性和安全性;統一存儲技術能夠融合多個存儲方案,并構建一個統一的存儲平臺,從而為用戶提供多樣的數據取用服務,這一技術通常被大型企業級別的用戶應用,能夠解決其存儲管理復雜、存儲成本過高的問題。
綜合以上存儲技術,構建混合應用的分布式存儲結構能夠處理海量的用戶運行數據,并有效提高數據存儲和運行的效率,簡化實際的存儲流程,提高云存儲服務的質量。
云計算環境下,分布式存儲關鍵技術的應用雖然彌補了傳統存儲方式的不足,但隨著應用的深入,也暴露了不少技術性問題,如容錯性問題、可擴展問題、成本控制問題等,具體如下。
容錯性主要是指在存儲系統發生意外故障之后,整體的網絡存儲系統不會失效,能夠正常運行,并為用戶提供持續的存儲服務的能力。傳統數據存儲模式下,為了提高存儲服務的容錯性,一般是配置高性能的存儲設備,雖然一般情況下能夠實現這一目標,但增加了企業的存儲成本,也有可能影響數據存儲的質量。這一容錯性解決方案顯然并不適用于分布存儲方式。云計算環境下,分布式存儲的節點隨時在增加,數據失效的風險也在不斷增加,其對信息容錯性的要求更高。因此,要想提高分布式存儲方式的性能,必須引入功能更強大的容錯技術,著力解決數據失效問題,保障數據存儲的安全性和完整性。
可擴展性能一直是影響網絡存儲性能的關鍵性因素。傳統存儲模式下,通常是通過增加存儲磁盤設備拓展存儲空間。然而,這一方式并不能真正解決分布式存儲的可擴展性問題,且隨著國民經濟的發展,分布式存儲需要處理的數據規模在不斷擴大,拓展存儲磁盤無法有效解決存儲空間不足的問題。對分布式存儲關鍵技術而言,可擴展性尤為關鍵,在保證不影響現有用戶數據存儲服務的基礎上,進一步拓展存儲空間和優化性能,但這一性能的優化不能通過廉價的服務系統實現。因此,為了保障云環境下分布存儲的高性能,在設計之前就要充分考慮其可擴展性,預留合適的擴展空間,同時也應保證可隨時增加擴展性能,以進一步提高分布存儲能力。
對企業經營管理而言,存儲的成本控制問題是其需要考慮的重要因素之一,能否以較低的成本實現對快速增長的大量數據的存儲,是企業選擇云存儲供應商時考慮的關鍵問題。云計算環境下,需要處理的數據規模呈指數趨勢增長,這些數據的存儲和運行都需要超大規模的存儲空間支持,也需要消耗相應的成本。同時,為了實現數據取用的高效率,需要配置高標準的文件系統,以實現相應的存儲功能。在此背景下,如何優化分布存儲技術以降低存儲空間和資源消耗,同時減少運行成本,是各個云存儲服務供應商需要解決的關鍵性問題,這也是影響分布存儲技術進一步推廣的重要因素之一。
為助力企業的數字化轉型升級,必須著力優化分布式存儲關鍵技術,解決其容錯性低、擴展性差及成本高等問題,以進一步提高云存儲的性能和功能,滿足用戶的個性化數據使用需要。
云計算環境下,提高分布存儲關鍵技術的容錯性,可以從兩方面展開。一是采用復制容錯技術。優化分布存儲關鍵技術的容錯性,可通過復制容錯技術,創建多個數據模塊,將數據分布存儲在不同節點中,當某個數據發生意外時,可以通過調用其他的數據模塊獲得數據。復制容錯技術的應用能夠直接快速地獲得數據,取用數據的效率較高,然而這一技術對數據存儲空間的要求較高。二是采用糾刪碼容錯技術。與復制容錯技術相比,糾刪碼容錯技術對數據存儲空間的要求不高,其通過多個數據對象生成編碼,不需要復制完整數據,只是復制丟失的數據,但相應地,其數據處理量相對較大[3]。在分布存儲關鍵技術優化過程中,應根據自身存儲需求合理選擇引入復制容錯技術或糾刪碼容錯技術,解決分布存儲的容錯問題,為用戶提供優質的數據存儲服務。
與傳統存儲技術相比,分布存儲方式為企業提供了一種成本相對較低、擴展性能較高的存儲服務。然而云環境下,隨著需要處理的數據規模不斷擴大,分布存儲技術的擴展性能已成為不可忽視的問題。基于分布式存儲技術的存儲節點往往數量龐大,其中心的擴展性也需要得到保障。提高分布存儲技術的擴展性能,需要著力提高其文件系統的擴展性,優化數據處理方式,壓縮文件大小,簡化數據分發服務流程,在保障數據服務的基礎上,提高數據處理的效率和質量,從而提高數據網絡的可用性和擴展性。然而,分布存儲技術擴展性能的提升往往伴隨成本的增加。因此,企業在提高分布存儲技術的擴展性能時,應注意在應用構架之前就考慮系統的可擴展性,為之后系統的升級預留空間。同時,為了盡可能地降低成本,新增的擴展系統和設備應與原有的系統兼容,循環利用原有的設備,避免資源浪費、成本大幅度增加。
云計算環境下,應用分布式存儲技術還需要考慮優化節能技術,以減少資源消耗,降低存儲成本。一方面,應優化硬件節能技術,選擇低耗的硬件存儲設備和資源,同時在保障系統運行性能的前提下,構建相對低能耗的數據存儲結構,實現節能減排的目標。另一方面,優化軟件節能技術,在充分保證分布存儲系統服務功能的基礎上,強化存儲節點的管理,及時關閉剩余的存儲節點,避免不必要的存儲空間浪費[4]。同時,積極引入高標準的數據管理技術,如緩存數據預取技術、靜態數據管理、動態數據管理等,提高數據運行的效率,避免過度運行造成資源浪費[5]。
云計算環境下,運用網絡存儲技術、分布式文件系統、P2P存儲技術、新型存儲技術等分布存儲關鍵技術,能夠構建一個高效、可靠的云存儲系統,為用戶提供多樣化的數據存儲服務。隨著社會對各個行業服務延續性要求的提高,人們對分布式云存儲技術的要求也越來越高,因此需要進一步優化其容錯性,提高擴展性能,應用節能技術,提高云計算存儲服務能力。