咸彤
分布式存儲發展至今,市場上并沒有一個能夠被廣泛接受并引用的定義。
分布式存儲系統是將數據分散存儲在多臺獨立的設備上。傳統的網絡存儲系統采用集中的存儲服務器存放所有數據,存儲服務器成為系統性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規模存儲應用的需要。分布式網絡存儲系統采用可擴展的系統結構,利用多臺存儲服務器分擔存儲負荷,利用位置服務器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易于擴展。
首先:分布式存儲系統是將數據分散存儲在多臺獨立的設備上,這里的“多臺獨立的設備”,不要理解成為磁盤或者SSD,可以理解為x86通用服務器、Power服務器等,也可以理解為專門設計和優化的專用存儲設備。
其中,以x86通用服務器最為普遍。為了幫助用戶理解分布式存儲,百易存儲研究院建議用“存儲節點”來代替“多臺獨立的設備”,這里的存儲節點,可以是x86服務器(或者稱為存儲服務器、服務器存儲)、Power服務器,也可以是專用存儲設備,甚至使用傳統陣列,其中,最為普遍的還是x86通用服務器,其市場較為成熟,非常容易獲得,產品性價比非常具有競爭力。
其次,“傳統的網絡存儲系統采用集中的存儲服務器存放所有數據,存儲服務器成為系統性能的瓶頸”的表述中,網絡存儲系統的表述多用于與直連存儲(DAS)的區分,主要突出其能夠通過網絡被多個應用系統共享,網絡存儲系統又可以劃分為:存儲區域網絡(SAN)和網絡連接存儲(NAS),是SAN、NAS兩種存儲系統的統稱。

這里所說的“存儲服務器”主要指的是陣列控制器(也稱為機頭)+盤陣的設計方式,以往多采用專用集成電路芯片(ASIC)設計控制器,經歷了雙控到多控的變化,控制器與控制器之間采用專用網絡連接,控制器與磁盤之間通過專用后端網絡連接,從而實現了連接的全冗余架構設計,具有非常高的可靠性和穩定性。也因為如此,系統成本居高不下。
在系統的擴展性上,可以通過盤陣中盤的數量進行調節,系統具有一定的彈性,所謂Scale Up,也就是縱向擴展,但受制于機頭的性能,整個系統仍然存在性能天花板,用戶只能夠借助入門級存儲、中端存儲、高端存儲的升級來解決問題。根據以上的判斷和理解,百易存儲研究院認為用傳統存儲、傳統陣列或者傳統磁盤陣列的表述更為便于理解。
最后,“在分布式網絡存儲系統采用可擴展的系統結構,利用多臺存儲服務器分擔存儲負荷,利用位置服務器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易于擴展”的表述中,分布式網絡存儲系統就是我們要說的分布式存儲;可擴展的系統架構更多是指可以通過增加或者刪減存儲節點所帶來的橫向擴展(Scale Out)的架構,存儲系統的性能可以隨著節點的增加或者減少呈現動態變化的特征。這里提到的“位置服務器更好地理解應該是分布式存儲中的全局統一命名空間的元數據管理的部分。
通過上述分析,百易存儲研究院認為有關分布式存儲的定義應該關注幾個重要的特征:一是橫向擴展,二是通過網絡連接的存儲節點,以及軟件統一調度管理全局統一命名空間的存儲資源池,這應該符合分布式存儲的發展規律。僅僅強調軟件定義,或者x86通用服務器;強調云的彈性管理的特點,都不能夠完全準確的描述分布式存儲系統,也很難取得市場的廣泛共識。根據以上的判斷和理解,百易存儲研究院認為用傳統存儲、傳統陣列或者傳統磁盤陣列的表述更為便于理解。
傳統存儲按照功能可以分為SAN和NAS,分別用于塊數據、文件數據的存儲支持。隨著技術的不斷發展和用戶需求的變化,也出現了統一存儲和融合存儲的需求,在存儲系統的設計上,也出現了軟件、硬件分離的設計需求。
對于新分布式存儲系統而言,最初設計需求就是替代傳統SAN存儲,并用ServerSAN以示區分。但是相比于傳統存儲的全冗余連接設計,分布式存儲系統中的存儲節點可靠性相對不高,為此,分布式存儲系統通過多副本、糾刪碼的方式來提升系統的可靠性,為了提升這個存儲系統的性能,分布式存儲系統需要存儲節點配備SSD,充分利用SSD高IO的特性。
與此同時,分布式存儲橫向擴展的特性,非常適用于海量數據存儲,特別是非結構化的文件系統。一個分布式存儲系統往往同時滿足塊、文件、對象、大數據,以及CIFS、NFS等的數據訪問需求。因此,分布式存儲很難按照SAN、NAS、對象進行分類。
對于分布式存儲系統,根據是否對外提供應用計算能力,區分為分布式存儲和超融合。對于超融合系統而言,最主要的技術突破就體現在存儲上,也因為如此,才會把超融合納入到分布式存儲的分類中。
在超融合的產品形態上,最初是以一體機的形態呈現,但隨著市場的發展,超融合也提供純存儲的形態,支持將超融合一體機作為單一存儲系統的場景。
分布式存儲、超融合也是相互滲透、融合發展的,并沒有嚴格意義上的形態區分,這一點應該引起大家的重視。