
Budd Van Lines公司副總裁兼CIO Douglas Soltesz正面臨一個常見問題:數據如潮水般涌來,似乎沒完沒了。
“就算給我再大的存儲容量,我也能將它塞滿。”Douglas Soltesz指出,來自該公司辦公室和倉庫的近四個月的高清監控視頻如今在其Nexenta Stor NAS和SAN平臺上占用了60TB的存儲空間。這類視頻是公司存儲需求每年以50%~80%的速度增長的原因之一。
十年來,憑借硬驅技術使得存儲密度不斷增加,但截至目前此種形式已經遭遇瓶頸,IT部門正在期待增加存儲密度的新技術,比如疊瓦式磁記錄(SMR)和相變內存(PCM)。而在此期間,企業用戶則借助軟件來降低成本,并提高數據訪問速度,這些軟件可以對普通磁盤驅動器、固態硬盤和服務器端閃存內存上的數據進行虛擬化、重復數據刪除和緩存等處理。
磁盤密度越來越高
存儲廠商希捷科技公司的高級副總裁Mark Re表示,經過十年來密度穩步增長的歷程后,使用垂直磁記錄(PMR)技術的磁盤,其每平方英寸的最大存儲容量在1TB左右。
市場研究公司IHS iSuppli的存儲分析師Fang Zhang稱,在今年下半年,希捷將開始交付使用SMR的驅動器:通過在磁盤上疊放數據磁道,就像在屋頂上疊放木瓦那樣,從而將更多數據“塞”到磁盤上。這最終有望將驅動器密度提高到每平方英寸1.3TB~1.4TB;希捷的SRM驅動器明年會開始出現在臺式機上,之后會擴大到存儲陣列等其他平臺上。
此外,下一個技術進展就是熱輔助磁記錄(HAMR),這有望將磁盤驅動器的密度提高到每平方英寸5TB。這項技術使用小小的激光器改變磁盤磁性。希捷的第一批HAMR驅動器預計會在2015年或2016年面市。
而今年第四季度,希捷的勁敵西部數據預計也會發布充氦的磁盤驅動器。氦提供了比空氣要小的阻力,因而可以為驅動器另外添加一兩張存儲盤片。額外盤片可以將PMR驅動器的最大容量從今天的4TB提高至5TB或6TB。西部數據方面稱,他們計劃在兩年內發布SMR和HAMR驅動器;而未來,他們希望通過使用自組裝分子和納米印制(nanoimprinting)技術讓硬驅密度翻番。
在閃存方面,廠商們不僅在努力提高密度,還在努力提高服務器端閃存存儲和固態硬盤里面所用閃存的可用容量和使用壽命。
惠普存儲部門的首席技術官Milan Shetti表示,大多數閃存和固態硬盤基于NAND,到2016年前后,它們將被一種名為相變內存(PCM)的新型非易失性內存所取代。不像磁記錄技術通過改變物理內存部分的磁場方向記錄數據,PCM運用熱量改變存儲介質的導電性。IBM蘇黎世研究實驗室的內存和探頭技術經理Haris Pozidis表示,PCM驅動器不僅速度快于NAND閃存,內存單元能經受的讀寫周期也要比NAND閃存多兩三倍。對于像高速緩存這些不斷讀寫數據的應用來說,這點很重要。
Shetti預測,最初的驅動器容量大約在200GB至250GB,驅動器大小到2018年至少翻番。他強調,這些都將是可用容量,目前的固態硬盤卻不是這樣:原始容量中15%~20%已被預留,用來更換漸漸損耗的內存單元。Shetti預計每GB價格會與目前閃驅的價格相當,這意味著價格會下降15%~20%,因為全部的原始容量實際上都是可用容量。
重復數據刪除必不可少
在過去的10年,重復數據刪除(指消除數據重復副本的方法)由改變游戲規則的新穎技術變成必不可少的功能。
觀察人士表示,別指望重復數據刪除從硬驅刪除的數據量方面出現任何突破性增加。目前,重復數據刪除通常能達到的數據縮減比是7∶1或10∶1。將來的改進會來自對數據進行重復數據刪除速度方面的提升和整個企業使用標準的重復數據刪除系統。由于重復數據刪除在硬件而不是在軟件里面進行,并在速度比今天的NAND閃存更快的非易失性內存(如PCM)里面進行,速度會因而提升。Shetti預測“每個非易失性內存控制器都會內置重復數據刪除技術。”他還指出,不像磁盤驅動器,重復數據刪除不會引起非易失性內存驅動器上出現碎片。
內置重復數據刪除是指數據經過重復數據刪除處理后加以存儲,它減少了將數據從主存儲器存儲到備份和復制副本的需求。Pure Storage稱,其內置重復數據刪除讓閃存陣列得以存儲多達5至10倍的數據。
觀察人士還預計重復數據刪除的應用范圍會從傳統上用于備份擴大到其他應用環境以及更多的計算和存儲設備。戴爾公司稱,其計劃把收購Ocarina后獲得的重復數據刪除技術集成到EqualLogic和Compellant產品系列中,“首先,我們會把它與壓縮技術一起用于快照之類的數據,然后用于更常訪問的數據和文件。”戴爾存儲部門產品營銷執行董事Travis Vigil說。
惠普存儲部門的產品營銷主管Sean Kinney預測,統一的重復數據刪除平臺會大行其道,企業可以將這種平臺用于所有的應用和存儲。這不僅有望減少企業購買的存儲系統數量,還有望降低許可、培訓和管理方面的成本。
性能遇上速度
一些用戶升級存儲系統并不是完全由于他們在管理大量數據方面需要幫助,他們同時還需要迅速訪問數據。
凱斯西儲大學正在將100TB的研究文件數據從EMC Celerra NS480轉移到Panasas ActiveStor 8以便迅速分析,另將65TB的行政管理結構化數據轉移到Nexsan NST 5310。該學校信息技術服務設計部高級技術主管Brian Christian表示,除了提升性能外,用戶希望創建容量多達600TB的單一名稱空間,這遠高于EMC和NetApp兩款產品的64TB這一極限。
“我們的第一個小型高性能集群使用了充當網絡文件服務器的傳統NAS設備,該設備已不堪重負。我們與同事交流后發現,如果想獲得所需的發展,就需要一個并行NAS。于是我們購買了Panasas產品。”Christian說。
為了提升性能,許多客戶在服務器里面使用閃存,并且在存儲陣列里面使用固態硬盤,以便先將對速度敏感的數據緩存起來,然后將數據寫入到速度較慢,但價格較低、容量較高的普通硬驅上。
此外,NAS廠商NetApp也憑借EF540進入了閃存陣列市場。據了解,EF540具有穩定低延遲的性能、高可用性、整合數據保護機制以及提高企業存儲效率的功能。
軟件搭配普通磁盤
一些公司正在遠離專有的軟硬件,改用由軟件管理的普通磁盤,在線營銷SaaS提供商Constant Contact就是其中之一。
Constant Contact首席技術官Stefan Piesche說:“三年半前我加入公司時,主要的系統擴展方式是購買更多的存儲系統、更快的存儲系統以及更大更快的數據庫服務器。”為了降低成本,滿足公司每年15%~25%的存儲增長需求,他將原先在3Par SAN上運行的IBM DB2數據庫改用在戴爾服務器、普通磁盤和Fusion-io閃存卡上運行的MySQL和Cassandra NoSQL開源數據庫。
Piesche指出,這個新平臺不僅速度比舊存儲系統“快了一個數量級”,還提供了更高的性能、可用性以及災難恢復能力,同時也不需要繁重的管理。
而一些較新的廠商則將物理硬件形式的軟件與磁盤和處理器封裝起來。Gridstore的存儲設備不僅可以對數據進行虛擬化處理,還能對存儲控制器進行虛擬化處理,從而消除單一故障點,同時該設備還支持從許多服務器實現更快的并行數據訪問。
另一種提高可擴展性的基于軟件的方法便是將數據“片段”分布到多個物理數據庫上。Cleversafe公司的dsNet技術也作為硬件設備來銷售,它最適合處理由大小在50KB~100KB之間的對象組成的1PB以上的存儲容量。該公司總裁兼首席執行官Chris Gladwin表示,這很適合通過互聯網共享照片之類的應用。
下一個階段
隨著硬驅變得更大更快,閃存變得更大更可靠,開源存儲架構日趨成熟,一些業界觀察人士發覺企業應對數據洪流的方式出現了根本性變化。
Shetti預測,鑒于新的非易失性內存技術得到采用,隨著新技術在成本上較之更高端的光纖通道和SAS磁盤更具競爭力,企業越來越不需要對固態硬盤與旋轉磁盤之間的數據進行分層處理,容量更高、成本更低的SATA磁盤仍會有一席之地。但他同時也表示,封裝的復雜性和不同的軟件接口,將使得用戶不能在同一系統中混合使用非易失性內存和SATA磁盤。
日立數據系統公司首席技術官休伯特·吉田(Hu Yoshida)指出,在3~5年內,就價格而言,閃驅會與高性能磁盤在同一水平線上。不過,如果廠商們添加更多的緩存,連普通硬驅也會提升速度。希捷預計,再過兩三年,其產品線中的主角將是這類“混合”驅動器。
此外,云存儲服務會提供速度慢但成本極低的歸檔服務,減輕企業內部的存儲負擔。比如說,亞馬遜Glacier服務每月每GB的成本僅為1美分。咨詢公司StorageIO創始人Greg Schulz說:“雖然恢復云數據需要3~5個小時,但不會超過從異地存儲磁帶恢復數據的時間,Glacier在成本上與磁帶相比將頗具競爭力。”
與此同時,具有成本效益、低成本硬件和低成本開源軟件等優點的云服務,仍將被許多IT部門所關注。比如說,Constant Contact正考慮“私有存儲云”,即在亞馬遜簡單存儲服務(S3)等提供商的系統上使用開源軟件,這樣做的好處就是成本低,它們可提供“幾乎沒有限制的橫向擴展功能”。Piesche表示:“借助Cassandra,我希望將存儲集群分散在分布式數據中心中,以實現災難恢復,而這樣做沒有任何許可成本,沒有任何復雜的設置,也沒有任何人工干預。”