特約通訊員 陳芯怡

重復數據刪除技術是近年來存儲行業最炙手可熱的技術之一。它是一種非常高級的數據縮減方式,通過減少存儲的數據量,改變數據保護方式,極大地降低了存儲空間,提升了磁盤備份方式的經濟性。重復數據刪除被業界公認為備份技術的下一代發展步驟,是今日數據中心的“必備”技術。
隨著技術應用的推廣,重復數據刪除技術也加入到網絡行業的行列,成為廣域網優化性能的一個重要工具。通過消除重復IP的流量傳輸,重復數據刪除技術明顯地提高了廣域網的利用率和加速了地理分散點之間的數據傳輸,使得在廣域網通信時能夠節省寬帶成本和幫助克服很多障礙。
廣域網重復數據刪除技術是服務于所有的IP流量傳輸,因此,它在各種各樣的IT創新中,如服務器集中化、虛擬化和應用交付中發揮了關鍵的作用。此外,廣域網重復數據刪除技術實際上是對存儲重復數據刪除技術的一個很好的補充,它能為整個企業帶來顯著的成本節約和更好的恢復點和時間目標(RPO/RTOs),有效提高廣域網的性能和數據復制、備份、恢復的可靠性。
廣域網重復數據刪除技術應用于各企業所在地配置的加速設備中(即廣域網連接的遠程站點和復制目標站點)。這些加速設備可以在合適的企業位置上實時監測IP流量傳輸,通過監視在廣域網上傳送的全部數據,可以檢測到重復的信息,并且讓這些信息在本地傳送,而不是在整個網絡上傳送。隨著日常使用數據的增加,這些數據量變得非常龐大,其中包括了與每個位置相關的各企業的工作數據集,這給數據的存儲與傳送都帶來了巨大的壓力。重復數據刪除技術可確保各個信息數據在每個位置都只被存儲一次,降低了設備的負荷,使得只要采用合適大小的廣域網加速設備就能容納幾個星期或幾個月的有價值的數據。
當收到外來數據包時,重復數據刪除技術會在廣域網加速設備配置上檢測是否在目標位置存在數據的本地副本。如果有一個副本存在,那么重復的信息就不會通過廣域網傳送而會通過本地發送來提供數據。如果該數據被修改了,只會在廣域網中傳輸數據的修改部分,從而最大限度地提高寬帶利用率和應用程序的性能。
重復數據刪除技術克服了廣域網中進行數據備份、復制、災后修復等連續性業務時所面臨的一系列難題。更具體地,該技術具有以下的優點:
●加快了數據傳輸的速率:上面提到,重復的信息只在本地傳送,而不會通過廣域網重新發送,那么廣域網流量傳輸就具備了類似局域網的速度。這是一種更先進的解決方案,可在TCP和UDP通信上縮減數據量,對于大部分的通信類型來說,這種解決方案能夠顯著提升性能。
●廣域網效率最大化:重復數據消除技術通過清除重復信息的轉移從而減少廣域網流量達99%。當進行數據備份和傳輸時,重復數據消除技術只備份經過更改的數據,這與傳統的每周或每天備份所有數據的模式形成了鮮明對比,也就意味著重復數據刪除可以大量地削減需要傳輸的數據量。
●擴大數據中心之間的地理距離:重復數據刪除技術可以減少延遲的影響,讓企業可以擴大數據中心和災后修復地之間的距離,提高運作的靈活性。
廣域網重復數據刪除技術與存儲重復數據刪除是兼容的,后者著重于提高存儲量,前者則著重于在整個廣域網中提供可能的最佳性能。當重復數據刪除技術在廣域網中應用時,企業通常可以獲得10-20倍以上的性能提高,遠遠超過了在存儲設備中單獨使用重復數據刪除技術所獲得的效果。這可以歸結于以下幾個因素。
其一,當搜索重復數據塊的時候,廣域網加速設備通常能比存儲設備提供更高的精確度。這是因為廣域網加速設備是對數據的單個字節進行檢驗而不是對塊進行檢驗,這能夠讓更多重復的數據塊被發現,即使在同步復制數據流中,也能實現更佳的數據檢測。此外,當重復數據刪除技術在網絡層中執行時,它服務于所有IP流量傳輸。因此,數據通過電子郵件、文件或網頁作為備份和復制的一部分在廣域網中被傳送時,它將會立即登記作為一個訪問點。換句話說,應用程序本身是不考慮數據重復的問題,所以重復數據刪除技術僅僅從存儲角度可能無法運行。然而,它是來自廣域網上的復制數據,就這點而論,廣域網加速設備將會視它為多數據運作。
其二,廣域網重復數據刪除技術可以以雙向方式工作。換句話說,無論通信往哪個方向流動,兩個位置都了解到信息并且可以利用本地索引提供信息,這能極大地提高了企業恢復數據的速度。例如,如果信息是運用某些正常操作(也就是復制/備份或簡單地通過電子郵件或FTP)通過廣域網往一個方向傳送,則作為恢復進程的一部分再發送到對面方向時立即就可以被檢測到。而不用在該位置上通過廣域網重新傳送一個完整的數據集,這些信息可以更高的效率和更好的性能從本地數據存儲中傳輸。
其三,廣域網加速裝置也采用了其它優化技術。例如,有效負載和壓縮頭文件經常與重復數據刪除技術一起使用,進一步減少備份和復制的廣域網寬帶需求。即使非重復性信息通過廣域網傳送,也可以配置壓縮功能以獲得顯著的性能提高。廣域網加速設備也可以減少雙方數據包的丟失和抖動等情況所帶來的影響,這種情況發生于當路由器連接超額、掉線或者數據包的再請求時,同時還可以通過網絡加速功能去解決不同的通信類型的固定延遲,比如TCP加速。另外,廣域網加速裝置采用服務質量(QOS)技術也可以用于區分流量傳輸的優先次序和為關鍵業務分配必要的寬帶,例如數據復制。
當傳送和存儲數據時,節省容量和提高性能的最有效方法是消除多余的信息。重復數據刪除技術在廣域網加速設備中配合其它廣域網優化技術一起使用時,可以進一步達到以下的優化效果:
●滿足并超越恢復時間目標(RTO)
●提高恢復點目標(RPO)
●避免昂貴的廣域網寬帶升級
●避免在分配窗口里備份和復制任務沒有完成時出現的數據庫同步化問題
●管理廣域網的容量以便更好地處理高峰負荷、緊急應變、業務增長等問題
重復數據刪除技術是一項被證實了的能夠提高性能、可靠性、數據備份和恢復效率的技術。它對網絡和存儲行業都產生了重大的影響,通過在存儲備份和廣域網傳送領域中應用該技術,可以更好地改善數據中心中數據保護的過程。

參考資料:
www.silver-peak.com