摘要:為解決現有存儲系統在高延遲低帶寬的廣域網絡環境下出現的數據訪問性能問題,設計實現了一個具有較高I/O性能的可擴展多節點文件緩存系統——WANcache。WANcache通過模擬數據源的文件系統命名空間實現緩存數據,異步化數據和元數據的訪問,可以為上層應用提供獨立持久流暢穩定的數據服務。實驗數據表明,緩存命中時,WANcache可以提供和局域網環境下集群文件系統相同的讀寫帶寬;緩存未命中時候,WANcache可以多節點并發通過廣域網絡讀取數據,具有較好的可擴展性。總體來看,WANcache為解決廣域數據訪問的性能問題提供了一種有效的實現。
關鍵詞:存儲系統;廣域網絡;緩存系統;異步更新
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)20-4657-03
A New File Cache System To Improve Storage System Perforemence Over Wan
ZHANG Chun-hua
(The Jiangsu Province Guanyun County Party Committee Party School of Jiangsu, Lianyungang 222200,China)
Abstract:This specification is set for the theses to be published in Computer Applications and Software, including fonts, margins, page size and print area. Aiming at the performance problem of traditional storage system with WAN, a high I/O performance and scalable file caching cluster system is developed——WANcache.WANcache is able to cache the data by mimicking the namespace of file system at the remote site and asynchronize the data as well as the meta data access. As a result of that, WANcache can provide durable fluent stable service for the upper application as a standalone file system. The experiment data proved that the I/O performance of WANcache matched the cluster file system in LAN when cache hitting and once cache missing, WANcache got the data parallel by multiple nodes through WAN showing extreme scalable
Key words: storage system; WAN; cache system; asynchronous update
目前,把數據存儲到地理分散的云存儲系統和使用類似mapreduce框架建立高并發的數據敏感性應用相互融合,已經凸顯了對于能夠跨越地理分布節點間實現數據存儲、移動、訪問的并且高度可擴展的基礎設施的需求。雖然現有的一些支持海量存儲的集群文件系統例如GPFS[2], Lustre[3], PanFS[4] 等,還有一些基于互聯網應用的文件系統,例如GFS[5],HDFS[6]等,都能夠在容量和訪問帶寬方面實現擴展,對大量客戶端提供PB級的數據支持。然而,這些系統都不能屏蔽廣域網絡(WAN)環境下的高延遲和網絡抖動的問題,顯露出種種問題。傳統上,NFS和CIFS分別是UNIX和windows上用于網絡傳輸文件的首選,由于其最初是為局域網環境設計,節點間交互過于頻繁,因此不適用于延遲較高帶寬較小的廣域環境。……