徐志偉 陳明宇 詹劍鋒 熊勁 譚光明
摘 要:(1)高通量基準測試和評價:該年度我們推出了ICBbench的兩個測試集合BigDataBench和DCBench。DCbench覆蓋數據中心主要領域應用,包括分析,服務,虛擬化負載,主要是以整型操作和數據移動操作主導的計算應用。DCBench可用于評測數據中心服務器系統、體系結構研究。BigDataBench反映了大數據應用的3個基本方面,負載涵蓋了典型的Internet應用場景和實際應用的算法,軟件棧包括分布式計算框架、NOSQL數據庫和SQL數據庫,數據具有多樣性、真實性和可擴展性。(2)高通量數據通道系統。該年度的主要工作是圍繞消息式內存體系結構的原型系統實現,以及基于單一接口的一體化存儲體系結構的定義展開。我們基于FPGA設計了消息式內存原型系統I,包括消息式內存控制器、緩沖調度器和細粒度內存模組3個部分。消息式內存控制器實現了將內存訪問轉為消息包并通過高速串行通道發送請求。緩沖調度器完成了解包、緩沖管理、調度、智能操作等功能。細粒度內存模組實現了多路16位寬細粒度內存訪問。目前該原型已通過測試,并與高通量處理器的FPGA原型系統進行聯調。一體化存儲接口基于消息式內存的接口,統一內外存的數據訪問和數據移動和管理,可用將內存、PCM、Flash和磁盤統一到一個框架下。該年度開發了時鐘精準的異構內存模擬器HMSim,定義了一體化存儲的API接口。此外還研究了應用透明的異構內存數據放置策略、能耗感知、針對PCM的寫請求優化等問題。HMTT3訪存分析系統本年度開始對外提供trace分析數據。我們在HPCA2013上進行了發布,并公布了400 GB左右的trace供學術界應用。(3)高通量應用優化。重點研究以圖分析和稀疏矩陣為代表的訪存不規則應用的特征和并行實現。針對在大規模圖遍歷算法中的大規模細粒度鎖更新的效率問題,提出了虛擬化細粒度鎖,有效降低了物理鎖的數量,從而在保證低的沖突率的同時,減少了cache miss,提高了應用的性能。針對稀疏矩陣存在多種類型和特征,導致需要多種不同的優化算法的問題,我們提出并實現了稀疏矩陣向量乘法的輸入自適應的自動調優器SMAT,可以感知體系結構特征和應用特征,自動找到合適的算法和實現代碼。準確率達到92%。
關鍵詞:高通量 基準測試 消息式內存 一體化存儲
Abstract:(1)ICTbench for HTC We have release three benchmarks for high throughput computing, BigDataBench, DCbench and CloudBench. DCBench covers main data center applications such as analytic, service, virtualization workloads. BigDataBench reflects three characteristics of bigdata application, ie. Workload,software stack and data varity. CloudBench can be used to evaluate hybrid workloads on private clouds.(2)Data path architecture for HTC We have design a hardware prototype for message interfaced memory system. The elementary results show its advantage. We design a universal storage system based on MIMS, which use a single interface to access memory, NVM and disk. We have finished the design and begun developing prototype.(3)Application optimization for HTC We propose a vLock mechanism to avoid massive lock contention in graph transversal algorithm. We designed and implemented an auto-tuning framework for sparse matrix-vector multiplication applications. The framework support matching architecture feature and best data structure to applications automatically by use machine learning methods.
Key Words:High throughput;Benchmark;Message interface based memory;Universal storage
閱讀全文鏈接(需實名注冊):http://www.nstrs.cn/xiangxiBG.aspx?id=50752&flag=1