E級高性能計算機的曙光
人類對認識世界、自然規律、宇宙探索的好奇心以及對問題規模和精度的追求,決定了人們對高性能計算能力的需求“不會止步”。在“新科”全球最快高性能計算機“太湖之光”以峰值性能125.436PFlops(即0.125436EFlops)刷新了最快運算速度之后,人們又將目標瞄向了E級——每秒可進行百億億次數學運算的計算機(下文簡稱“E級機”),它是當下公認的“高性能計算界的下一頂皇冠”。
好比“兩彈一星”一樣,E級機不僅是計算領域的重大科技創新,更是一個國家綜合國力和科技創新能力的重要標志,已成為當前各國競相角逐的戰略制高點。美國、歐盟、日本等都提出了自己的E級機研發計劃,中國也啟動了E級原型機的研究計劃。研發E級系統和設備,我國必須掌握主動權。
此外,E級機也并非“花瓶”和“面子工程”,它在事關國計民生的重大問題上都有用武之地。計算性能每提高1個數量級,人類對它們的需求就提高3個數量級。遠看深處貴州黔東南的“開天巨眼”FAST工程,近觀困擾上下的大氣污染的監測與治理,背后莫不需要更先進高性能計算的助力。一言以蔽之,E級高性能計算機的研發利國利民。
更值得一提的是,E級計算設備除對各個產業領域提速換擋有貢獻、提高國家競爭力之外,還將“向下流動”促進產業發展,比如增強包括從智能手機到相機在內的消費電子產品計算系統的軟硬件性能等。
任何對極致的追求都如登山,越到高處越見難。更何況,E級機的建造難度并不僅僅在于速度的提升。簡單來說,擺在E級計算面前的挑戰有訪存墻、可靠性墻、能耗墻、擴展性墻,以及生態環境、多領域應用融合等阻礙,它們是突破E級計算的難點,需要采用全新的思路和方法去攻克。
在這些難點之中,有一點是最受關切和可量化的,那就是功耗。按照國際公認標準,E級機的功耗應低于20MW。按照這一功耗目標要求,未來E級機的能效比要達到50 GFlops/W。
這是一堵難以逾越的高墻,畢竟排在全球超級計算機Green500榜單第三位、創造了大規模高性能計算機Linpack測試最好成績的“太湖之光”每瓦性能只有6 GFlops,相差一個數量級。
E級機的生態環境和應用也備受關注。沒有良好的、便于移植擴展的生態環境和豐富的應用,E級機也只是一臺機器。解決這一問題,需要從其體系結構、關鍵技術的研發路線上進行提早規劃,以使未來的E級機能夠被充分應用起來并進行產業化復制。
繼美國將E級機列入其“國家戰略計算計劃”,歐盟、日本相繼制定E級計劃之后,我國也計劃將E級機列為“十三五”規劃中的重頭戲,并將實現的時間表劃定為“十三五”收官之年(2020年)左右。
隨后,在科技部的支持下,中科曙光、國防科技大學和江南計算技術研究所三支高性能計算的國家隊,分別牽頭承擔了國家“十三五”高性能計算專項課題中E級超算的原型系統研制項目。7月4日,中科曙光在“2016曙光技術創新大會”上宣布,正式啟動由其牽頭的“E級高性能計算機原型系統項目”的研制。
中國能否率先站上E級機的“世界之巔”?可以說不僅有機會,而且機會很大。近年來,科技部等國家科技部門越來越重視高性能計算人才、資源、技術和材料的儲備,中國高性能計算機在最新全球超級計算機TOP500榜單上的總數量首次超越美國成為第一便是例證。而早在2004年,曙光4000就曾首度將中國高性能計算機帶入全球TOP500前十名,曙光6000又令中國躋身世界前三甲,近年來中國軍團更在全球TOP500的榜單上牢牢占據第一的位置。中國高性能計算機已經徹底洗刷了“玻璃房子”之辱,成為世界高性能計算陣營中不可忽視的一股力量。
在“E級高性能計算原型系統項目”中,曙光將圍繞一系列挑戰與難點,提出創新的E級機體系結構,并從計算系統、網絡架構、存儲架構、系統軟件、冷卻系統、應用支撐等多方面提出E級系統的方案,為國產E級機的研制奠定堅實的技術基礎。
按照預期目標,在預研項目完成時,曙光將不僅在計算、網絡、存儲等關鍵技術上取得突破,更將針對上文提及的能耗、生態、應用等社會廣泛關注的重點問題,研制出能效比10GFlops/W以上的E級機原型系統;同時,采用自主可控的國產通用處理器和工業標準技術,將使原型系統具有良好的生態環境和廣泛的應用適用性;通過超融合計算和應用自適應技術,可以良好支撐高性能計算、深度學習、大數據、云計算等多領域的應用融合。
每秒執行百億億次計算,這是人類目前所建最快機器計算速度的數十、上百倍,E級高性能計算機將是一個全新的“物種”——它們不僅在于快,更在于它們可以以全新的方式處理大數據。
E級機未來將在一些我們今天不能解決的問題上大顯身手:它可以用來攻克癌癥;或者用于模擬人的心臟,以仿真各種藥物對心臟的影響;還可以用于天體物理大數據的處理、模擬宇宙的演化及無庫存核武器仿真等,在解決人類共同面臨的健康危機、能源危機、環境污染和氣候變化等重大問題上發揮巨大作用。
這些前景光明的應用也讓曙光等單位開展的E級高性能計算機原型系統的研發變得意義非比尋常。一方面它可以使高性能計算機得以更高效更廣泛的應用起來,真正在行業、企業中發揮其更大的經濟價值和產業價值;另一方面還可以提升和改善我國超算中心的商業化服務能力和盈利能力;而且,通過原型機及其采用的自主核心技術的產業化,可以提升國產高性能計算機的整體競爭力,促進中國高性能計算機更全面的發展、更好的走向世界。

E級高性能計算機原型系統概念圖