肖利民 阮利 沈潤楠

“超級計算”一詞,首次出現(xiàn)在1929 年美國《紐約世界報》的“IBM 為哥倫比亞大學(xué)建造大型報表機”新聞報道中。“超級計算機”是指具有極快運算速度、極大存儲容量、極高通信帶寬的有“超級計算”能力的計算機,它可以解決石油勘探、工業(yè)設(shè)計、氣象預(yù)報、地震預(yù)測、新藥研發(fā)、武器模擬、基礎(chǔ)科研等領(lǐng)域的挑戰(zhàn)性問題,對經(jīng)濟發(fā)展、科技創(chuàng)新、社會進步、國防建設(shè)具有重要意義。超級計算機是國家科技發(fā)展水平和綜合國力的重要體現(xiàn),因此被列為“國之重器”。全球超算TOP500 和中國HPC TOP100 分別維護著世界和中國速度最快的超級計算機性能排名榜單,是超級計算機發(fā)展的晴雨表。
無所不在的“國之重器”
作為“國之重器”,超級計算機長期以來用于高科技領(lǐng)域和尖端技術(shù)研究,我們?nèi)粘K坪醪怀B牭健⒉怀R姷剿5珜嶋H上,超級計算機一直與我們的工作、生活息息相關(guān)。
在科學(xué)研究中,超級計算機常被用于模擬和預(yù)測復(fù)雜的物理化學(xué)過程,幫助科學(xué)家更好地探索自然規(guī)律和人類奧秘。比如,中國科學(xué)技術(shù)大學(xué)在新一代“神威”超級計算機上的應(yīng)用成果獲得首屆“ACM 戈登·貝爾氣候建模獎”提名,通過超級計算機強大算力支撐的火山噴發(fā)和大氣環(huán)流跨圈層模擬系統(tǒng),成功捕捉到了火山爆發(fā)從沖擊波、地震、海嘯、蘑菇云到隨后6-7 天火山灰和水汽的運動擴散特征, 初步獲得了火山、地質(zhì)和大氣全耦合的相互影響效應(yīng)。
在工程建設(shè)中,超級計算機被用于開展工程結(jié)構(gòu)分析、模型仿真等,幫助人類更好地理解和改造世界。比如,“神威·太湖之光”助力“天宮一號”空間站研制過程,開展飛行器在復(fù)雜空間環(huán)境條件下的結(jié)構(gòu)強度仿真分析,模擬空間站的空間飛行狀態(tài)和大氣返回狀態(tài),特別是回收時重入大氣的隕落飛行繞流情況,并配合大風(fēng)洞實驗,為“天宮一號”的設(shè)計制造提供了重要的數(shù)據(jù)支撐。
在日常生活中, 氣象預(yù)報同樣離不開超級計算機的支撐。我國自主研發(fā)的數(shù)值天氣預(yù)報系統(tǒng)GRAPES 在超級計算機上晝夜不停地運行,通過對地表大氣進行網(wǎng)格化分割,在中國大地上劃分了近四百萬個網(wǎng)格點,分析地基和空基觀測的氣溫、氣壓、濕度等大氣數(shù)據(jù),構(gòu)建大氣運動方程組,利用超級計算機的強大算力,準(zhǔn)確預(yù)報全國各地的天氣情況。
當(dāng)下,世界各國在超級計算機領(lǐng)域的競爭日益激烈。盡管我國已躋身超算強國之列,但發(fā)展之路并非坦途,從無到有、從受制于人到實現(xiàn)自主可控,可謂傳奇。
從零基礎(chǔ)到世界領(lǐng)先
超級計算機起源于20 世紀(jì)50年代,當(dāng)時計算機的體積非常龐大,但性能卻十分有限。為解決更復(fù)雜的問題,美國國防部啟動了世界上第一個超級計算機項目,超級計算機的概念也隨20 世紀(jì)70 年代初的第一代向量計算機而逐漸成熟。1976 年,美國Cray 公司推出首臺運算速度達每秒2.5 億次的超級計算機,在世界掀起了研制超級計算機的熱潮。
中國超級計算機自主研制始于1978 年。時年3 月,在全國科學(xué)大會上,鄧小平提出了“中國要搞四個現(xiàn)代化,不能沒有巨型機”,開啟了我國超級計算機的自主研制進程。40 多年來,在國家高技術(shù)研究發(fā)展計劃的支持和引導(dǎo)下,國防科技大學(xué)的“銀河”“天河”系列、中國科學(xué)院計算技術(shù)研究所和曙光公司的“曙光”系列、聯(lián)想集團的“深騰”系列及無錫江南計算技術(shù)研究所的“神威”系列陸續(xù)研制成功。中國超級計算機事業(yè)逐步走向可與美日比肩的發(fā)展水平。
在挑戰(zhàn)中尋求發(fā)展
超級計算機是計算機界的“超人”,其“超能力”主要依賴于有超強計算能力的計算“心臟”(由大量高速計算結(jié)點構(gòu)成)、有超大存儲能力的存儲“大腦”(由大量高性能存儲結(jié)點構(gòu)成)、有超快數(shù)據(jù)傳輸能力的網(wǎng)絡(luò)“血管”(由負責(zé)連通大量計算結(jié)點、存儲結(jié)點等的高速互連網(wǎng)絡(luò)構(gòu)成)以及強大的輸入輸出設(shè)備“眼口”(由大量輸入輸出結(jié)點構(gòu)成)。同時,也依賴于各種超算軟件和中間件。超級計算機的計算能力極其強大,舉例來說,我們常用的個人電腦,運算速度通常為每秒數(shù)萬億至數(shù)十萬億次,而“神威·太湖之光”的峰值性能可達每秒12.5 億億次,持續(xù)性能為每秒9.3 億億次。一臺“神威·太湖之光”的計算能力相當(dāng)于上萬臺個人電腦之和。
當(dāng)然,僅靠堆砌足夠數(shù)量的個人電腦無法達到超級計算機的實際運算速度,因為缺少系統(tǒng)總體均衡設(shè)計及高速互連網(wǎng)和系統(tǒng)軟件等關(guān)鍵技術(shù)的加持。可見,打造最強的超級“心臟”“大腦”“血管”“眼口”,是超級計算機研制的關(guān)鍵。它的研制過程涉及計算芯片研制、各類結(jié)點機研發(fā)、多種互連網(wǎng)研發(fā)、系統(tǒng)軟件研發(fā)及系統(tǒng)集成聯(lián)調(diào)測試等諸多環(huán)節(jié),是復(fù)雜的系統(tǒng)工程。在超級計算機的運行與應(yīng)用過程中,系統(tǒng)功耗巨大,應(yīng)用編程復(fù)雜等問題也很突出。
除了要克服各種科學(xué)和工程問題外,我國還要應(yīng)對他國在超級計算機方面對我們的限制和打壓。盡管這給我國超級計算機的發(fā)展帶來了阻礙,但也凝聚了共識——必須要突破核心技術(shù),實現(xiàn)超算產(chǎn)業(yè)鏈的自主可控。
( 作者單位: 北京航空航天大學(xué)計算機學(xué)院)