距離2010年秋季高性能計(jì)算TOP500榜單發(fā)布后半年,新一期的HPC TOP500榜單新鮮出爐。6個(gè)月代表了27個(gè)星期、180天而已,但就在這段時(shí)間里,這張榜單發(fā)生了翻天覆地的變化。
“K”的勝利
在2010年秋季的榜單上,“天河一號(hào)”以2.56petaflop/s的性能一舉奪冠。但遺憾的是它也成為了到目前為止,只在榜首位置停留一期而沒能蟬聯(lián)的“冠軍”。來自日本的,橫空出世的富士通“K ”超級(jí)計(jì)算機(jī)以8千萬億次(8.162petaflop/s)——近3倍于“天河一號(hào)”的性能擠掉了后者的榜首位置。
據(jù)悉,“K”是日語中10的16次方的縮寫。排名第二到第十的超級(jí)計(jì)算機(jī)依次分別是“天河一號(hào)”、美國橡樹嶺國家實(shí)驗(yàn)室的Jaguar超級(jí)計(jì)算機(jī)(1.75petaflop/s)、中國深圳星云超級(jí)計(jì)算機(jī)(1.27 petaflop/s)、東京技術(shù)研究所的Tsubame 2.0超級(jí)計(jì)算機(jī)(1.19 petaflop/s)、新墨西哥州洛斯阿拉莫斯國家實(shí)驗(yàn)室的Cielo超級(jí)計(jì)算機(jī)(1.11 petaflop/s)、美國航天局艾姆斯研究中心的Pleiades超級(jí)計(jì)算機(jī)(1.09 petaflop/s)、美國能源部國家能源研究科學(xué)計(jì)算中心的Hopper超算 (1.054 petaflop/s)、法國的Tera 100超級(jí)計(jì)算機(jī)(1.05 petaflop/s)、美國洛斯阿拉莫斯國家實(shí)驗(yàn)室的走鵑Roadrunner超級(jí)計(jì)算機(jī)(1.04petaflop/s)。
資料顯示,“K”這臺(tái)超級(jí)計(jì)算機(jī)內(nèi)含68544個(gè) SPARC 64 VIIIfx處理器,每個(gè)芯片擁有8個(gè)核,總共擁有548352個(gè)核。這個(gè)數(shù)字是榜單中余下系統(tǒng)所含核的數(shù)量的兩倍。雖然“K”的功耗達(dá)到了驚人的9.89兆瓦,但是由于性能出眾,它也是榜單中能效最高的系統(tǒng)。
本次榜單前10名的超級(jí)計(jì)算機(jī)中,有三臺(tái)是2011年新上榜,而且第一次排名前10系統(tǒng)的性能全部達(dá)到了千萬億次的級(jí)別。來自中國的上榜系統(tǒng)達(dá)到了62套,依然落后美國,后者以256套系統(tǒng)的數(shù)目占據(jù)了整個(gè)榜單的近半壁江山。
上榜系統(tǒng)中有77.4%采用了英特爾至強(qiáng)處理器,而且其中169套系統(tǒng)采用了Westmere處理器,采用AMD處理器和IBM處理器的數(shù)目分別是65和45。
這張榜變化速度到底有多快?一個(gè)數(shù)字也許能夠反映出它的速度。那就是本次第500位的系統(tǒng),在去年11月的榜單中還能排在262位。
據(jù)悉,基于最新款國產(chǎn)龍芯處理器的高性能計(jì)算機(jī)也在緊鑼密鼓的研制中,能否在下一期排行中有所斬獲,值得期待。
百億億次再進(jìn)一步
自從IBM走鵑Roadrunner超級(jí)計(jì)算機(jī)突破千萬億次的計(jì)算門檻后,整個(gè)HPC業(yè)界都把目光投向了下一個(gè)“不可能完成的任務(wù)”——百億億次。
根據(jù)英特爾的預(yù)測,到2015年,全球高性能計(jì)算機(jī)500強(qiáng)(TOP500)排行榜上排名第一的系統(tǒng)在性能上將有望達(dá)到每秒十億億次浮點(diǎn)計(jì)算,2018年時(shí),它將越過每秒百億億次浮點(diǎn)計(jì)算的標(biāo)桿,而到2011#12316;2020這個(gè)10年期的末期時(shí),地球上最快的計(jì)算機(jī)的性能則有望超過每秒4百億億次浮點(diǎn)計(jì)算。“K”的出現(xiàn),可以說是人類在通向百億億次的路上跨出了非常大的一步。
愿景總是美好的,要想達(dá)到百億億次的目標(biāo),所要走過的道路絕非一馬平川。英特爾中國有限公司服務(wù)器平臺(tái)產(chǎn)品經(jīng)理張振宇就向記者表示,雖然高性能計(jì)算機(jī)的性能在不斷提升,但是對(duì)于真正的用戶而言,還面臨著很多挑戰(zhàn)。“例如構(gòu)建了一臺(tái)高性能計(jì)算系統(tǒng),如何在有限的運(yùn)維成本、能耗和占地面積等條件下盡可能優(yōu)化性能,如何應(yīng)對(duì)不同的應(yīng)用特征所帶來的計(jì)算能力、內(nèi)存、帶寬和網(wǎng)絡(luò)對(duì)于整體性能的影響,這都是用戶在未來HPC發(fā)展道路上需要面對(duì)的情況。”
英特爾公司副總裁兼數(shù)據(jù)中心事業(yè)部總經(jīng)理施浩德(Kirk Skaugen)表示,要在未來實(shí)現(xiàn)百億億次級(jí)別的性能,不僅需要行業(yè)與政府的通力協(xié)作,還需要有開創(chuàng)性的技術(shù)和方式,而英特爾所倚重的就是集成眾核(MIC)架構(gòu)所開創(chuàng)的新方法。“英特爾正在進(jìn)一步擴(kuò)展它對(duì)高性能計(jì)算的關(guān)注,利用我們針對(duì)千萬億次以及未來百萬萬億次工作負(fù)載的集成眾核架構(gòu),引領(lǐng)行業(yè)開辟下一個(gè)領(lǐng)域。”施浩德說,英特爾擁有領(lǐng)先于整個(gè)行業(yè)的制造技術(shù)、全新的架構(gòu)創(chuàng)新成果以及讓用戶感到熟悉的軟件編程環(huán)境,它們都將推動(dòng)逐步實(shí)現(xiàn)激動(dòng)人心的百億億次高性能計(jì)算目標(biāo)。
在本次TOP500的榜單中有19套系統(tǒng)采用GPU加速的模式,不過就目前應(yīng)用情況來看,高效的軟件編程模式以及出色的系統(tǒng)可擴(kuò)展性將是跨越千萬億次計(jì)算極限,進(jìn)入百億億次計(jì)算時(shí)代的關(guān)鍵要素,而MIC恰恰在編程模式方面有著其自己獨(dú)特的優(yōu)勢。
據(jù)悉,MIC架構(gòu)具有更小的內(nèi)核和硬件線程,以及更寬的矢量單元。
背景資料
集成眾核架構(gòu)(MIC)是英特爾于2010年國際超級(jí)計(jì)算機(jī)大會(huì)上正式發(fā)布的一種眾核架構(gòu),MIC主要面向高性能計(jì)算領(lǐng)域,完全基于x86處理器架構(gòu),因而能夠很容易地進(jìn)行應(yīng)用程序的編程。從英特爾正式發(fā)布MIC以來,英特爾一直加緊其產(chǎn)品的研發(fā)工作。去年,英特爾還在日本展示了其采用MIC架構(gòu)的32核超級(jí)計(jì)算加速卡。為了解決并行編程的問題,MIC采用在至強(qiáng)處理期的開發(fā)平臺(tái)上進(jìn)行擴(kuò)展,從而簡化了應(yīng)用程序的遷移工作。
在2011年6月于德國漢堡舉行的國際超級(jí)計(jì)算大會(huì)(ISC)上,英特爾演示了MIC架構(gòu)的早期成果。據(jù)悉,這一開發(fā)平臺(tái)已經(jīng)在SGI公司和韓國科學(xué)技術(shù)信息研究院(KISTI)得到了應(yīng)用,其平臺(tái)和開發(fā)工具得到了初步驗(yàn)證。
6月21日,日本神戶的理化研究所發(fā)布了最新的超級(jí)計(jì)算機(jī)“K”照片。