中國高性能計(jì)算從原地起步到成為世界第一用了幾十年的時(shí)間,但是從世界第一滑落到世界第二,只用了僅僅幾個(gè)月的時(shí)間。不過,這個(gè)“過山車”更是激發(fā)出了中國整個(gè)HPC產(chǎn)業(yè)的激情和動(dòng)力。
每到金秋,總能迎來收獲時(shí)刻。這也許是每年中國高性能計(jì)算(HPC)Top100為何要在10月頒布的一個(gè)原因吧。
2011年10月27日,新一期中國高性能計(jì)算Top100排行榜在2011年高性能計(jì)算學(xué)術(shù)年會(huì)上頒布。國家超級(jí)計(jì)算天津中心的天河一號(hào)A仍舊蟬聯(lián)冠軍,剛剛落戶國家超級(jí)計(jì)算濟(jì)南中心的神威藍(lán)光名列第二,國家超級(jí)計(jì)算長沙中心的天河一號(hào)A-HN排在季軍位置。
中國HPC進(jìn)入持續(xù)發(fā)展期
中國計(jì)算機(jī)學(xué)會(huì)高性能計(jì)算專委會(huì)張?jiān)迫貢L在接受《計(jì)算機(jī)世界》報(bào)記者采訪時(shí)表示,中國HPC Top100榜單上系統(tǒng)總體Linpack性能達(dá)到了11.85Pflops。上榜系統(tǒng)中有98%采用的是機(jī)群架構(gòu),前10名中有4套系統(tǒng)采用CPU+GPU的異構(gòu)機(jī)群。
在所有系統(tǒng)中,51%由國產(chǎn)廠商提供,曙光公司繼續(xù)保持份額第一的位置。在上榜系統(tǒng)的行業(yè)分布上,仍舊主要集中在互聯(lián)網(wǎng)服務(wù)、政府部門、教育、超算中心、電信、工程、科學(xué)計(jì)算、游戲、大氣氣象、能源、云計(jì)算、電力、半導(dǎo)體、生物信息、視頻計(jì)算、地震等18個(gè)領(lǐng)域。傳統(tǒng)應(yīng)用大戶能源行業(yè)的份額大幅減少,只有4套系統(tǒng)上榜。而來自互聯(lián)網(wǎng)服務(wù)領(lǐng)域的用戶數(shù)量達(dá)到了第一,一共有21套系統(tǒng),此外,來自云計(jì)算、半導(dǎo)體等新興應(yīng)用領(lǐng)域系統(tǒng),首次出現(xiàn)在這份榜單中。
自從去年天河一號(hào)拿下全球超級(jí)計(jì)算機(jī)TOP排行榜的冠軍,中國整個(gè)HPC領(lǐng)域都為之振奮。張?jiān)迫嬖V記者,和2010年的榜單相比,今年的Top100排行中,有67%是新上榜的。而且在應(yīng)用方面,用戶的積極性也在不斷高漲。來自西部某計(jì)算中心的一位負(fù)責(zé)人透露,受到經(jīng)濟(jì)實(shí)力限制,近年來他們?cè)诟咝阅苡?jì)算方面投入并不大,但是每當(dāng)計(jì)算能力提升后,馬上就會(huì)滿載,用戶的積極性非常高。“除了傳統(tǒng)的科學(xué)計(jì)算對(duì)高性能計(jì)算有需求,近年來新能源、生物制藥對(duì)于高性能計(jì)算的需求也很旺盛。比如,我們地區(qū)有大量的風(fēng)力發(fā)電,但是發(fā)出來的電卻是‘垃圾電’,用戶不愿意接受。如何把這些電利用起來,在相應(yīng)的模擬仿真計(jì)算上有很大的需求。”
中國科學(xué)院徐冠華院士在此次高性能計(jì)算學(xué)術(shù)年會(huì)發(fā)言時(shí)表示,未來中國高性能計(jì)算的發(fā)展還有很大的空間。“以當(dāng)前備受矚目的地球變化研究為例,地球系統(tǒng)模式是全球變化研究的重要內(nèi)容,而高性能計(jì)算是地球系統(tǒng)模式不可或缺的支持技術(shù)。以提高分辨率為例,100公里的全球模擬需要10TFlops的計(jì)算能力,而5公里的全球模擬,則需要達(dá)到100PFlops的水平。”
百億億次不是水中撈月
自從“走鵑”這只大鳥在突破“PFlops障礙”之后,人們就已經(jīng)就把目光投向了更遠(yuǎn)的百億億次。隨著突破千萬億次的超級(jí)計(jì)算機(jī)不斷出現(xiàn),以及富士通“K”這樣的“怪獸”橫空出世,我們似乎已經(jīng)能夠看到百億億次的影子了。
不過要想見到百億億次高性能計(jì)算機(jī)的真身,以當(dāng)前的技術(shù)似乎還是“不可能完成的任務(wù)”。不過越是這樣,越能激發(fā)人們的欲望和激情。正在建設(shè)中的TEXAS advanced computing center,將會(huì)采用基于英特爾Sandy Bridge處理器的服務(wù)器加集成眾核(MIC)的架構(gòu),同時(shí)集成Mellanox FDR Infiniband端到端解決方案,中心預(yù)計(jì)2013年建成,屆時(shí)計(jì)算能力能夠達(dá)到15petaflops。中科院計(jì)算技術(shù)研究所霍志剛研究員根據(jù)自己的研究得出結(jié)論,未來3年內(nèi)將會(huì)有計(jì)算能力達(dá)到100PFlops這樣級(jí)別的高性能計(jì)算機(jī)出現(xiàn)。
國際高性能計(jì)算專業(yè)委員會(huì)主席Gilad Shainer對(duì)于百億億次更是充滿期待,在他看來,2020年前后實(shí)現(xiàn)百億億次是有可能的,只是對(duì)于這樣宏大的目標(biāo),還是要一步步來實(shí)現(xiàn)。“隨著更高性能的CPU不斷出現(xiàn),加上諸如GPGPU、MIC、Infiniband這樣的技術(shù)促進(jìn),百億億次肯定是會(huì)實(shí)現(xiàn)的,只是要在一個(gè)成本、能耗等方面都可以接受的代價(jià)下實(shí)現(xiàn)。另外,除了要關(guān)注實(shí)現(xiàn)百億億次這樣一個(gè)目標(biāo),更應(yīng)該關(guān)注的是如何實(shí)現(xiàn)這個(gè)目標(biāo)的過程,如何在合理的投入、能耗下搭建這樣一個(gè)超級(jí)系統(tǒng)。”
對(duì)于實(shí)現(xiàn)百億億次,美國橡樹嶺國家實(shí)驗(yàn)室Richard Graham博士認(rèn)為,未來超級(jí)計(jì)算機(jī)的體系架構(gòu)研發(fā)要注重Co-Design(聯(lián)合設(shè)計(jì))。“目前高性能計(jì)算機(jī)研發(fā)過程中存在著這樣的一種現(xiàn)象,做硬件的人只了解硬件,做算法只了解算法。在過去,這樣的情況還不算太糟糕,但是在通往百億億次規(guī)模的道路上,兩者分開的情況是很不利的。只有硬件和算法充分結(jié)合在一起,才能挖掘硬件的性能,有效地提高HPC應(yīng)用水平。”
至于未來,中、美、歐誰會(huì)第一個(gè)實(shí)現(xiàn)百億億次,Gilad Shainer笑稱這樣的預(yù)測(cè)就如同是買彩票。不過在他看來,HPC在中國的快速發(fā)展,能夠在科研創(chuàng)新、產(chǎn)品研發(fā)等方面給中國能帶來更大的競(jìng)爭力。“在全世界范圍內(nèi),各個(gè)國家都在高性能計(jì)算方面投入不少。在過去5年,中國發(fā)展非常迅速,中國在HPC技術(shù)研發(fā)方面的進(jìn)展,將會(huì)影響整個(gè)產(chǎn)業(yè)的進(jìn)展,同時(shí)產(chǎn)業(yè)的進(jìn)展也會(huì)促進(jìn)相關(guān)技術(shù)研究更近一步,只是要處理好兩者之間的關(guān)系。基礎(chǔ)架構(gòu)的建設(shè)和真實(shí)應(yīng)用之間是一種相輔相成、互相促進(jìn)的平衡關(guān)系。”
同時(shí),Gilad Shainer并不贊成花大量的金錢去研發(fā)專有產(chǎn)品,他認(rèn)為這對(duì)于HPC應(yīng)用發(fā)展是不利的。\"美國的一些大學(xué)曾經(jīng)特別喜歡應(yīng)用專有的系統(tǒng)來建設(shè)自己的高性能計(jì)算機(jī)集群,隨著時(shí)間的推移,過高的成本、低下的應(yīng)用性能迫使他們最后都放棄了這些系統(tǒng),既浪費(fèi)時(shí)間也浪費(fèi)金錢。我認(rèn)為,標(biāo)準(zhǔn)化的技術(shù)在實(shí)現(xiàn)百億億次的過程中將會(huì)發(fā)揮重要的作用,不僅在成本上有其優(yōu)勢(shì),應(yīng)用的領(lǐng)域也會(huì)更廣,驅(qū)動(dòng)力更強(qiáng)勁。如果我們把更多精力放在推動(dòng)標(biāo)準(zhǔn)化技術(shù)的前進(jìn),必將會(huì)使百億億次更早到來。”
背景資料
神威藍(lán)光
神威藍(lán)光千萬億次高性能計(jì)算機(jī)系統(tǒng)是中國第一臺(tái)全部采用自主研發(fā)的高性能多核通用處理器構(gòu)建的千萬億次系統(tǒng)。系統(tǒng)以高帶寬全互聯(lián)256超節(jié)點(diǎn)為基礎(chǔ),采用分層高速計(jì)算網(wǎng)絡(luò)連接和自主設(shè)計(jì)高效能軟件。神威藍(lán)光采用申威1600CPU具有16個(gè)核心,集成DDR3存儲(chǔ)控制器和標(biāo)準(zhǔn)I/O接口,雙精度浮點(diǎn)峰值運(yùn)算速度為140.8GFlops。
院士觀點(diǎn):
陳左寧:中國高性能計(jì)算需要建立起新的生態(tài)系統(tǒng),盡可能聯(lián)合國內(nèi)相關(guān)單位,建立起中國標(biāo)準(zhǔn)指令集,其中包括核心指令集和擴(kuò)展指令集。基于這些指令集,建立相關(guān)高性能軟硬件標(biāo)準(zhǔn)體系,引導(dǎo)企業(yè)投入,形成完整生態(tài)鏈,促進(jìn)產(chǎn)業(yè)發(fā)展。同時(shí)還需要聯(lián)合國內(nèi)相關(guān)單位,建立HPC網(wǎng)絡(luò)互聯(lián)標(biāo)準(zhǔn),基于這些標(biāo)準(zhǔn)框架,突破普適性高端計(jì)算機(jī)關(guān)鍵技術(shù),促進(jìn)HPC階梯形發(fā)展。
徐冠華:未來高性能計(jì)算要想進(jìn)一步發(fā)展,必須強(qiáng)化交叉人才的培養(yǎng)。高性能計(jì)算需要學(xué)科交叉,需要有更多的高性能計(jì)算專業(yè)人才了解相關(guān)應(yīng)用,并和相關(guān)研究人員經(jīng)常合作,這樣將會(huì)有更大的機(jī)會(huì)取得重大的突破。
中國HPC Top100前十
名次型號(hào)安裝地點(diǎn)應(yīng)用領(lǐng)域核心數(shù)Linpack(Gflops)
1天河一號(hào)A國家超級(jí)計(jì)算天津中心超算中心2027522566000
2神威藍(lán)光國家超級(jí)計(jì)算濟(jì)南中心科學(xué)計(jì)算/工業(yè)137200795900
3天河一號(hào)A-NH國家超級(jí)計(jì)算長沙中心科學(xué)計(jì)算/教育53248771700
4曙光星云國家超級(jí)計(jì)算深圳中心超算中心52416749200
5IBMxServer x3650M3網(wǎng)絡(luò)公司互聯(lián)網(wǎng)服務(wù)113040636985
6Mole-8.5 Cluster中國科學(xué)院過程工程研究院科學(xué)計(jì)算/粒子模擬33120370300
7曙光星云深圳云計(jì)算中心云計(jì)算36480342300
8IBMxServerX3650M3電信公司工業(yè)36336204754.4
9IBMxServerX3650M2網(wǎng)絡(luò)公司互聯(lián)網(wǎng)服務(wù)34688196228
10曙光5000A上海超級(jí)計(jì)算中心超算中心30720180600