GPU盛開
高性能計(jì)算
GPU與CPU的結(jié)合成為未來平臺(tái)的核心——異構(gòu)系統(tǒng),它能提供一種創(chuàng)新的解決方案,更多的異構(gòu)的系統(tǒng)將面世。

在過去的幾年里,高性能計(jì)算進(jìn)入一個(gè)快速發(fā)展時(shí)期。一方面是集群技術(shù)的發(fā)展,使得高性能計(jì)算的成本降低,另外一方面,多核以及GPU的出現(xiàn),讓高性能計(jì)算迎來了新的機(jī)遇和挑戰(zhàn)。
當(dāng)前,HPC發(fā)展中最重要的技術(shù)應(yīng)當(dāng)是GPU的發(fā)展。目前,使用GPU的異構(gòu)計(jì)算在高性能計(jì)算中已是一種主流技術(shù)。比如最近的TOP500前五名有三臺(tái)機(jī)器都是GPU異構(gòu)集群。美國(guó)橡樹嶺國(guó)家實(shí)驗(yàn)室剛宣布了他們計(jì)劃在2012年用GPU來搭建一臺(tái)峰值20 Pflop/s的集群。在我國(guó),天津超算中心2010年使用了7168個(gè)GPU搭建了峰值4.7 Pflop/s,Linpack實(shí)測(cè)性能2.57 Pflop/s的天河1A系統(tǒng)。這套系統(tǒng)在2010年的Supercomputing大會(huì)上排在了TOP500的第一名。
對(duì)于GPU的支持者看來,GPU具有更強(qiáng)的浮點(diǎn)運(yùn)算能力、更大的帶寬等諸多優(yōu)勢(shì),連晶體管數(shù)量也是GPU略勝一籌。性能和復(fù)雜性不斷提升的GPU自然不甘繼續(xù)做CPU的配角,他們甚至毫不掩飾地提出:“未來GPU將越來越多地取代CPU的數(shù)據(jù)處理職能,未來GPU才是計(jì)算機(jī)的核心部件!”
從體系結(jié)構(gòu)的觀點(diǎn)來看,CPU本質(zhì)上是一種針對(duì)延遲(latency)優(yōu)化的體系結(jié)構(gòu)。它的首要設(shè)計(jì)目標(biāo)是優(yōu)化單線程的執(zhí)行性能。與此對(duì)應(yīng)的趨勢(shì)是針對(duì)吞吐量(throughput)優(yōu)化的眾核體系結(jié)構(gòu)。比如Sun的Niagara處理器,IBM的Cell處理器,以及nVIDIA的圖形處理器(GPU)。簡(jiǎn)單地說,吞吐量?jī)?yōu)化處理器的策略是降低單線程的性能但以在眾核上同時(shí)運(yùn)行大量線程的方式來提高總體處理能力(高吞吐量)。因此吞吐量?jī)?yōu)化處理器的總體性能往往比延遲優(yōu)化處理器高得多。
在并行計(jì)算成為必須之后,由于吞吐量?jī)?yōu)化處理器更高的性能,很多開發(fā)人員開始認(rèn)識(shí)到它們是一種對(duì)很多并行應(yīng)用更適合的體系結(jié)構(gòu)。所以近年吞吐量?jī)?yōu)化處理器在通用并行計(jì)算中變的越來越重要。
GPU與CPU的結(jié)合成為未來平臺(tái)的核心——異構(gòu)系統(tǒng)。它能提供一種創(chuàng)新的解決方案,而更多的異構(gòu)的系統(tǒng)將面世。這些已面世系統(tǒng)顯示了性能上的優(yōu)勢(shì)。然而異構(gòu)平臺(tái)同樣面臨著挑戰(zhàn):低程序員生產(chǎn)力,缺乏通用性,缺少集成工具和開發(fā)庫(kù),以及非常敏感的性能穩(wěn)定性。這些問題會(huì)為應(yīng)用程序的開發(fā)團(tuán)隊(duì)和他們的科
而與此同時(shí),Exaflop(百萬萬億次)級(jí)高性能超級(jí)計(jì)算機(jī)面臨的挑戰(zhàn)也成為人們關(guān)注的問題,這些挑戰(zhàn)包括傳統(tǒng)的性能、擴(kuò)展性和生產(chǎn)力,還有新出現(xiàn)的能效問題和可靠性問題。
此外是節(jié)能技術(shù)的發(fā)展。隨著能耗越來越重要,TOP排行榜已經(jīng)把能耗作為很重要的考核。其中如何冷卻服務(wù)器也是個(gè)挑戰(zhàn)。事實(shí)上,今天風(fēng)冷數(shù)據(jù)中心里50%以上的能耗和碳排放不是來自計(jì)算單元本身,而是源于為避免處理器過熱而安置的散熱系統(tǒng)。
一些公司研發(fā)了熱水冷卻技術(shù)。比如在2010年7月初,IBM公司在為蘇黎世的瑞士聯(lián)邦理工學(xué)院(ETH Zurich)建造的超級(jí)計(jì)算機(jī)Aquasar上就使用了這一技術(shù)。在該案例中,60攝氏度的溫水經(jīng)過微型管道流經(jīng)炙熱的CPU,將CPU的溫度控制在可接受的85度以內(nèi),最后排出的水溫達(dá)到65度,這些熱水隨后用來為學(xué)校里的建筑供暖。