文/杜曉梅 王廣益 李利
解讀最新TOP500排行榜MPP結構略勝Cluster,四核主流地位不變

文/杜曉梅 王廣益 李利
第35屆全球超級計算機TOP500排行榜于2010年5月31日在德國漢堡舉行的SC10大會上發布。排名第一的仍是美國Cray公司研制的“美洲豹”系統;中國曙光公司制造的“星云”超級計算機以1.27Pflops的Linpack性能和2.98Pflops的峰值性能排名第二。
在TOP10系統中,IBM公司占有4臺(一臺“走鵑”和三臺“藍色基因”),Cray公司擁有2臺(“美洲豹”和“海怪”),SGI、Sun以及中國的曙光公司和國防科技大學各占有一臺。但必須指出,我國所制造兩臺系統(“星云”和“天河”)的核心部件CPU和GPU仍是源自美國的Intel、AMD以及NVIDIA公司。由此可見,美國在高性能計算領域的綜合技術實力是無可比擬的。
從技術路線來看,TOP10系統可分為三種技術路線:一是基于高性能通用CPU;二是基于低功耗嵌入式CPU;三是基于通用CPU+加速器(或稱協處理器)。
采用第一種技術路線的系統有4臺。其中,Cray公司的“美洲豹”和“海怪”系統基于AMD六核2.6GHz Opteron處理器;SGI公司的“昴宿星”和Sun公司的“紅色天空”系統則是基于Intel四核EM64T Xeon處理器(型號和頻率不同)。
采用第二種技術路線的系統有3臺。它們都屬于IBM“藍色基因”系列,都是基于低功耗嵌入式PowerPC處理器,其中2臺“藍色基因/P”系統基于850MHz PowerPC 450處理器,1臺“藍色基因/L”系統基于700MHz PowerPC 440處理器。
采用第三種技術路線的系統也有3臺。它們分別為IBM公司的“走鵑”以及我國曙光公司的“星云”和國防科技大學的“天河”系統。所不同的是,作為2008年世界首臺Linpack實測性能突破千萬億次大關的IBM“走鵑”系統采用Cell處理器(最初用于索尼公司的PS游戲機)作為加速器,而我國的“星云”和“天河”系統則是利用GPU來實現加速。具體地說,“走鵑”是AMD Opteron CPU+ PowerXCell 8i;“星云”是Intel X5650 CPU+NVIDIA Tesla C2050 GPU;“天河”是Intel E5540 CPU+AMD/ATI Radeon 4870 GPU。

表1 TOP10系統對比(性能單位:Tflops;能效單位:Mflops/W)
從大的體系結構來看,TOP10系統分為兩種:MPP(大規模并行處理)和Cluster(機群)。其中,采用MPP結構的系統有6臺——Cray“美洲豹”和“海怪”、三臺IBM藍色基因機器、SGI“昴宿星”;采用Cluster結構的機器有4臺——曙光“星云”、IBM“走鵑”、國防科大“天河”、Sun“紅色天空”。
MPP結構的系統又分為基于高性能通用多核CPU(Cray、SGI系統)和基于低功耗嵌入式CPU(IBM藍色基因系統)。
Cluster結構則分為同構(只用一種CPU,Sun“紅色天空”)和異構(CPU+GPU或Cell,“星云”、“天河”和“走鵑”)。
從互連技術來看,TOP10系統采用商用互連和專用互連的機器各占一半。其中,“星云”、“走鵑”、“昴宿星”、“天河”、“紅色天空”都是采用商用Infiniband互連?!懊乐薇焙汀昂9帧毕到y采用了基于Cray專有Seastar2+芯片的高帶寬低時延互連網絡;3臺“藍色基因”系統采用基于IBM公司專有ASIC路由器芯片的三維環網。由此可見,Cluster結構的機器基本都是采用商用標準互連,而MPP結構則一般采用專用互連技術,SGI“昴宿星”MPP系統是一個例外。
在操作系統方面,TOP10系統全部采用了Linux操作系統。
“傳統教學中學生習慣了聽,習慣了被灌輸,我們必須改變傳統課堂中‘老師滔滔講,學生昏昏睡’的現象,高效課堂就是一個非常有效的途徑?!笔c余說,“高效6+1”課堂模式在內地已經普遍應用,但在新疆還處在探索階段。
此次500臺系統的總Linpack性能從6個月前的27.6Pflops增加到32.4Pflops,一年前為22.6Pflops。TOP500進入門檻的Linpack性能為24.7Tflops,6個月前為20Tflops,一年前為17.1Tflops。TOP100的進入門檻從6個月前的47.72Tflops提高到52.84Tflops。此次排名最后一位的系統在6個月前的TOP500中位列357。其更新率遠低于平均水平,反映了目前的經濟形勢和HPC市場將出現新的產品周期。
自從2008年6月份第31屆TOP500首次出現千萬億次超級計算機(Roadrunner)以來,兩年的時間里峰值性能突破千萬億次的系統增加到7臺,其中有3臺系統的Linpack性能超過千萬億次。
最新TOP500的系統規模同上一期相比繼續擴大,系統所用內核數也發生變化,內核數在4097~8192個的系統數量最多,從六個月前的252臺增加到291臺,達到58.2%,而六個月前為252臺。系統規模在8193~16384個處理器的系統從上一次的48臺增加到57臺。而系統規模在2049~4096個處理器的系統規模繼續減少,從一年前的228臺,到六個月前的160臺,此次則減少到111臺。規模低于2048個處理器的系統已經寥寥無幾。其他規模的系統數量變化不大。
此次TOP500中平均每系統內核數從6個月前的9174個增加到10267個,一年前為8210個。此次TOP50中平均每系統內核數從6個月前的44338個增加到49080個,一年前為40871個。具體情況如表2所示。
此次TOP500按慣例跟蹤了500臺超級計算機的實際功耗。此次TOP500的平均功耗為397kWatt,平均能效為195Mflops/Watt(一年前為108Mflops/Watt,六個月前為125Mflops/Watt)。

表2 TOP500系統規模(性能單位:Tflops)
排名第1的Jaguar系統最高總功耗為6.95Mwatt。TOP10的平均功耗為2.89Mwatt(一年前為2.45MWatt),平均能效為300Mflops/Watt(一年前為280Mflops/Watt)。
能效最高的系統主要基于:采用IBM PowerXCell 8i處理器的Qpace機群系統,能效最高達774Mflop/Watt;IBM QS22 Cell處理器刀片系統,能效高達458Mflop/Watt;采用Intel Westmere處理器的iDataPlex系統,能效高達418Mflop/Watt。
此次TOP500的系統中,處理器結構仍以多核處理器為主。有85%(425臺)都使用了4核處理器,有5%的系統使用了6核或以上的處理器。仍有48臺系統采用雙核處理器。
Intel無疑仍是最大贏家。在所有500臺系統中,使用Intel處理器的占了81.2%,而且在使用4核處理器的系統中,Intel的份額超過了90%。使用Intel Core i7(Nehalem-EP)處理器的系統數量增長迅速,從上次的95臺增長到此次的186臺,幾乎翻了一倍。

表3處理器制造商情況(性能單位:Tflops)

表4 TOP500系統保有量前10國家(性能單位:Tflops)
AMD Opteron系列處理器的采用率此次超過IBM,排名第二,從42臺增加到47臺,占9.4%。IBM Power處理器份額略有下降,從52臺減少到42臺,占8.4%。具體情況如表3所示。
美國的領先地位依舊無人能撼,500臺系統中占了282臺(6個月前277臺)。歐洲所占份額(從152臺減少到144臺)仍遠遠超過亞洲(從51臺增加到57臺)。
亞洲系統擁有量占優勢的分別是中國(從21臺增加到24臺)、日本(從16臺增加到18臺)和印度(從3臺增加到5臺)。
在歐洲,英國的系統保有量仍位居第一,有38臺(6個月前為45臺)。法國有29臺(6個月前為26臺),超過德國(24臺,6個月前為27臺)排名第2。
中國保有的系統數持續增長,此次達到24臺,與德國持平,系統保有數排名第四,排名前三的國家依次是美國、英國和法國。而就系統總體性能值而言,中國僅次于美國之后,排名第二,超過了排名第三的德國。表4所示為系統保有量前十位的國家。
機群結構仍是TOP500系統主要使用的結構,此次機群結構的系統數量繼續穩步增加,達到424臺(占85%。),六個月前為417臺,一年前為410臺。采用MPP結構的系統數量繼續減少,從六個月前的81臺減少到74臺(一年前為88臺),雖然數量不多,但仍主打高端系統。在TOP50中,MPP結構占據大半江山,數量達到28臺,在TOP100中,也有47臺系統使用了MPP結構。采用星群結構(Constellations)的系統仍為兩臺。
在操作系統方面,Linux繼續擴大優勢,以455臺的絕對優勢獨霸一方,比上一次的446臺有所增加。而且Linux系統占據高端,排名前十的系統全部采用該操作系統。Unix和Mixed的份額都有所下降。具體情況如表5所示。

表5 TOP500操作系統情況(性能單位:Tflops)

表6 TOP500互連類型(性能單位:Tflops)
采用千兆以太網(Gigabit Ethernet)的系統數量雖略有下降,但仍是使用最多的互連技術,有244臺系統使用,并廣泛應用于工業用戶。排在第2的是InfiniBand技術,有205臺系統使用。
但是,使用Infiniband技術的系統的總體性能(15.9Pflops)是使用千兆以太網技術總體性能(7.8Pflops)的2倍。
在前十臺系統中,Infiniband和專有互連平分秋色,使用臺數都為5臺。TOP50中僅有一臺系統采用千兆以太網(Gigabit Ethernet)互連技術。TOP100中有63臺系統采用Infiniband互連結構。表6所示為TOP500互連的具體情況。
為江南計算技術研究所)
本文轉載于上海超算中心內部刊物《高性能計算發展與應用》最新一期,經授權引用。