曙光5000再次刷新了中國高性能計算的速度,這臺擁有超百萬億次計算能力,而占地卻只需75平方米的高性能集群,幾乎可以挑戰全球高性能計算機的頂峰——千萬億次機。那么,它的真面目是怎樣的,它的出現給中國的HPC產業帶來了怎樣的影響?
6月24日,中國高性能計算機的研發邁上了新的臺階。中國科學院計算技術研究所、曙光公司和上海超級計算中心聯合舉行了曙光5000落戶上海簽約儀式。
這標志著中國用戶即將擁有國產品牌的百萬億次超級計算機,屆時上海超級計算機中心也將成為世界上最大的通用計算平臺。即將落戶上海超級計算中心的曙光5000將擁有200萬億次的浮點運算能力,這個速度將再次刷新國內高性能計算的紀錄(上次紀錄是由同樣在上海超算服役的擁有11萬億次的曙光4000創造的),同時在世界的通用超級計算機領域也是名列前茅。
中國速度
1983年,由國防科技大學研制的銀河Ⅰ型億次巨型機系統的成功問世,標志著我國具備了研制高端計算機系統的能力。此后,經過了新世紀前后的銀河系列、神威系列、曙光1000~3000的高性能計算機,我國的HPC產業從一窮二白起家,然后飛速發展,直到2003年的聯想深騰6800以及2004年具有10萬億次計算能力的曙光4000A的出現,才把我國的高性能計算產業真正推上了一個高峰。
曙光4000A面世的時候,還憑借其10萬億次的計算速度而闖進全球超級計算TOP500排行榜前10。如今,這個已經為上海超算中心服役3年的“功臣”就要光榮“退崗”了,因為有著更高計算能力的曙光5000將代替它繼續為中國的高性能領域服務。
“曙光5000”高性能計算機是國家863計劃支持的研究項目。其浮點運算處理能力可以達到230萬億次,Linpack速度預測將達到160萬億次,這個速度將有望讓中國高性能計算機再次躋身世界前10。除了超強的計算能力,它還擁有全自主、超高密度、超高性價比、超低功耗以及超廣泛應用等特點。
“100萬億次計算機所面臨的技術瓶頸要比10萬億次計算機更多、更難解決,但絕對不是簡單的數字疊加。‘曙光5000’的問世使中國成為繼美國之后第二個能制造和應用超100萬億次商用高性能計算機的國家,也表明我國生產、應用、維護高性能計算機的能力達到世界先進水平。”曙光公司總裁歷軍表示。
目前,曙光5000已成功運行于證券指數計算、電力安全評估、建筑工程抗震性評估、天氣預報、石油地震資料處理、核能開發利用、汽車碰撞、電磁輻射、計算流體力學、基因匹配與拼接、蛋白質結構分析和材料科學等領域的20多項應用。中科院計算所所長李國杰院士在接受記者采訪時表示,高性能計算機是用來解決大問題的計算平臺,在我國經濟建設、網絡安全、石油領域等都發揮了很大作用。“曙光5000”與國際上千萬億次計算機在性能功耗比、價格比及組裝密度等指標上已不相上下。李國杰還透露,我國將于2010年推出千萬億次超級服務器。
自主創新
超百萬億次計算機的推出,充分說明了曙光公司的研發實力。曙光成立于1995年,背靠中科院計算所和國家智能計算機研究開發中心,經過多年的發展,曙光公司積累了豐富的服務器產品研發、應用經驗,并在天津建成了曙光產業基地,實現了國產高性能計算機的產業化生產,構建了集研發、設計、制造于一體的服務器產鏈。曙光5000就是在曙光的天津產業基地生產而成的。
“曙光5000是全自主的國產超級計算機。”李國杰院士的觀點一直是強調“自主創新”。在曙光5000系統中,中科院計算所聯合曙光公司自主設計了包括主板、體系結構、刀片服務器、刀片機箱系統、網絡交換系統和水冷散熱系統在內的全部系統,而曙光5000的設計也完全符合中國刀片服務器標準。
李國杰表示,在服務器產品同質化現象嚴重的今天,只有堅持自主創新才能形成產品差異化,才能構建競爭優勢。而且,經濟實力強勁的西方國家一直對高性能計算機的核心技術擁有掌控權,也將高性能計算機作為戰略物資對外封鎖。以中國為首的發展中國家,只有走自主研發的道路,不斷開發自己的高性能計算產品,才能使自己不至于淪為西方國家低性能計算產品的高價傾銷地。
即將問世的曙光5000,解決了一系列的世界性難題。例如,上千個客戶端如何在多用戶并發訪問模式下保持穩定的I/O性能; 面對眾多核心,操作系統如何容忍單個處理器故障,怎樣支持節點之間的隔離; 如何改造現有算法,并利用并行編譯技術使應用與100萬億次計算機的體系結構相適應,以達到數萬個處理器的可擴展性等等,這些都是國際學術界和企業所共同面對的難點。而通過曙光眾多技術工程師的共同努力,這些技術難點已經一一突破,迎來了曙光5000的誕生。
立足用戶
根據IDC預測,2008年高性能計算市場銷售收入將超越過120億美元; 集群服務器將占據高性能計算整體份額的70%之多,集群服務器的銷售也將逐漸向刀片服務器領域偏移,這一點已經在廠商們對刀片集群的偏愛中體現出來。預計全球年度服務器增長速度平均約為9%,而高性能計算存儲市場的全球平均增長速度將略高于服務器市場,大約為11%。高性能計算服務器和服務的銷售總收入將超過190億美元(軟件應用程序、人員配置、設備和能耗的成本不計在內)。
很多服務器制造商也緊跟著業界的熱點。比如國外的惠普、戴爾,國內的浪潮、曙光,其中曙光更是超前,提出了個人桌面高性能計算中心。不過今年4月份,英特爾公司高性能計算部門的高級主管StephenWheat在高性能計算大會上做的報告卻稱: “越來越多的高性能計算配置行為完全沒有進行任何市場研發。”換言之,很多廠商沒有找到高性能計算用戶的真正需求。
“很多廠商在推出產品時,只一味地追求速度和先進,并沒有把用戶需求放到第一位。”曙光公司副總裁聶華深有感觸地說,“其實,除了速度之外,很多用戶看重的更是節能以及性價比。”
以CPU為例,世界500強中3/4的公司產品都采用了英特爾芯片,而曙光5000則配裝了6600枚AMD巴塞羅那四核處理器。“我們采用AMD芯片是根據客戶的需求,上海超級計算中心的大量運算需要采用基于微軟視窗操作系統的商業軟件。雖然英特爾的芯片在主頻上更高,如果曙光5000使用它能夠達到更高的計算峰值,但是基于對能耗的考慮,我們還是選擇了具有低主頻的AMD芯片。”聶華說。
而在成本方面,據負責曙光系列高性能計算機總體設計的孫凝暉博士介紹,對于高性能計算機來說,芯片成本大約要占高端計算機成本的80%以上,而“曙光5000的研制成本約為兩億元人民幣,比國外正在研制的千萬億次超級計算機成本要低得多”。
對于高性能計算機來說,它存在的意義就是被應用,而對于中國的HPC廠商來說,最重要的就是被用戶的認可。“曙光之所以有今天的發展,就是有上海超算這樣一個忠誠的用戶做支持。”李國杰這樣表示。據上海超算中心的溪主任介紹,上海超算多年來一直堅持用國產計算機。如今,上海超算部署的高性能計算機已在各行各業被使用。
挑戰極限
就在曙光5000技術參數曝光后的幾天里,IBM也宣布其千萬億次的產品技術參數。盡管它的絕對峰值速度還讓國人感覺到有點“愧不如人”,但是在產品的密度和節能等方面,國產超級計算機已經處于領先地位。
“曙光5000同時在體積、節能、軟件效率和可管理方面都會有很大幅度的提高,它的性能將會是4000A的20倍,體積只有2/3,耗電只增加了50%,這些方面在整個業界也是首屈一指的。”歷軍自豪地說。
眾所周知,對于大規模,高性能計算機系統而言,如何提高系統密度,并降低功耗是研制人員面臨的關鍵問題之一。為提高曙光5000的系統密度,中科院計算所聯合曙光公司,研制了具有自主知識產權的4CPU 4核高密度刀片主板和基于該主板的世界上第一款7U高度的10片4路4核64位CPU的工業標準刀片服務器。該刀片服務器可以實現單機箱40CPU、160核的超高計算密度,并實現了單節點內部的并行計算。
“曙光5000的單體是一人多高的機柜,機柜由上下5個機箱構成,每個機箱高密度集成了40個CPU芯片。雖然整個系統擁有數十個不同功能的機柜,占地面積卻只有75平方米,好比6000多臺電腦神奇地容入一個小戶型內。”李國杰表示,“曙光5000”的絕對計算速度并不是世界第一,但單位計算效率和單位計算低能耗方面可能成為世界第一。它與IBM最新超級計算機相比,單機柜每秒計算性能達7.5萬億次(后者為3.5萬億次),每百萬億次計算僅需約14個機柜(后者約29個機柜)、耗電為350千瓦(后者為400千瓦)。
“曙光5000不但證明了中國高性能計算方面的實力,為眾多重大科研項目的研發項目鋪平道路,同時其廣泛的應用范疇還解決了國內日益增長的商用高性能計算資源緊張的現狀和社會對節能環保方面的要求。”歷軍表示,曙光5000不但為國家“863計劃”交出了滿意的答卷,也為國民和社會交出了一份滿意的答案。
采訪手記
下一個目標: 千萬億次
曙光5000以百萬億次超級計算能力開辟了高性能的新時代,使中國成為繼美國之后第二個能制造和應用超百萬億次商用高性能計算機的國家。“然而,我們不會在這個成績上停滯不前,曙光的下一個目標是實現千萬億次超級計算機!”曙光公司總裁歷軍信誓旦旦地說道。
從全球來看,具有千萬億次計算能力的超級計算機已經出現。在今年6月初最新一期(第31屆)超級計算TOP500排行榜上,IBM新近研發的超級計算機Roadrunner以1026萬億次浮點運算位居榜首。排行榜顯示,美國仍然是超級計算機應用最廣的國家。而值得注意的是,印度已經第二次進入了TOP500的前10名,其超級計算機應用的是惠普Cluster Platform 3000 BL460c系統,并且整合了自己的創新路由技術,使其性能達到132.8 萬億次浮點運算而名列第八。
“6月24日,曙光正式發布了峰值運算能力達每秒230萬億次的5000超級計算機,并和上海超級計算機中心簽約。可惜的是,該機錯過了TOP500.Org今年6月的榜單,否則可以位居第八。”曙光公司副總裁聶華說。
“不過曙光5000在申報2008年11月的全球超級計算機500強排行時,還是很有機會進入前10的榜單。”聶華說,“但是,排名并不是我們追求的目的,我們追求的是在適當的時間推出符合用戶要求的機器。如果從機器研發本身來說,曙光5000還能在更早時間推出,但是我們為了帶給用戶更適合、性價比更高的產品,我們對某些技術做了一遍又一遍的嘗試和更新。”
以CPU為例,其實曙光5000系統完全支持高功耗CPU,在同樣的價格下可以做到CPU 2.6G主頻,但是曙光采用了低功耗的CPU,主頻降到了1.9G,這對用戶來講意味著損失了大量的系統理論峰值,但從另一個角度來講,這給用戶帶來了一個福音。實際上每一顆CPU可以降低接近30瓦的功耗,而曙光5000系統中的CPU多達幾千顆,這樣一年為用戶省下的電費就相當可觀了。
但是人類對技術的應用和追求是無止境的.百萬億次也不是曙光的終點。如今曙光已經邁上了“千萬億次”的征程,相信在用戶需要的那一天,具有千萬億次計算能力的曙光高性能機就會出現。(文/劉麗麗)
鏈接
曙光5000的9大技術亮點
1. 高性能
采用國際高性能計算機主流的機群結構,整個系統規模達到1650個節點,每個節點為4CPU的4核SMP系統,采用AMD Barcelona 2.0GHz處理器,峰值運算速度為230TFLOPS。
2. 全自主
在自主創新的研制過程中,曙光在業界實現了多個第一:
首次實現了4路16核的高密度刀片系統;
首次實現了單刀片機箱40克CPU的高密度機箱設計;
首次實現了基于DDR的Infiniband的交換結構,實現了20GB高速互聯和小于1.3us的低延遲;
首次采用了水冷散熱系統,降低了高性能計算機對機房系統的要求,降低了系統功耗。
3. 高效能
由于采用高密度服務器,曙光5000在大約75平方米的占地面積內聚集了230萬億次的計算能力。
4. 高密度
為提高曙光5000的系統密度,中科院計算所聯合曙光公司,研制了具有自主知識產權的4CPU 4核高密度刀片主板和基于該主板的世界上第一款7U高度的10片4路4核64位CPU的工業標準刀片服務器。
5. 高速互聯
曙光5000采用基于DDR的 Infiniband高速網絡,實現了計算網絡和存儲網絡合一。實現了20GB的節點間傳輸速度,實現業界最快的小于1.3us延時。
6. 應用廣泛
曙光5000不僅可以應用于高性能計算,還可以應用于信息服務,電子政務,網絡游戲等常見商業應用。
在商業應用方面,由于曙光5000使用Suse Linux 和 WCCS ,可廣泛運行目前Linux和Windows下的主流的行業軟件。
7. 節能
曙光積極響應世界環保組織節能減排的號召,在曙光5000中采用了多項節能措施,使曙光5000在滿負載運行時,不帶水冷系統的功耗為700千瓦,帶水冷系統的功耗僅為1000千瓦。
8. 高性價比
通過選擇AMD Barcelona和自行研制的主板,使曙光5000具有很好的性能價格比。實現230萬億次的計算速度的曙光5000總造價約兩億元。
9. 自主創新的管理軟件
曙光5000中,曙光自主開發了Grid View集群管理管理系統。曙光新一代Gridview大型機綜合管理系統提供了統一的集中式監控平臺,具備可擴展性、集成性、可靠性和易用性,提供對各種商用、自己研發的管理工具的集成接口。