段芳

1997年,世界上首臺萬億次超級計算機在美國圣地亞國家實驗室落戶,2016年,十億億次超級計算機“神威·太湖之光”問世。短短20年間,超級計算機單臺性能整整提高了10萬倍。“神威·太湖之光”超級計算機的最大特點就是運算速度快,其整機系統峰值性能可達每秒12.5億億次,它1分鐘的計算能力相當于全球72億人同時用計算器不間斷計算 32年。計算性能、持續性能和性能功耗比這三項關鍵指標在系統發布時均居世界前列。
“神威·太湖之光”超級計算機采用基于高密度彈性超節點和高流量復合網絡的高效能體系結構,由運算系統、網絡系統、外圍系統、維護診斷系統、電源系統、冷卻系統和軟件系統組成。

由32768個運算節點組成,主要包括處理器、存儲器、節點管理控制器、電源供電和接口電路等。
采用大規模高流量復合網絡體系結構,構造了超節點網絡、共享資源網絡和中央交換網絡的三級互連,實現了全系統高帶寬、低延遲通信,有效支持計算密集、通信密集和輸入/輸出(I/O)密集等多類型課題的運行。
由網絡存儲系統和外圍管理系統組成。
網絡存儲系統由存儲網絡和存儲磁盤陣列盤陣組成,負責為運算節點提供高速可靠的數據存儲訪問服務。
外圍管理系統由系統控制臺、管理服務器和管理網絡組成,用以實現系統的管理與服務。
提供全面的在線維護管理、運行狀態與環境監控、故障定位與記錄,以及安全保護。
包括配電、高壓整流柜、直流不間斷電源、交流不間斷電源、機倉板級電源以及相應的電源監控系統,負責向整機各個部分提供穩定、可靠的電力供應。
超級計算機運行時會產生巨大的熱量,冷卻系統幫助其降溫,避免因過熱而產生不良后果。“神威·太湖之光”的運算機倉和網絡機倉采用間接水冷方式冷卻,外圍設備采用水風交換方式冷卻,電源系統采用強
由國產眾核CPU基礎軟件、并行操作系統環境、高性能存儲管理系統、并行語言及編譯環境、并行開發環境等部分組成。制風冷方式冷卻,從而保證整機正常穩定運行。

超級計算機,簡稱超算,是指能夠執行一般個人電腦無法處理的大資料量與高速運算的電腦。其基本組件與個人電腦無太大差異,但規格與性能則強大許多,是一種超大型電子計算機,具有很強的計算和處理數據的能力,主要特點表現為高速度和大容量,配有多種外部和外圍設備及豐富、高效的軟件系統。現有的超級計算機運算速度大都可以達到每秒1太(萬億)次以上。
超級計算機多用于國家高科技領域和尖端技術研究,是一個國家科研實力的體現,對國家安全、經濟和社會發展具有舉足輕重的意義,是國家科技發展水平和綜合國力的重要標志。
以“神威·太湖之光”為例,應用領域最常見的有:天氣預報、石油勘探、藥物開發以及各類設計等。在2017年11月舉行的全球超級計算大會上,由清華大學地球系統科學系“80后”副教授付昊桓帶領團隊完成的“非線性大地震模擬”,獲得了國際高性能計算應用領域最高獎——“戈登·貝爾”獎。這是基于“神威·太湖之光”超級計算機的應用第二次拿下該獎。“戈登·貝爾”獎更注重高性能計算應用水平,被譽為“超級計算領域的諾貝爾獎”。此次獲獎的“非線性大地震模擬”首次實現了對唐山大地震發生過程的高分辨率精確模擬,準確地實現了對地震發生過程的重現與預測。這對未來地震災害救援演習、預防預測及合理規劃地震高發區的各項設施等都有重要意義。
我國在戈登·貝爾獎上取得零的突破是在2016年,當時由中國科學院軟件研究所、清華大學、國家并行計算機工程技術研究中心、北京師范大學和國家超級計算無錫中心合作的“千萬核可擴展大氣動力學全隱式模擬”研究取得重要進展,被授予了戈登·貝爾獎,應用的正是國產“神威·太湖之光”這一配備了國產眾核處理器的世界頂級超算系統。這個項目設計開發了一種新的用于大氣動力模擬的高可擴展全隱式求解算法和軟件,是世界上首次在大規模異構眾核系統上實現千萬核可擴展的高效并行隱式求解,第一次在有效時間尺度完成了500米以上分辨率的大氣模擬。該成果在應用與算法兩個層面實現了重大突破。在應用層面,該成果首次證明了全隱式求解方法是構建未來超高分辨率大氣模式的一種具有競爭力的選擇,該大氣動力過程的模擬速度較美國下一代大氣模擬系統 ( 美國地球物理流體動力學實驗室開發的AM3非靜力大氣模式 ) 的計算效率提升近1個數量級,未來可應用于高分辨率氣候模擬和高精細數值天氣預報,提升預估、預報精度。在算法層面,該應用實現了目前世界上首個可擴展到千萬核、峰值效率超過6%的隱式求解器。其并行度和峰值效率較2015年“戈登·貝爾”獎的獲獎工作均提升一個數量級,預計未來在航空、地學、能源等領域的挑戰性計算問題求解方面有著廣闊的應用前景。
與國內超級計算機更為開放、可以匹配不同使用者需求的特點不同,國外的機構研發建設超級計算機的目的都是自用。美國速度最快的超級計算機“泰坦”的建設方是美國能源部,主要應用于美國能源部內部的核試驗模擬。類似的還有“紅杉”,這些國外超級計算機用途較為單一,基本只能適配某一方向的應用,但針對性、專業性更強。
總的來說,超級計算機從一開始算“地”(全球氣候、各類模型等),到算“天”(宇宙探索),最后累積了海量經驗與技術,從而發展到算“人”(人工智能)這個最貼近人類、也最復雜的課題上。2017年5月,在中國烏鎮圍棋峰會上,人工智能程序與世界排名第一的世界圍棋冠軍柯潔對戰,人工智能程序以3∶0的總比分獲勝。而早在很多年前,人類下象棋就不是超級計算機的對手了。

利用大氣模擬模型生成的全球氣候變化預測