葛 蔚 郭 力 李靜海 陳左寧 胡蘇太 劉 鑫 中國科學院過程工程研究所 北京 0090 國家并行計算機工程技術研究中心 北京 0090
關于超級計算發展戰略方向的思考*
葛蔚1郭力1李靜海1陳左寧2胡蘇太2劉鑫2
1中國科學院過程工程研究所北京100190
2國家并行計算機工程技術研究中心北京100190

超級計算能力是國家科技競爭力乃至綜合國力的重要標志,也是經濟社會發展、國防和國家安全的重要支撐。特別是在網絡化、大數據、云計算和虛擬現實迅猛發展的背景下,超級計算不但是科技發展的利器,正引發科研模式的根本變革,也將成為重要的社會基礎設施,并最終深刻地改變我們的生產和生活方式。但目前超級計算正面臨應用效率低、能耗高、穩定性差和難以應用等嚴峻挑戰。基于在復雜系統多尺度模擬方面多年的探索和積累,文章提出,按照計算對象、模型、軟件與硬件的邏輯和結構一致的原理優化計算機體系結構,緩解和克服商品化通用硬件系統開發中的難點,可能是突破這些瓶頸的一條具有普遍意義的途徑。
超級計算,多尺度計算模式,能量最小多尺度(EMMS) 范式,虛擬過程工程
超級計算是革命性的研發手段,代表了一個國家科學技術發展的水平。同時,它已成為現代社會重要的信息基礎設施,正在深刻地改變人類的生產和生活方式。
2005 年,美國總統信息技術咨詢委員會(PITAC)在給時任美國總統的喬治·W·布什的報告《計算科學:確保美國競爭力》[1]中多次強調:計算科學是繼理論和實驗之后的第三科學支柱,21 世紀最偉大的科學突破將從計算科學中獲得。報告認為:如果在此關鍵時刻不能高瞻遠矚,美國的科學領導地位和經濟競爭力將不堪設想。而超級計算無疑是計算科學的前沿與核心。2014 年美國能源部報告《E 級計算的十大挑戰》[2]更明確指出 E 級(Exaflops)計算將改變全球經濟。
具體而言,本文認為,超級計算的重要性集中體現在 3 個方面:
(1)超級計算已經是革命性的研發手段。根據已有理論在超級計算機上進行虛擬實驗,即計算機模擬,甚至虛擬現實,已經在越來越大的程度上輔助甚至替代現實的實驗。比如禁止核試驗后計算機模擬的核爆炸就完全代替了核實驗。各國大飛機的研制也都依賴計算力學與超級計算完成氣動與結構設計。同樣,從新藥研制到精準醫學,從催化機理的分析到反應器放大與優化,從建筑與橋梁設計到地質災害防治,超級計算幾乎在現代科技的所有領域中突破了理論和實驗研究的極限,極大地加快了研發進程,并顯著降低了費用。由此形成的產業技術帶來的效益更是不可估量,并已成為國防和國家安全的一個重要支點。同時超級計算的綜合性還有效促進了不同學科的交叉融合,從而促進復雜性科學和腦科學等 21 世紀最激動人心的科學前沿的形成。
(2)超級計算已成為現代社會重要的信息基礎設施。可以毫不夸張地說,超級計算對于正在迅速發展的信息社會就像能源和交通對于工業社會那樣重要。超級計算的應用正從傳統的科研領域向社會經濟的各個方面滲透。目前電子商務、金融和社會管理中已經開始用數據挖掘等手段分析人們的消費和行為習慣,從而更精準地指導生產和流通,提高經濟和社會的運行效率。同樣,在交通和物流的管控與優化、疾病預防與控制、天氣預報與氣候預測、經濟定量預測與調控甚至休閑娛樂等領域的應用即將迎來爆發式增長,帶動新興產業的崛起,使超級計算像電力和自來水一樣在日常生活中成為不可或缺的資源。
(3)超級計算正在深刻地改變人類的生產和生活方式。超級計算技術本身正面臨深刻的變革,其前景無可限量。目前龐大的超級計算機將演進為緊湊的信息處理設備而融入生產生活的方方面面,通過云計算、物聯網和智能設備等形成龐大的網絡。這種泛在的超級計算和它驅動與支撐的智能制造、柔性制造、虛擬現實等技術與產業將帶來一個“萬物有靈”、“虛實難辨”的時代。人類在應對能源與資源短缺、環境污染和氣候變化等可持續發展的重大挑戰時將具備全新的能力。生產效率將極大提高、能源和資源消耗將顯著降低,人類的生存空間將極大地拓展,更加自由而綠色的生活方式將不斷涌現。
超級計算對我國的自主創新、跨越發展尤為重要,并將隨著發展的進程變得越來越重要。過去 15 年中,我國部署了多個國家級科技項目和資助計劃,有力推動了中國超級計算能力的提升。“天河”、“曙光”、“神威”等系列超級計算機的研制成功,使國家級超級計算基礎設施進入世界領先行列,形成了相當規模的國家級高性能計算服務環境,支撐了一大批重大的領域應用。因此,持續保持國家對超級計算的投入,不斷攻研和創新超級計算機技術,使我國超級計算的發展邁上更高的臺階,對國家經濟社會轉型升級和中華民族偉大復興具有重要戰略意義。
以商品化通用硬件主導的發展模式由于效率、能耗、穩定性等問題已舉步維艱。以應用牽引的模式正逐步成為主流。抓住這一轉變的機遇,我國超級計算有望跨越發展,全面領先。
盡管超級計算意義重大、發展迅猛,但近年來也遇到了重大的挑戰與發展的瓶頸,急需新的思路來破解。20 世紀 90 年代以來,由于商品化通用處理器的快速發展,極大地促進了超級計算機的發展。據 HPC Top500[3]統計顯示,2000 年以來,采用商品化通用硬件構建超級計算機的數量最高時達到總量的 90% 以上。但隨著計算機系統規模的增大和峰值計算性能的提高,這種按照“商品化硬件-軟件-應用”模式研制的機器遇到了新的挑戰。
(1)應用效率低下。商品化通用軟硬件對領域高難計算問題或大數據處理問題缺乏針對性,因而系統計算資源的利用率較低,使機器的實際性能大打折扣,大多數機器的實際應用效率不會超過其峰值性能的 10% 左右。
(2)運行功耗大。系統規模的擴大導致機器耗電量急劇增加,高端超級計算系統的能耗已經達到 10 兆瓦量級,但性能能耗比提高緩慢,機器運營成本難以承受。
(3)系統可靠性低。隨著系統中處理器的核數達到百萬量級以上,主要器件數量達到千萬量級以上,當前一個高端系統的平均無故障時間達到數小時已十分困難,對高可靠性的影響極大。
加之開發投入上也是前重后輕,特別是我國在大型應用軟件的開發上投入不足,使得應用開發嚴重滯后,機器的潛力遠遠沒有發揮。顯然,在這種模式下,僅僅依靠商品化通用硬件的漸進式技術改善,超級計算機系統的易用性和對需求的適應性會不斷降低,整機的實用性也因算法并行性和系統穩定性的限制而大打折扣,從而失去了追求整機性能的意義。
在這種模式下,即使是面向商品化硬件的軟件和應用開發,也只能永遠滯后于硬件系統的開發。且商品化底層技術的迅速發展使得超級計算系統的有效使用年限非常有限(一般只有 5—7 年),并且研發、制造成本(動輒數億元人民幣)與運維費用日益高昂(可達每年數千萬元),因此這種滯后帶來的資源浪費也非常巨大。正是由于對成本、能耗、效率、容錯與穩定性等問題尚無可靠的解決方案,國際上幾個擬議中的 E 級計算項目已被數度推遲。
這些困境背后的共性問題是:在商品化軟硬件研發中缺乏對應用對象的結構分析與利用,即計算機與計算對象的邏輯結構和物理結構不一致。近年來微電子和集成電路領域的發展趨勢是:運算部件的速度提升快、能耗低,存儲和通信部件的速度(帶寬與延遲)提升慢、能耗高。為了彌補兩者間的差距,需要引入多級數據高速緩存和交換。但這種補償只有在計算軟件具有相應的并行性與數據局部性時才適用,否則只能帶來處理器設計復雜性的提高、元器件利用率的降低和編程難度的加大。而如果不從應用出發,考慮計算對象的物理結構和計算特征,計算軟件就難以充分挖掘利用問題內在的并行性。另一方面,如果深入考慮了計算對象的結構和特征,現行的復雜的硬件設計非但沒有必要,反而還會阻礙內在并行性的充分發揮。
實際上,大多數計算對象的邏輯結構都是多尺度的,但目前很多超級計算系統中的基本處理單元還是同質和單一尺度的,由此造成了存儲與通信方面的巨大浪費。最新的異構超級計算系統可支持兩尺度并行,但基本處理單元仍為同質。為解決這些問題,根本的出路是改變發展模式,從商品化硬件牽引變為應用牽引,從創新應用模型入手,帶動計算模型、體系結構及軟硬件的創新。這對我國來講是一個重大機遇!
繞開商品化通用硬件發展的瓶頸問題和我國在硬件制造方面的劣勢,聚焦計算對象、模型、軟件與硬件的邏輯和結構一致性是超級計算的必然發展方向,更是我國超級計算自主可控與跨越發展的寶貴機遇。
從應用角度看,目前國際上超級計算面臨的諸多問題本質上都與沒有充分考慮計算對象的物理結構和邏輯特征有關。如果能從這一角度出發,超級計算將迎來全新的重大發展機遇。其核心是:高效的超級計算應體現計算對象、模型、軟件與硬件的邏輯和結構一致性,而這種結構正是物理過程普遍而內在的多尺度結構,具有從全局相關到近程相關、從穩定性約束到動力學控制的共同特征[4]。
利用計算對象的結構特征可以有效簡化硬件系統的設計,即:通過物理過程的多尺度分解,將大尺度的長程關聯與小尺度的近程作用分離。后者的計算量非常大,但可以充分并行;前者雖然難以并行,但分解后余留的計算量較小。兩者結合可簡單高效地計算整個系統的演化。這里的多尺度分解并不純粹是數學上的分解,也是基于物理機制的簡化與分解。而引入穩定性條件,除了能從數學上封閉要求待定參數的模型,還能在物理上引入合理的約束條件,大大減少計算量并保證計算精度。若將此思路貫穿到計算硬件的設計中,帶來的處理器微結構簡化設計也可為我國核心基礎器件的自主可控發展和整機技術的跨越發展提供捷徑。
由于計算對象、模型、軟件與硬件的邏輯和結構一致性反映了自然界內在的層次性和并行性(層次性也是一種垂直的并行性),它具有很強的普遍性。由此設計的超級計算系統在提高效能的同時并不會顯著影響其通用性,反而將促進各領域研究方法由單尺度平均向多尺度耦合的方向發展。同時,這種物理與計算系統的內在一致性也有利于量子計算和仿生計算等從更基礎層面利用自然稟賦的顛覆性技術的發展和應用。
4.1 多尺度模擬和高效能計算機系統
中科院過程工程所針對多相復雜系統的多尺度模擬,以及國家并行計算機工程技術研究中心針對國家“863”計劃項目研制的基于自主處理器的高效能計算機系統,在計算對象、模型、軟件與硬件的結構和邏輯一致的超級計算方面作了有益的探索,展現了這條途徑的廣闊前景,其普遍意義值得深入研究。
4.1.1針對多相復雜系統的多尺度模擬
近年來,我國超級計算機無論在峰值速度還是在實測性能上一直保持與世界同步,并逐步達到了世界領先水平。但我們在超級計算軟件和應用方面的發展卻遠遠滯后于硬件。同時,我國支撐超級計算的核心基礎元器件和部件(芯片)的研發水平也與美日等競爭對手有差距,尤其是高性能 CPU 基礎器件的后端生產、封裝、測試等環節以及設計工具長期受制于國外,國內工藝普遍落后一代以上,難以完全擺脫受制于人的局面。
多年來,中科院過程工程所以應用為牽引,按照“計算對象、模型、軟件與硬件的邏輯和結構一致”的原理,在超級計算發展的新途徑上做了不懈的努力,其中的很多思路與經驗值得深入探討與推廣。
在國家自然科學基金委等的持續支持下,中科院過程所從 20 世紀 80 年代初就開始了對多相系統多尺度方法的研究,提出了獨特的能量最小多尺度(EMMS)模型,以全局和介尺度穩定性條件約束提高了多相反應過程模擬的精度和速度。在檢驗、擴展和深化該模型的過程中又發展了擬顆粒等離散化方法,并認識到它們是描述復雜系統微尺度行為的有效方法并普遍具有高度的并行性,認為這將成為超級計算的重要應用領域。而 EMM S 模型向氣液和湍流等其他領域的擴展形成的極值型多尺度方法又使穩定性約束成為加速復雜系統宏尺度和介尺度模擬的共性方法。兩者結合則定義了一種新的具有普遍意義的超級計算模式:EMMS 范式,即用離散化方法模擬系統中的近程強相關作用,利用極值型多尺度方法描述系統中的長程關聯。前者的計算具有局部性、可加性等適應大規模、細粒度并行計算的良好特性,后者包含的復雜計算被大幅減少。兩者結合為實現高效超級計算提供了全新的途徑。
2007 年以來,通用計算圖形處理器(GUGPU)的出現,為驗證這一思路提供了技術基礎。在財政部“國家重大科研裝備研制項目”等的支持下,中科院過程工程所按照上述思路研制了 Mole 系列高效能超級計算系統,引領了我國通過異構并行趕超世界超級計算前沿的征程。在國內率先于 2008 年 2 月建成了 100 萬億次 CPU+GPGPU 并行系統。2010 年 4 月建成的 1 000 萬億次系統[5,6]位列當年 Top500 第 19 位和 Green500 第 8 位(在當時全球千萬億次級超級計算系統中列首位)。目前仍在高效運行中。該系統還與分布在全國 6 個城市的 10 套 100 萬億次以上系統一起在中科院形成了聚合計算能力超過 5 000 萬億次的分布式 GPGPU 超級計算環境。
考慮到實際應用需求,進一步擴展峰值性能已無必要,因此研究隨后轉向在不同的應用實例中進一步探索 EMMS 范式的可行性和通用性,完成了多相流動直接數值模擬、材料和納微系統微觀模擬和生物大分子動態行為模擬等處于世界前沿水平的應用,初步證明了該計算范式的優勢和前景。該系統還獲得了廣泛的工業應用,合作伙伴包括了中石化、中石油、寶鋼、殼牌石油、英國石油、道達爾、通用電氣、阿爾斯通、必和必拓、聯合利華、巴斯夫、法國電力、兗礦等 10 余家世界 500 強企業。
與此同時,通過與實驗、測量、可視化和控制系統的結合,中科院過程工程所研究人員還建立了全球首套虛擬過程工程的示范系統,即通過人機界面輸入的操作指令可同時作用于實驗裝置和模擬系統,改變各自的操作狀態,從而在可視化系統中直觀在線地對比兩者的行為。由此在國際上首次實現了對中試規模化工裝置的準實時模擬,展示了過程工程研發模式變革的廣闊前景,引領了這一領域的發展趨勢。
在這些應用的基礎上,進一步明確了在計算機體系結構和芯片設計層面實現 EMMS 范式的技術方案。該方案明確了多尺度模擬中不同算法與操作的計算、存儲和通信特征,歸納了該范式下典型的穩定性條件求解、連續介質模型和離散單元演化模擬的算法特征,并提出了相應的多尺度體系結構。為驗證該方案,借用 Intel M IC 多核處理器實現了 CPU-M IC-GPGPU 節點內耦合的緊密三層結構(圖 1)[7,8],并以此升級了既有系統,初步展示了未來徹底基于 EMMS 范式的多尺度超級計算模式的優勢與可行性(圖 2)[7]。近期中科院過程工程所與國家并行計算機工程技術研究中心正合作探索這種計算模式的硬件實現方案,并取得了進展(圖 3),有望進一步開發針對介尺度計算的新型處理器。
4.1.2基于自主處理器的高效能計算機系統
近年來,國家并行計算機工程技術研究中心在承研國家“863”計劃項目“基于自主處理器的高效能計算機系統研制”過程中,面向聚變與裂變能源、真實飛機外形全流場計算和優化設計、新藥研發和蛋白質折疊、大型工程設備結構力學分析、數學工程等國民經濟與國防重大挑戰性應用需求,以領域應用算法和計算模型為導向,采用面向多目標優化的平衡結構設計方法和多因素相結合的設計優化方法,創新提出了多態多尺度自適應體系結構,在系統內部的不同尺度融合了多種計算形態,可以根據不同領域高難應用的需求,靈活構造計算規模,整合計算形態,優化計算效率。

圖1 Mole-8.5E 系統的三層結構節點圖[7,8]

圖2 模型-軟件-硬件結構一致性原理圖[7]

圖3 神威·太湖之光計算機系統
多態多尺度自適應體系結構支持在多個尺度上實現異構,包括處理器內部、處理器之間、節點之間以及系統級的異構等。其中,在處理器內部支持主從異構;在處理器/節點間的異構,支持國產多核/眾核處理器、商用多核/眾核處理器、GPGPU 等不同處理器的透明共存;系統級異構,支撐各種高性能計算機系統的無縫耦合。該體系結構能夠充分發揮不同類型處理器、節點、高性能計算系統的優勢,根據應用需求和多目標優化實現快速靈活地部署。同時,系統通過虛擬化操作系統、面向領域典型應用和機器結構的編譯優化技術、自適應精細平衡調度等實現應用的高效自適應部署,在充分發揮系統性能的同時,最大程度實現底層異構結構對用戶的開放。
該項目使用自主眾核處理器的技術路線,通過片上集成大量精簡計算核心,實現相對商用處理器更高的計算能力;通過針對應用特征進行處理器結構優化,使眾核處理器更為節能高效;通過在國產處理器設計中提供對國家重大應用的共性支撐,大幅度提高應用效率。目前,該項目實現的超級計算機系統無論在峰值性能、實測性能和性能能耗比等關鍵技術指標上都已經達到國際領先水平。
4.2 多尺度計算模式
基于以上探索,已經可以提出具有足夠普遍意義的多尺度計算模式以支撐未來高效超級計算系統的開發。而此類系統不僅能夠顯著提高實際運行效率與可用性,也將具有普遍性,為我國超級計算的全面跨越發展提供重要機遇。
中科院過程工程所和國家并行機算計工程技術研究中心兩方面的探索分別從物理模型和硬件結構方面表明:計算對象、模型、軟件和硬件的結構和邏輯一致性應當是未來超級計算發展的重要方向,具有廣闊的發展空間,兩者的結合有望帶動甚至引領未來超級計算的發展。特別值得注意的是,在自然界及工業系統中,多尺度結構與行為具有相當的普遍性,這是物質世界的層次結構決定的。因此,根據上述原理,具有多尺度結構的超級計算系統具備天然的普適性。這些共性應當引起更大關注。
總體而言,具有多尺度結構的復雜系統中各部分或單元間的作用方式,從宏觀到微觀逐漸趨于簡單,能夠被更加清晰與可靠的數學模型描述(盡管很多微觀運動的模型還不成熟,然而一旦建立,其準確性是毋庸置疑的)。但隨著尺度的縮小,對應的部分或單元的數量急劇增加,相應的直接模擬的計算量也急劇增加,甚至達到理論上也不可計算的程度。
幸運的是,基于EMM S范式對越來越多的系統的研究表明,至少就經典的力學和傳遞、反應行為而言,通過引入穩定性條件可以在介于基本單元與系統整體的某個“介尺度”上建立一種“粗粒化”的離散模型,從而以足夠的精度表述該尺度以上的系統行為,并且這些粗粒化離散單元間的作用是局部的和可加的,也是可計算的。同時這些單元的運動還滿足整體穩定性條件的約束,通過求解該條件可直接預測系統的整體行為,從而簡化和加快粗粒化離散單元的演化計算。
如果充分利用這些復雜系統的共性,可以建立針對其演化模擬的高效超級計算系統,即通過大量簡單的具有局部數據交換通道的計算密集處理單元建立高度可擴展的底層離散單元模擬子系統,而通過若干層次具有更高全局數據交換速率和復雜指令處理能力的處理單元陣列提供穩定性條件求解子系統。各層處理單元間通過共享存儲或通信網絡實現樹狀的連接。越高層次的處理單元越少但復雜性越高。這種體系結構能充分貼合所解算問題的特征,降低系統整體的復雜性并提高其實際使用效率。盡管各層次更具體的結構形式和不同層次間的配比還需要根據具體的應用需求來優化與確定,這些結構特征是普遍適用的。同時通過軟件與硬件的緊密耦合并利用可重構硬件等技術,還可以進一步優化對具體計算任務的執行效率,充分體現EMMS范式結構一致性和多層次處理的優勢。
我國超級計算的發展要以應用為牽引,充分重視學科交叉合作,繼續推進自主超級計算機體系結構創新和系統研制;應以解決重 大問題為目標,繼續加大對高性能計算應用軟件研發的支持力度,為提升高性能計算應用水平打下基礎。
(1)大力推進以領域應用為牽引的新型計算機體系結構研究和系統研制。基于上述分析,超級計算應該作為國家科技和經濟社會發展的一個優先領域繼續給予長期大力的支持。特別應該對我國面向應用需求自主提出的體系結構給予更大關注——成立論證小組,通過預研項目系統總結既有成果,確定系統的邏輯結構,并經仿真系統的初步測試,論證項目整體設計的可行性。在此基礎上,組織國內不同領域超級計算應用的研究單位和人員,對各自的應用特征進行深入的調研分析,細化對計算對象、模型、軟件結構的分析,形成完整、系統而定量的結論,為通用硬件系統的設計提供可靠數據。同時組織硬件開發領域的相關單位(計算機與微電子等方面)開展相關硬件技術的調研與預研。在各方準備充分后,適時啟動國家重大專項,聯合國內相關單位研制高效能 E 級超級計算機系統,同時開展大規模應用準備,實現同步驗收。
(2)以解決重大問題為目標,繼續加大對高性能計算應用軟件研發的支持力度。國家要切實加大對高性能計算應用軟件研發的支持力度,選擇重要的應用領域,建立長期的高性能計算應用軟件發展計劃。不僅在超級計算機研發過程中要同步開展應用軟件的開發,更要在機器使用的全生命周期內持續開發應用軟件,逐步改變我國大型并行應用軟件依賴外國的被動局面。高性能計算應用軟件的研發也要突出多學科的協作,以提高大規模并行軟件的技術水平。
總之,如果能夠在計算機體系結構和應用模式上進行源頭創新,突破計算效率、功耗、可靠性等技術瓶頸,實現我國核心元器件(處理器芯片)的完全自主可控,我們就一定能在超級計算機技術領域趕超世界領先水平。多尺度計算方法與計算機體系結構是其中重要而有效的切入點,并且我國在這方面已經形成了優勢與特色,應當予以充分重視。以此為基礎,國家可以在戰略發展領域形成一大批有重大影響的應用范例,使我國高性能計算應用水平邁上新的臺階,最終為解決國家經濟建設、科技進步、國家安全等一系列重大挑戰性問題作出貢獻。
1 Report to the President on Com putational Science: Ensuring America’s Com petitiveness, 2005. [2016-2-20]. https:// www.nitrd. gov/Pitac/Reports/20050609_ computational/ computational.pdf.
2 Ashby S, Beckman P, Chen J, et al. The Opportunities and Challenges of Exascale Computing. The ASCAC Subcomm ittee on Exascale Computing, USA, 2010.
3 Top500 supercomputer sites. [2016-2-20]. http://www.top500. org/
4 Li J H, Ge W, Wang W, et al. From M ultiscale Modeling to Mesoscience. Berlin: Springer, 2013.
5 Ge W, Wang W, Yang N, et al. Meso-scale oriented simulation tow ards virtual process engineering (VPE) — The EMMS Paradigm. Chemical Engineering Science. 2011. 66, 4426-4458.
6 Wang X, Ge W. Chapter 5: The M ole-8.5 Supercomputing System. In: Vetter, J. S. eds. Contem porary High Performance Computing from Petascale tow ard Exascale. Boca Raton:Chapman & Hall / CRC, 2013.
7 Ge W, Lu L, Liu Sh W, et al. Multiscale discrete supercomputing - A game changer for process simulation? Chemical Engineering Technology. 2015. 38, 575-584.
8 Li B, Zhou G F, Ge W, et al. A mu lti-scale architecture for multi-scale simulation and its application to gas-solid flows. Particuology. 2014. 15, 160-169.
葛蔚中科院過程工程所研究員,博士生導師。1970 年 3 月出生,浙江杭州人。現任多相復雜系統國家重點實驗室主任,“多尺度方法與介尺度科學”創新研究團隊首席科學家,研究所學術委員會、學位委員會委員,中國顆粒學會理事,Chemical Engineering Science、《過程工程學報》《化學反應工程與工藝》《計算機與應用化學》《數值計算與計算機應用》編委;Particuology 顧問。1992 和 1998 年先后在哈爾濱工業大學熱能工程專業獲工學學士和博士學位。曾獲國家自然科學基金委杰出青年基金,周光召基金會首屆“杰出青年基礎科學獎”、中國顆粒學會“寶潔青年顆粒學獎”、中科院首屆超級計算應用獎及中科院“先進工作者”稱號。主要研究對象為氣固、顆粒與散料、多孔介質及納微多相系統,內容包括流動、傳遞、反應及其耦合過程的介尺度機理與多尺度建模、分子模擬及離散-連續耦合模擬、高性能計算及其工業應用。提出并發展了擬顆粒模擬,以此揭示了氣固流態化、氣液鼓泡流動和微流動等系統中多種控制機制協調形成穩定性條件的機理,檢驗并擴展了多相復雜系統極值型多尺度方法。主持研制了效能比位居世界前列的 Mole 系列千萬億次多尺度超級計算軟硬件系統,并由此建立了以實時模擬、顯示和人機交互為特征的虛擬過程工程能力。先后主持國家自然科學重點基金、國家科技支撐計劃和國家重大科研裝備研制項目。相關研究成果已有效服務于所主持的中石油、中石化、寶鋼、殼牌石油、必和必拓、通用電器、阿爾斯通、聯合利華等世界500強企業的工業項目。已發表期刊論文 140 余篇,主持譯著 2 本、編著 4 本及 20 余章節。多次在 CHISA,ISCRE,WCPT 等國際會議作 Plenary 或 Keynote 報告。E-mail: wge@ipe.ac.cn
Ge WeiBorn in 1970, got his B. Sc. in 1992 and then Ph. D. in 1998, both from Harbin Institute of Technology, China. He has been professor of chem ical engineering at Institute of Process Engineering, CAS since 2006. He is mainly engaged in multi-scale simulation of particle-fluid two-phase systems. As project leader, he developed the Mole series multi-scale supercomputing systems to bridge simulation of molecular details to reactor performance. He authored over 140 journal papers and 4 monographs. He won the Outstanding Youth in Basic Science Award of Zhou Guangzhao Foundation in 2008, the P&G Outstanding Youth in Particuology Award of Chinese Society of Particuology in 2011 and the National Science Fund for Distinguished Young Scholars in 2012. He is associate editor of Chemical Engineering Science, council member of The Chinese Society of Particuology, and advisory board member of the international journal Particuology. E-mail: wge@ipe.ac.cn
郭 力男,中科院過程工程所研究員、中國科學院大學兼職教授。山東省濟南市人,1966年出生。1981年考入中國科技大學第五期少年班,1986年畢業于中國科學技術大學計算機科學與技術系,1989年在中科院過程工程所獲工學碩士學位。曾主持中科院院長特別支持項目、國家自然科學基金委重點基金項目、面上基金項目、中石化信息化項目,參與多項中科院創新研究項目、國家自然科學基金委重大研究計劃子項目、國家自然科學基金委重點基金項目、基金項目等。獲中科院科技進步獎二等獎和三等獎各一項,北京市科學技術進步獎三等獎一項。發表科技論文及報告80余篇,作為第一作者出版專著2部,作為第二作者出版專著1部,與他人合作出版譯著1部。曾獲國務院政府特殊津貼和中科院盈科優秀青年學者獎。E-mail: lguo@ipe.ac.cn
Guo LiMale, born in 1966, has been the professor of Institute of Process Engineering, CAS since 1997, is also the professor of University of Chinese Academ y of Sciences. He was admitted to Special Class for young gifted student of University of Science and Technology of China(USTC) in 1981, graduated from the Department of Computer Science and Technology of USTC and got his B. Sc. in 1986, and his M. Sc. Degree at IPE, CAS in 1989. He was a visiting scientist at National Center for Toxicological Research, FDA, US in 2004 and 2008-2009. Research interests include high performance computing, Internet chem istry & chem ical engineering information systems and text/know ledge m ining. He has published more than 80 scientific papers and three books, two as the first author and one as the second author. He also coauthored one translated book. He is an editorial board member of Journal of Computer and Applied Chemistry. He has received the State Council Special Award for Distinguished Scientists and the PCCW Award for Excellent Young Scholars of Chinese Academy of Sciences. He is also the w inner of The Second Prize and The Third Prize of Scientific & Technology Advancement, Chinese Academy of Sciences, and The Third Prize of Scientific & Technology Advancement, Beijing. E-mail: lguo@ipe.ac.cn
胡蘇太男,國家并行計算機工程技術研究中心高級工程師,1956 年 出生。長期從事計算機裝備發展戰略、計算機體系結構和情報研究工作。多年來,參加過多項國家重點型號工程預先研究工作。在國內各種報刊、會議上發表論文、報告 50 余篇,公開出版的著作有《實用網絡存儲技術》《英漢信息安全技術辭典》《超級計算機發展研究》等;曾獲省部級科技進步獎一等獎 2 項、二等獎 5 項、三等獎 5 項;獲全國優秀科技信息成果獎一等獎 1 項。
Hu SutaiM ale, born on February 1st, 1956, Bachelor's Degree, is a senior engineer at National Research Center of Parallel Com puter Engineering and Technology. His research fields include the development strategy research on computing technology and equipment, computer architecture and information research. He has participated in many national key pre-research projects and published over 50 papers and researchreports in many domestic journals and conferences for years. His major publications include Practical Network Storage Technologies, An English-Chinese Dictionary of Information Security Technology, and The Research on Development of Super Computer. He has won several provincial-level Scientific and Technological Progress Awards and also got First Prize for National Outstanding Scientific and Technological Information Achievement.
劉鑫女,國家并行計算機工程技術研究中心副研究員,2013 起擔任神威高性能計算機系統科學與工程計算應用平臺主管設計師。1979 年 6 月出生。2006 年獲中國人民解放軍信息工程大學獲工學博士學位,主要從事并行算法和并行應用軟件的研發工作。在大型并行應用軟件的多核、眾核并行算法設計和優化等方面取得重要進展。曾獲省部級科技進步獎 一等獎1 項、二等獎2項、三等獎 2 項。發表學術論文 10 余篇。
Liu XinFemale, born on July 30th, 1979, is an associate research fellow at National Research Center of Parallel Computer Engineering and Technology. She is the supervising designer of scientific and engineering application platform of Sunway supercomputer and responsible for large-scale parallel algorithm research and application software development on Sunway supercomputer. In this role, she has got a lot of progress in multi-core and many-core parallel algorithm designing and optim izations. In addition, she is the author or co-author of over 15 published papers on parallel algorithm, applications and related fields. She holds PhD degree from PLA Information Engineering University.
Thinkings on Development Strategy of Supercom puting
Ge Wei1Guo Li1Li Jinghai1Chen Zuoning2Hu Sutai2Liu Xin2
(1Institute of Process Engineering, Chinese Academy of Sciences, Beijing 100190, China;
2National Research Centre of Parallel Computer Engineering & Technology, Beijing 100190, China)
Supercomputing power has now become an important index of science and technology competitiveness of a country, and also a great support to the econom ic and social development and national security. Moreover, w ith the drastic development of Internet, big data,cloud computing, and virtual reality technologies, supercomputing w ill bring about profound changes to production and life styles of modern societies. Nevertheless, contem porary supercom puting is facing grand challenges in terms of low efficiency, high power consumption, poor robustness, and difficulties in applications. General-purpose supercomputing based on commercial processors is not likely to solve the problems completely. Based on our explorations in multiscale simulation of complex systems, we suggest that keeping the structural and logical consistency between the computed system, model, software, and hardware is an effective way towards high efficiency and scalability of supercomputing in the future. In fact, multiscale structure is ubiquitous in natural and industrial systems, which is, after all, a reflection of the hierarchical nature of the physical world and is, therefore, of general significance to a w ider range of applications. For classical mechanical and thermal processes, the computational complexity usually decreases w ith decreasing scales, while the computational cost increases exponentially. Fortunately, w ith reasonable coarse-graining based on meso-scale models, this cost can be reduced by several orders by developing additive discrete methods which can achieve good accuracy, efficiency, and scalability for supercomputing. On the other hand, computation at large scales can be accelerated by introducing stability constraints to the dynam ics models. Multiscale computer hardware conform ing to this software framework is expected to have high efficiency and speeds up the com putation even further. We have already explored the feasibility of this multi-scale strategy for model, software, and hardware developments in different applications, and have achieved very encouraging results. We suggest that this strategy should be given enough considerations in the development of future supercom puters.
supercomputing, multi-scale model, EMMS Paradigm, virtual process engineering
10.16418/j.issn.1000-3045.2016.06.004
*資助項目:中科院戰略性先導科技專項(XDA 07080 000), 國家自然科學杰出青年基金(21225628)
修改稿收到日期:2016 年6月8日