熊偉
應用帶動技術發展,是我國IT領域常見的模式。如在移動通信、電子商務等場景中,龐大的同時在線用戶數,海量的并發指令,“錘煉”出了強壯的應用系統,同時帶動相關軟硬件技術發展。市場大,用戶多,應用創新充分,原創技術相對較少,這些因素共同導致我國IT應用水平強于技術水平的普遍現象。
可是在高性能計算(即超級計算、超算)領域,情況恰恰相反,應用落后于能力。超級計算一直是計算機技術王冠上的明珠,其研制水平體現一個國家的綜合國力,其應用常常關乎關鍵武器研制,因此具有戰略意義,一直是大國競爭的舞臺。我國超算的計算能力世界領先。2017年全球超算大會揭曉的“全球超算500強榜單”中,中國的“神威·太湖之光”和“天河二號”分獲冠亞軍。“神威·太湖之光”超級計算機上使用的處理器完全由我國自主研制。此次中國超級計算機上榜總數達到202臺,占比超出500強榜單的40%,美國上榜144臺,列第二位。面向2020年,國家制定了實現E級計算的目標并開始實施。E級,意為每秒100億億次浮點運算,是現在冠軍速度的10倍以上——“神威·太湖之光”的浮點運算速度為每秒9.3億億次。
與領先的超算能力相比,我國超算應用卻并無優勢,或者說,我國超算應用尚未發揮已有的超算能力。雖然2017年11月,基于神威太湖之光的超算應用“非線性地震模擬”蟬聯“戈登貝爾獎”,但我國超算應用發展遠遠滯后于超算能力發展,是業界的共識。
國家超算濟南中心主任張云泉近日發給本刊一份政協提案,直面我國超算應用優勢不足的問題。這份提案是九三學社中央在全國政協十三屆一次會議提出的,題為《關于將超算速度優勢轉化為應用優勢的建議》(以下簡稱“提案”)。提案指出了應用發展相對滯后的原因和后果。
應用發展滯后的外部原因:國外軟件壟斷。在超算應用比較多的制造業和基礎科研等關鍵領域,大部分應用軟件都被國外壟斷。我國不僅支出巨額軟件采購費用,軟件升級還受制于外方。比如航空系統,一年花費兩億多元進口應用軟件,“有的軟件只是在原軟件的基礎上‘改一改、升升級,就得花費幾千萬元”。
應用發展滯后的內部原因之一:建設思路“應用置后”和“重硬輕軟”。歐美國家一般根據實際應用需求,針對性地研制超級計算機和超算軟件,我國則先重視發展超算計算能力,后考慮實際應用。研發投入方面,則軟件經費嚴重偏低,約占20%或30%,“我國正研發的幾十個超算應用軟件,一半以上與制造業有關,既能大幅推動制造業發展,又能促進超算有效利用,但項目審批時,經費經常被大幅削減”。歐美國家則不同,以美國能源部為例,該機構對超算軟、硬件的投入大致各占一半。
應用發展滯后的內部原因之二:研究力量不足。一方面超算軟件研發力量分散,國家實驗室少,未形成合力。另一方面軟件人才嚴重匱乏,高校相關人才培養體系、培養計劃和課程設置落后于超算應用領域人才需求;同時,由于科研評價、待遇等方面問題,應用軟件研發人才頻繁“跳槽”。
應用發展滯后的后果:超算利用效率低。國內用于科學計算研究的超級計算機不到40%,用于金融業和制造業的比例也偏低。提案舉例:科技部通過一系列重點研發計劃,在重點應用領域部署了一系列課題進行幾十萬核乃至百萬核并行算法與軟件研制的重點突破,但目前運行的大部分作業,其并行規模仍停留在幾千或幾萬個處理器甚至更低的量級,沒有充分發揮出億億次超級計算機上并行的能力。
為解決我國超算應用發展滯后的問題,提案列出四項建議。
一是成立若干國家級超級計算并行應用軟件行業工程中心。制定我國超級計算機應用中長期研究規劃和路線圖;當前應著力開展艾級應用相關的基礎問題和關鍵共性技術研究。
二是轉變“重硬輕軟”思維,持續穩定支持超算應用軟件研發。調整財政支出結構,統籌協調全國超算研制計劃和經費安排,軟硬件經費投入比盡量做到1:1。
三是鼓勵超算中心聯合應用部門組建聯合實驗室。實驗室主任由應用方的學科帶頭人擔任,超算中心提供高性能運算支持并指導或協助進行程序移植,自主研發大型并行應用軟件,并通過應用在用戶中培養人才。
四是重視計算科學學科建設和人才激勵機制。推廣“超算理論+多學科應用”課程,促進超算領域多學科交叉融合。對高水平軟件科研人員實行兼職兼薪、協議薪酬等模式;采取內外部結合的評價機制,給予軟件研發人員公平公正的評價和職務晉升通道。
我國超算應用落后于能力的現象已經公開討論并就此形成了各種意見,九三學社中央提出的這份《關于將超算速度優勢轉化為應用優勢的建議》體現了其中的一部分。問題是否會得到解決?張云泉接受本刊采訪時說:“高性能計算是科技創新核心競爭力的重要方面,是推動國家安全與發展的強力引擎,為解決國家安全、技術創新、經濟發展和社會進步等一系列重大挑戰性問題提供了不可替代的重要手段,國家一定會重視目前存在的應用滯后等問題。既然我們能反超美國,建立起超算能力優勢,相信經過努力,假以時日,一定也能建立起超算應用優勢。”