◎實習記者郭付強
在2010超級計算國際會議上,中國國防科學技術大學研制的“天河一號”二期系統,以峰值速度4700萬億次、持續速度2566萬億次每秒浮點運算的優異性能,在國際TOP500組織正式發布的第36屆世界超級計算機500強排行榜上,位居世界第一。中國,這個有著“算盤王國”之稱的國度,因為“天河一號”神奇的運算速度,首次站到了國際超級計算機世界之巔。消息傳來,“天河一號”的總設計師楊學軍抑制不住內心的喜悅,即興題詩一首:“夢幻天河彈指間,電閃巡地十億年。濱海坐擁飛流急,倚天妙算出奇篇!”
1983年11月,中國首臺“銀河-I”億次巨型計算機在國防科技大學研制成功,實現了中國巨型機“零”的突破。這促使楊學軍報考國防科大的研究生,從事中國高性能計算機的研制。楊學軍在國防科技大學先后獲得碩士、博士學位。他寫的一篇關于向量巨型機編譯技術的研究生畢業論文,曾獲得“銀河-I”總設計師慈云桂教授的青睞。畢業留校后,楊學軍很快成為一名出類拔萃的技術骨干。在“銀河-Ⅱ”十億次巨型計算機研制時,他作為一名技術人員參與了研制工作,并得到總設計師周興銘的親自指點。
1992年“銀河-Ⅱ”研制成功,不久,“銀河-Ⅲ”立項上馬。學校宣布任命楊學軍為“銀河-Ⅲ”高性能計算機的總設計師。那一年,楊學軍才31歲!總設計師是高性能計算機研制中的“靈魂”人物,學校卻將“銀河-Ⅲ”百億次巨型計算機總設計師的擔子交給這位31歲的年輕博士。雖然在楊學軍的身后有周興銘、盧錫城等他所敬重的專家教授,有一批支持他的學長、同事,還有在研制“銀河-I”、“銀河-Ⅱ”的技術積累和工程經驗,但對于這個決定,楊學軍仍感到十分意外。
當時,“銀河-Ⅲ”面臨兩個挑戰:一是科研隊伍正值換代期;二是技術難度大。令人欣喜的是,楊學軍沒有辜負領導和導師們的期望,出色地完成了作為總設計師應該完成的任務。1997年,中國第一臺“銀河-Ⅲ”百億次巨型計算機研制成功,這是“銀河”系列第一臺實現全局共享分布存儲結構的計算機,也是“銀河”系列研制周期最短的一臺機器,從而實現了中國巨型計算機研制路線從向量計算到并行計算的轉變,峰值速度實現了從每秒十億次到每秒百億次的突破,極大地縮短了中國巨型機研制與發達國家的差距。隨著“銀河-Ⅲ”百億次巨型計算機研制成功,楊學軍也成為中國高性能計算機研制的領軍人物。
創新沒有止境。“銀河-Ⅲ”百億次巨型計算機研制成功后,楊學軍率領團隊不斷開拓創新,一步步將中國高性能計算機研制技術推向了國際前沿,有多項技術創新處于國際領先水平。
2005年,著眼突破千萬億次超級計算機關鍵技術,楊學軍將國際上公認的主要技術難題作為創新的突破口,在團隊中成立多個課題組,組織精干的技術力量,針對高性能計算發展的前沿技術、關鍵技術和新興交叉技術等方面開展基礎研究和前沿探索,相繼突破了大規模可擴展共享存儲體系結構等一系列技術難題,掌握了一批擁有自主知識產權的關鍵技術,從而為研制更高性能的超級計算機奠定技術基礎。
2006年,在國際超級計算機速度還未實現千萬億次,國產超級計算機才剛剛突破10萬億次之時,他們勇敢地站在了突破千萬億次超級計算機系統起跑線上。
2007年11月,美國IBM公司“走鵑”問世,峰值計算速度達到每秒1456萬億次,而此時,楊學軍率領團隊也完成了千萬億次超級計算機系統的相關技術攻關。
當中國將發展千萬億次超級計算機系統列入《國家中長期科學和技術發展規劃綱要》,楊學軍團隊憑借充分的技術儲備和可行的研制方案,順利獲得國家“863”計劃重點課題和國家自然科學基金委創新群體項目的支持,研制工作再次提速。
在研制攻關過程中,楊學軍與團隊創造性地提出了多陣列、可配置、協同并行體系結構,將全系統分為計算陣列、加速陣列、服務陣列,通過實現“CPU(通用微處理器)+GPU(圖形加速處理器)”的異構協同計算,最大限度提高計算效能、降低能耗、減少費用、加快進度。他帶領科研人員在經過了8萬多次實驗后,終于發現了GPU的內在規律,采用混合語言編程技術,通過融合多種計算資源并對其靈活配置,深入挖掘GPU的并行計算潛力,最終實現了高效異構協同運算,使GPU的計算效率由20%逐步提升到70%,創造了一個世界奇跡。
與此同時,其他課題組在楊學軍的帶領下相繼突破了高速率可擴展互連通信、高效異構協同計算、基于隔離的安全控制、虛擬化的網絡計算支撐、多層次的大規模系統容錯、系統能耗綜合控制等一系列關鍵技術。2009年10月29日,中國首臺千萬億次超級計算機系統在國防科大橫空出世,使中國成為繼美國之后世界上第二個能夠自主研制千萬億次超級計算機系統的國家。
經過一年的連續奮戰,楊學軍率領團隊突破了多核多線程系統架構技術,自主研制了64位8核“飛騰—1000”通用CPU,解決了超級計算機CPU間高速高效互聯通信等世界級技術難題,使“天河一號”的峰值速度提高了2.89倍,持續速度更是提高了3.55倍,最終榮膺世界第一。如今,安裝在國家超級計算天津中心“天河一號”,先后為70多個單位提供了超級計算服務。
2007年盛夏,大洋彼岸的美國圣地亞哥。第34屆“國際計算機體系結構年會”在此召開,“天河一號”總設計師、國防科技大學楊學軍的《64位流處理器體系結構研究》論文,引起與會專家學者的高度關注。
因為該領域的專家學者從這篇論文中,看到了突破更高性能計算機的希望——采用“異構協同計算技術”來設計千萬億次超級計算機系統。
在此半年前,楊學軍發表的《容錯并行算法:基于并行復算的故障恢復》論文,被第16屆國際并行體系結構和編譯技術大會錄用。這也是自1993年以來該會議首次錄用由中國大陸科研單位獨立完成的學術成果論文。
多年來,楊學軍在敏銳捕捉國際高性能計算研究契機的基礎上,組織吳俊杰所在的博士生基礎研究課題組大膽嘗試了“統一目標、集體攻關”的組織方式。圍繞大目標進行任務分工,集思廣益、共同攻關,這使得原始創新思路在理論體系建立、形式化證明、實驗驗證等各個環節都能做得很充分。在成果逐步成熟的時候,課題組成員又分工負責共同撰寫高水平學術論文,參加國際高水平學術會議。
2011年,楊學軍獲得何梁何利科學技術成就獎,并當選為中國科學院院士。如今,已擔任國防科學技術大學校長的楊學軍,在謀劃學校全面建設發展的同時,率領團隊為中國高性能計算機技術的發展奮力攻關。據悉,目前國防科大已部署開展萬萬億次超級計算機系統的關鍵技術研究,楊學軍率領的團隊正向著新的世界科技高峰攀登。