眾所周知,超級計算(又稱高性能計算,簡稱“超算”)是一個國家綜合國力的體現,是支撐國家實力持續發展的關鍵技術之一,在國防安全、高科技發展和國民經濟建設中占有重要的戰略地位。
近年來,隨著人工智能、大數據、云計算技術蓬勃發展,超算的應用范圍不斷拓展。舉例來說,人類對世界的感知越來越多,在不同領域的活動也都留下了數據軌跡,產生了多維、多領域的數據綜合關聯分析需求。而云計算使得計算設施隨時可得,大數據驅動了人工智能,GPU使計算能力產生了巨大的跨越,從而使分析能力的飛躍成為可能。
在人工智能時代催生新計算需求的同時,海量的數據分析和通信也在挑戰著傳統的超算系統架構和設計。可以說,人工智能時代信息處理需求也為智能超算平臺體系架構的設計,帶來了新的創新和變革機遇。
有數據顯示,2018年全球人工智能算法論文40%為中國人所寫。2017年7月20日國務院發布了中國的人工智能戰略,人工智能已經成為國家戰略。而中國又被譽為擁有龐大的人工智能市場。在這樣的背景下,被譽為“國之重器”的超算和人工智能相結合會給我們的經濟社會帶來怎樣的變化?
應用牽引技術發展
在過去四十年里,超算幫助人們解決了從宇宙天體到蛋白質分子一系列非常復雜的模擬問題。如今,超算面向生物醫藥研制、人工智能醫療領域的成效越來越凸顯。以全基因組信息關聯性分析為例,之前需要幾年的時間進行分析,采用超算后可以將時間縮短為10小時。而在基因測序分析選擇靶向藥物用于靶向治療上,則可以將時間縮短到30分鐘。
隨著大數據、人工智能對超算的需求越來越強勁,可以說人工智能讓超算從高大上的科學領域擴展到了和人們生活息息相關的應用領域。
8月31日,以“突破算力 決勝未來”為主題的2018聯想全球超算峰會在京召開。本次會議上,國家863、973計劃重大專項組組長錢德沛教授表示,高性能計算是解決重大挑戰性問題的重要手段,是促進國家經濟建設、社會發展和科學研究的利器。“我相信在未來我們會越來越多地看到人工智能、大數據對于高性能計算帶來的深遠影響,無論是在體系結構、實現技術還是在應用、算法方面,我們將不斷地看到三者融合發展的實力。”
聯想集團高級副總裁、數據中心業務集團中國區總裁童夫堯也表示,HPC的應用主要有兩個方面,一方面是傳統的高大上的科學領域。另一方面是跟老百姓生活密切相關的人工智能技術帶來的超算需求。
對此,中國工程院院士、天河一號和天河二號總設計師,國防科技大學計算機學院院長廖湘科表示,高性能計算本身為人工智能的崛起提供了一個新的計算引擎,而大數據和人工智能也牽引著高性能計算呈現了很多新的形態。人工智能需要超算作為后臺進行越來越強大的模型訓練、智能推理、關聯分析,導致超算除了用于科學工程計算領域,應用范圍越來越多元化。
因此,他認為未來高性能計算需要融合發展。首先,高性能計算本身必須要擁抱新的需求,不僅要支持計算科學,也要支持數據科學和智能科學。由于超算本身需要巨大的投入,需要巨大的市場回報才能促進超算良性發展,在應用領域的探索就顯得更加重要;其次,在未來的發展趨勢上,HPC異構融合結構一定會成為首選。特別是在用戶范圍擴大的情況下,要注重易用性和平臺設計。HPC今后的軟件站一定是能支持科學與工程運算、智能科學運行環境、大數據運算能力的統一運行平臺。
同時要補齊國產超算的工程計算短板,建立協調發展的HPC工作環境。其中包括四個要素,第一是平衡計算的柔性設計,達到計算能力、通訊能力、I/O能力平衡;第二必須要進行應用領域的模型數據算法的研究;第三要有易用的平臺化應用軟件;第四要發展學科交叉,多個學科協調發展。
國家超級計算廣州中心主任盧宇彤表示,近些年超算向以應用為中心的趨勢發展,讓更多行業的人能夠更方便地使用超算成為超算發展的新方向。只有把應用群體擴大,技術才能夠進入良性的循環軌道。
由于超算系統越來越復雜,應用需求也在不斷變化,傳統的編程軟件已經不能滿足更多應用的需求。在應用軟件的研發上超算中心會扮演非常重要的角色,超算中心要搭建軟件平臺,建立起應用和系統之間的橋梁。
今后,除傳統的大氣,海洋,能源CFD的高性能計算應用領域外,人工智能帶來的超算應用會越來越多。兩者可以互相影響,相輔相成。“在廣州超算中心,原來做超算和做人工智能的兩個團隊之前交互不多,隨著近幾年GPU出現以后交互開始增多。很多超算中的經驗可以被人工智能的算法和應用借鑒,比如稀疏矩陣、數據庫等已經在超算中持續優化多年的領域,可以讓人工智能使用者更方便地使用。”她說。
盧宇彤表示,在應用牽引技術發展的道路上,中國走得比國外要早,需求也更多。現在整個超算技術的發展中,并沒有哪個國家擁有成熟的解決方案。中國的超算從業者應該抓住發展的機會,形成合力,發揮各自的優勢,在體系結構和軟件方面有所突破。
值得注意的是,在人工智能與超算共同發展的過程中,還有短板需要補齊。中科院計算所研究員博士生導師、國家超級計算濟南中心主任張云泉表示,人工智能要發展需要補齊三個短板,一是人才,二是生態系統,三是超算應用軟件。
對此,盧宇彤也表示,交叉學科的人才短板和軟件生態的構建或許會成為制約未來發展的瓶頸。需要大家在軟件生態構建方面改變認識,特別是在基礎處理器和基礎軟件上加大投入。
降低企業應用門檻
雖然超算已經走出科學計算的單一領域,但在企業級應用領域還處于初級階段,有很多問題需要解決。
盧宇彤透露,經過廣州超算中心這幾年在應用方面的拓展,發現企業級用戶的入門門檻較高。其中最重要的就是軟件平臺的搭建,尤其是工業制造領域,包含仿真、前處理、中間計算模擬、后處理等環境,非常復雜。因此,盡管超算在企業級應用領域未來的需求市場非常龐大,但市場究竟如何發展還依賴于軟件發展情況。為此,廣州超算中心去年發布了“天河星光”云超算平臺2.0。該平臺集成基礎設施服務、高性能與可視化、大數據與深度學習,以及數據快傳、冗余備份、數據管理等增值服務的多元化功能,支持跨軟件、跨領域的耦合工作流,搭建以應用為中心的協同開發、運行環境。
對此,聯想數據中心業務集團中國區方案營銷總監李煒舉了幾個聯想在企業級應用領域的應用案例,包括和中國電力研究院進行的電力調度和用戶使用仿真模擬方面的人工智能應用,和中國大熊貓繁殖基地合作的利用人工智能場景遠程觀察大熊貓,以及快速人臉識別,模擬語音在汽車導航領域的應用等。
除軟件平臺外,降低企業級用戶的超算入門門檻,還需要降低其操作的復雜性。聯想集團副總裁、高性能計算及人工智能事業部總經理Madhu Matta表示,聯想提供的整套人工智能解決方案可以讓算法和開發、應用程序更加地簡單。聯想為此整合了所有工具和生態系統中產業鏈的所有合作方,讓客戶只需要面對聯想就可以按照自己的需求,在云端和本地輕松部署人工智能解決方案。Madhu強調其中的重點是協同,使所有的軟件在硬件之上協同應用,方便用戶可以迅速搭建起深度學習的能力。
“目前我們在人工智能方面的工作清單非常之長,包括在巴塞羅那用AI算法來做癌癥的診斷和治療,還有水利及制造業的質量控制。我們的目標是成為一個端到端的方案供應商,為用戶提供工具,幫助用戶快速地開發出算法。”Mahdu說。
在研發上,聯想已投入12億美元,分別在美國莫里斯維爾、德國斯圖加特和北京建立了三個新的人工智能創新中心,并依靠一支由業界一流專家組成的AI研發團隊,全面發展面向行業的人工智能系統。同時,聯想通過控股、參股的方式,進一步加強與各領域合作伙伴的密切聯系。在硬件層面繼續加深與Intel、NVIDIA、Mellanox等廠商的合作;在軟件層面主動開放生態系統,吸引主流軟件廠商加入聯盟。在應用層面,聯想創投投資了Face++、銀河水滴科技等有潛力的科技創新公司,力爭打造HPC+AI的完整生態圈。活動當天,聯想正式發布了自主研發的AI產品家族,其中包括專為HPC和AI優化的全新人工智能服務器Think System SR670、Think System HG680、Think System HG690;全新的LiCO GENE Edition;此外,聯想還推出第三代溫水水冷解決方案“海王星”系統,其中包括Direct-to-Node溫水水冷技術、后門熱交換器、以及由空氣和液體冷卻組成的混合冷卻技術,使數據中心的運行效率提升高達50%。