宋辰
除了與計算、智能計算,如今高性能計算又有了量子計算、類腦計算、三元計算、邊緣計算等,計算需求的大爆發催生了不同的計算形式。
“在傳統的計算時代,曙光做的事情相對比較簡單,我們主要是做機器。現在,曙光從賣硬件到了關注服務。”中科曙光副總裁,中科院先進計算技術創新與產業化聯盟秘書長任京旸在“第13屆全國高性能計算學術年會”(HPC CHINA 2017)后的采訪中提到。
隨著高性能計算多元化時代的到來,中科曙光從兩年前開始了在高性能計算服務領域的探索。2015年11月推出了EasyOP在線運維平臺,這是基于曙光Gridview集群管理體系為高性能計算領域量身打造的在線運維平臺,為客戶數據中心資產提供全生命周期管理服務,和7×24小時全程專家支持的自動化運維平臺;實現基于“互聯網+”模式下的高性能計算生態圈,為用戶提供一站式高性能計算SaaS平臺。
平臺成立22個月以來,已經為80多個用戶提供了高性能計算運維方案。目前 ,EasyOP 監管的節點規模超過一萬個,對接入集群的各個節點覆蓋了超過180項的監控指標,這些指標包括硬件的、環境的、軟件的、應用的等等。截止到目前,EasyOP平臺已經為750萬個大小作業提供了各類支持服務,其中40%以上提供了針對應用特征的優化,并在CAD、氣象、海洋、物理、生物、高分子、深度學習等7個領域做了深度優化。
近日,在HPC CHINA 2017上,曙光與中國科學技術大學(以下簡稱“中科大”)就建立“EasyOP高性能計算在線服務平臺(安徽分中心)”(下簡稱“安徽分中心”)舉行授牌儀式。EasyOP安徽分中心的落成,不但能夠為安徽省重大工程中高性能計算基礎設施的后期運維與管理提供高效的工具,還將幫助中科大降低當前和未來集群使用過程中的運維壓力,有力支持安徽省新支撐體系建設的戰略。
2016年初,EasyOP平臺開始為中科大的各個科學院課題組做運維服務,“一個是可以根據需求靈活定制一個運維方案,第二個是提供不同層級的專業HPC的專業運維服務。”曙光EasyOP產品總監首席運維架構師安磊說,“我們希望通過這種手段逐步把EasyOP變成面向HPC用戶的綜合性的管理運維跟運營平臺。”
“突破E級計算機核心技術”,構建高性能計算應用生態環境,建立具有世界一流資源能力和服務水平的國家高性能計算環境,促進我國計算服務業發展被寫入“十三五”國家科技創新規劃規劃。
現在有云計算、高性能計算、異構計算,甚至未來會有類腦計算、量子計算,各種豐富的計算方式可能都會融入大規模的并發集群計算體系架構中來。隨著交互方式的改變,高性能計算的服務方式也在發生改變。以前大部分都是個人使用的HPC,集群放在一個小型的團體或者個人的研究所里使用。現在,慢慢衍生出來專業的超算中心提供運維的規模集群共享式的服務。“在先進計算時代、多元計算能力融合的背景下,服務能力變得尤為關鍵,一旦綜合服務能力跟不上,就有可能給整體項目的實施造成瓶頸。”任京旸說。
在高性能計算領域,曙光認為將會出現以下五個新的趨勢。
第一,先進計算資源的分布會向中西部地區進一步演進。隨著國家解決區域之間、行業之間等諸多的不平衡,未來幾年里大家可以很快看到在中西部地區計算力量的崛起,中西部地區有可能采用一些更新的技術,甚至在中西部有的擬新建的計算中心里面會看到多種計算形式的并存率先融合起來。
第二,傳統的超算中心今年有可能面臨新的挑戰,超算服務的新業態會隨著互聯網玩家的進入而產生。
第三,多元和融合將會成為先進計算發展的主流。
第四,人工智能、量子計算、類腦計算這些新的領域里面我們國家有可能實現彎道超車。
第五,中國的計算能力會沿著“一帶一路”向外輸出。硬件、軟件加服務三塊融合起來,使我國的先進計算能力走向世界成為一種可能。endprint