石菲

4月27日,由中國計算機學會主辦的“超級計算機并行應用大會”在無錫開幕,在此次會議上,國家超算無錫中心發布了“神威社區”和“無錫超算云平臺”,期待營造高性能計算生態,攜手更多應用單位推動超算技術與產業發展的深度融合。
在實現“世界最快計算機”四連冠后,“神威.太湖之光”把更多的資源投向應用領域。去年,國家超算無錫中心用戶數量超過300家,主機賬號1500多個,支持包括紫金山天文臺、遠景能源集團、中船重工702所在內的江蘇省用戶超過50家,在全球氣候變化及應對、高性能計算、材料基因工程關鍵技術與支撐平臺、政府間國際科技創新合作、重大自然災害監測預警與防范等重點專項上,取得一系列新突破。
眾所周知,我國超算的計算能力世界領先。但與領先的超算能力相比,我國超算應用發展遠遠滯后于超算能力發展。作為中國HPC的領軍企業,聯想集團正在致力于打造HPC全生態。
2017年10月19日,2017年全國高性能計算學術年會(HPC China 2017)在合肥開幕,聯想數據中心業務集團全球高性能計算高級總監Scott Tease在會上表示,聯想在HPC領域耕耘數十年,已獲得了一定成績。而隨著高性能計算逐漸從科學研究向商業化應用轉移,并在人工智能、云計算等領域得到愈加廣泛的應用,HPC的舞臺越來越寬廣,成為智能互聯時代的業務增長新發力點。在新一輪發展浪潮中,聯想致力于以AI為突破口,依托深厚的行業積累和數據中心豐富經驗,通過生態打造將HPC技術投入市場應用,將HPC最佳應用前景傳遞給客戶。
聯想的HPC集群,不僅廣泛應用于政府、教育、科研等國家投資領域,還大量覆蓋了電子、金融、地理、氣象、汽車設計等商業應用領域,體現了超大規模數據的可靠性能和整體解決方案能力。此前,聯想為中國科學院數學與系統科學研究院打造的高性能集群,實現408個計算節點、1081TFLOPS的優異性能,遠遠超出客戶三倍預期。作為國內首個高校溫水水冷高性能計算項目,聯想還采用其首創的45℃溫水水冷技術,將北京大學全新高性能計算校級公共平臺集群集群PUE值控制在1.1, LINPACK效率高達92.6%。
在人工智能火熱的當下,聯想正在與客戶合作探索人工智能的能力,以實現真正的創新研究,推動提升HPC商業及社會化成效的工作,例如尋找疾病治愈辦法以及了解氣候變化的真正影響等。
以農業為例,目前,農業用水量占全球淡水使用總量的70%,到2050年,預計仍需額外10%的水資源來加大糧食供應量,以滿足全球新增人口的需求。隨著用于農業的淡水越來越稀缺,提前發現高風險缺水地區和管理現有水資源以減少對糧食生產的負面影響至關重要。
為了應對這一全球挑戰,聯想與合作伙伴的研究人員正在進行合作,開展更深入的研究。在技術層面,通過采用支持人工智能的地理空間圖像分析流程,使用深度學習算法來發現農田、識別農作物、監測土壤狀況,并比較需水量和可用水資源,以制作出干旱地區圖。這些人工智能技術還可幫助當地和全球農民檢查農作物和土壤的健康狀況,有效管理灌溉用水和能源資源,提高盈利能力,同時保護稀缺自然資源。
此外,在助力科學研究方面,聯想也有著深厚的實戰經驗。在倫敦大學學院(UCL),研究人員正在通過在歐洲核子研究中心的大型強子對撞機(LHC)上開展的ATLAS實驗,重建高能粒子碰撞事件。LHC是世界上最大、能量最高的粒子加速器,這項工作有助于解決有關宇宙起源的一些最基本的問題。然而,LHC碰撞強度的增加給傳統模式識別技術帶來了嚴峻挑戰,所要消耗的計算資源極為龐大,使得學院難以為繼。通過與聯想合作,UCL的研究人員正在使用人工智能,利用來自ATLAS的成像數據來重建粒子軌跡,效率相比傳統方法提升顯著。這種方法不僅簡化了計算資源,還能幫助UCL推進其在重建更復雜事件方面的研究。
在國內,聯想也在為高校科研創新提供強大的技術支持與保障。
2018年1月,聯想與北京大學的高性能計算校級公共平臺正式啟用。
校級公共平臺建設是北京大學支撐前沿優勢學科發展的重要戰略部署,是學校“雙一流建設”的重要條件保障。北京大學高性能計算校級公共平臺——“未名一號”是北大已建成的第七個校級平臺。平臺采用了聯想深騰X8800超級計算機系統,深騰X8800基于聯想全球首創的45℃溫水水冷技術,通過無泄漏快速連接系統,將冷卻水流經水冷頭來冷卻核心處理器及其內存。相比傳統的風冷散熱技術,采用聯想45℃溫水水冷技術的未名一號, LINPACK效率達到92.6%,PUE值控制達1.1。同時,未名一號節省了50%的制冷散熱成本,每年將為北京大學節省60萬度電。
北京大學高性能計算校級公共平臺未名一號由227個節點組成,其中計算節點196個、GPU節點10個、KNL節點8個、胖節點3個、管理和登錄節點6個、IO節點4個,存儲采用聯想GSS24存儲系統,容量2784.8TB,計算網絡采用Omnipath架構,編譯器采用GNU和Intel最新編譯器套件,作業管理采用Slurm作業調度系統,集群管理采用聯想LiCO集群監控管理套件。該集群系統理論計算峰值高達411萬億次/秒,計算節點理論峰值261萬億次/秒,實測計算能力達到242萬億次/秒。未來,該平臺將為全校提供高性能科學與工程計算服務,以滿足各學科領域對于大規模數據處理和大規模科學計算的需求。主要應用于數學、深度學習、大氣海洋環境、新能源新材料、天文地球物理、生物醫藥健康等領域,涉及數學、統計學、力學、物理學、化學、生物學、地球科學、航天航空科學、計算機科學等多個學科領域的科研。
同時,基于聯想Skylake全新架構的北京大學冷凍電鏡超算平臺也即將開始部署,聯想將為北京大學在生命科學研究領域提供了強大的計算力。冷凍電鏡就是應用冷凍固定技術,使用透射電子顯微鏡觀察樣品的顯微技術,是結構生物學研究的利器。冷凍電鏡有三個關鍵因素,冷凍固定技術,顯微技術,以及對圖像數據進行收集和處理的技術,而高性能計算平臺正是實現海量數據存儲和處理的重要基礎。