萬宏蕾

上海超級計算中心
UCloud(優刻得科技股份有限公司)是中國知名的中立云計算服務商,其兩大云基地分別位于“東數西算”工程規劃的國家算力樞紐節點,內蒙古(烏蘭察布)和長三角(上海青浦)。
“其實我們布局烏蘭察布數據中心時,‘東數西算8個樞紐節點還未發布。當時考慮烏蘭察布離北京近,海拔更高,有電價低廉、自然低溫等優勢,能耗控制較好;上海數據中心則位于長三角一體化等多個國家戰略交匯點,適合布局核心計算業務、高時效業務。”UCloud副總裁劉杰告訴《瞭望東方周刊》。
“兩個基地各有優勢。比如,人工智能企業可以構建混合云,將模型訓練等非實時計算部署在烏蘭察布,將需要實時計算的推理工作部署在上海,降低成本的同時提高創新效率。”劉杰說。
“縱觀當下中國整體算力分布,東部算力規模仍遠高于中西部地區,但依然無法滿足日益增長的算力需求。”上海社科院信息研究所副所長丁波濤告訴《瞭望東方周刊》,“東部地區不僅有科學計算和大數據處理的需求,還有增長更快的人工智能訓練和推理計算等需求,這些都需要體量更大的多種類型智能計算。隨著‘東數西算工程推進,未來我國將逐步形成東、中、西部更加均衡分布的算力體系。”

濟南超算中心的山河超算平臺
在過去一年里,各地紛紛通過出臺政策、活動招商、建設重點項目等,響應國家“東數西算”戰略,加快推進算力基礎設施建設和升級。
作為全國信息化發展的“排頭兵”,上海具有領先的產業發展優勢和積極的地方政策。2022年6月,上海市通信管理局印發的《新型數據中心“算力浦江”行動計劃(2022-2024年)》明確,力爭到2024年初步建成全國一體化算力網絡上海樞紐節點,形成與本市數字經濟發展方式相適應,長三角地區協同發展的算力服務發展格局,建成具有亞太乃至全球影響力的高能級算力樞紐中心。
2022年1月,江蘇省工業和信息化廳印發《江蘇省新型數據中心統籌發展實施意見》,提出到2023年底,江蘇省數據中心機架規模年均增速保持在20%左右,平均利用率提升到65%,全省新型數據中心比例不低于30%,高性能算力占比達10%,新建大型及以上數據中心電能利用效率(PUE)降低到1.3以下;到2025年底,江蘇省數據中心機架規模達70萬標準機架,新型數據中心占比進一步提升,算力算效水平顯著提高。
數字經濟大省浙江也于2021年發布《浙江省推動數據中心能效提升行動方案(2021-2025年)》,提出到“十四五”期末,浙江省數據中心平均PUE下降至1.5以下,其中大型以上數據中心 PUE 降至1.3以下,長三角樞紐區集群內數據中心PUE達到1.25以下,全省數據中心可再生能源使用率達到30%以上。
在算力基礎設施方面,據浙江省經濟和信息化廳統計數據,截至2023年2月底,全省已建成數據中心150多個,主要布局在杭州、嘉興、湖州、金華、溫州等地。算力規模達8.86EFlops,已用算力規模5.07EFlops,另有在建算力規模7.48EFlops。
圍繞濟南超算中心,濟南市歷城區規劃打造了14.2 平方公里的超算數字經濟生態創新圈。
2022年7月,首屆中國算力大會在山東濟南舉辦。在這場我國算力領域首個全國性會議上,現場簽約啟動項目總投資額約461億元,涉及中國移動、中國聯通、中國電信、中國鐵塔、中國廣電、華為、阿里、浪潮等算力龍頭企業。業內人士梳理這些項目發現,“東數西算”已成為這些項目決策和落地的重要依據。一年多時間來,多家行業龍頭在8大樞紐和10大集群積極布局,申請土地空間和能耗指標,推動自身算力基礎設施建設。
自2022年2月之后一年間,全國新開工建設的數據中心項目中,以長三角樞紐及其內長三角生態綠色一體化發展示范區集群、蕪湖集群承建項目數量最多,西部樞紐中則以成渝樞紐及其內的天府集群、重慶集群為首。
“當前,大部分算力需求集中在數字經濟發展較發達的東部沿海地區。”丁波濤分析,即使在“東數西算”政策引導之下,許多企業簽約落地項目的地區仍首選東部地區,算力業務向西遷移的增量還是集中在成渝等準一線城市,部分互聯網巨頭和三大運營商已經在貴州、寧夏等西部地區率先有了進一步的探索。
“目前,西部地區項目主要承載的是對網絡依賴不強的冷數據處理需求和備份需求等業務,真正意義的‘西算市場還需要加大培育力度。”中國科學院計算技術研究所研究員、中國計算機學會高性能計算專委會秘書長張云泉告訴《瞭望東方周刊》。
2022年底,美國OpenAI推出的ChatGPT引爆了國內市場對于大模型的熱情,大模型本身對GPU算力有極強的需求。“目前,國內能提供對應算力支持的超算中心還不多,國家超級計算濟南中心(以下簡稱“濟南超算中心”)的神器——山河超算平臺部署的智能計算集群能夠提供人工智能計算能力。”張云泉介紹。
“在大模型熱潮襲來后,不少國內企業找過來,希望能夠使用山河的人工智能算力訓練大模型。”國家超級計算濟南中心研究員郭猛告訴《瞭望東方周刊》,“目前不少科研機構、高校、互聯網公司排隊已經很長時間,簡直‘一卡難求。”
“這個‘卡主要是說目前人工智能大模型訓練最常用的專業級顯卡。”郭猛說。
濟南超算中心是我國完全采用自主處理器研制的千萬億次超級計算機神威·藍光的誕生地,也是我國超算領域的“領頭羊”之一。
2019年,借助新建全球首個以“超算”為主題的科技園——國家超級計算濟南中心科技園的契機,濟南超算中心謀定建設山河超算平臺。這個平臺不僅可以提供傳統高性能計算算力,還能提供云計算和智能計算服務,后兩者將滿足更多民生、產業領域的算力需求。
“全球的超算都在沖速度,尤其是高性能計算在不斷追求更快、更強,如何讓超算的算力得到更好的利用?讓超算機構更好地運轉?”濟南超算中心副主任郭瑩說,“超算研制瞄準的是解決大問題,比如‘超算諾貝爾獎戈登貝爾獎獲獎的那些案例,但這些大問題可能占比不到20%,真正消耗大量算力的還是大批量的中小規模應用,所以我們的超算要同時滿足這兩類需求。”
在服務更多產業和企業的背景下,山河超算平臺應運而生。2021年建成的山河平臺高性能計算能力達80PFlops (每秒千萬億次計算),人工智能計算能力達到1000PFlops,整體性能居世界先進水平,在德國漢堡舉行的ISC2022高性能計算大會上,一舉登頂世界最新IO500榜單,且大幅刷新了該榜單歷史最好成績。
“山河平臺建成后,我們服務的用戶面越來越廣,對接的需求也越來越多元,圍繞山河平臺正在形成一個越來越豐富的超算應用生態。”郭猛說。
“由于選對了技術路線,濟南超算中心發展勢頭迅猛。”張云泉評價。
為了進一步挖掘算力底座的潛力。圍繞濟南超算中心,濟南市歷城區規劃打造了14.2平方公里的超算數字經濟生態創新圈。2022年底,濟南超算中心和濟南超算數字經濟創新圈服務中心等機構以聯合招商小組的名義向全球發布招商。
“這不是一次單純的招商,更重要的是我們想讓大家都知道濟南有一個超算中心,我們的算力能賦能你的產業。”濟南超算中心副主任、濟南超算技術研究院院長潘景山說。
“算力對企業的重要性和吸引力不斷增長,越來越多的企業來科技園考察,越來越多的企業家在琢磨怎么能用上這種算力。”潘景山說,“一些企業因為超算中心而選擇落地濟南超算數字經濟生態創新圈。”按照規劃,到2025年,這一創新圈將集聚50家龍頭企業,引進和培育企業500家,新增就業崗位5000個,形成千億級數字經濟集群。

2022年6月23日,之江實驗室計算與數據中心,工程師們通過“之江云”系統監測服務器集群的運行狀態(黃宗治/ 攝)
新藥研發中的分子篩選、智能網聯汽車的車路協同、無人值守的“黑燈工廠”……這些對算力有大量剛需的產業場景,過去不得不面對排隊申請算力的無奈。
2023年2月20日,依托上海超算中心建設及運用的上海市人工智能公共算力服務平臺正式揭牌啟用。以該平臺為核心,上海“1+N”算網體系初步形成。
“上海超算中心屬于政府公共算力服務平臺,通過對公共算力和各種商業算力的集聚調度,努力實現算力如水電等基礎設施一樣便利使用,為科研機構和廣大中小企業提供具有公信力的普惠算力,幫助企業降低使用算力的成本,實現異構異地資源共享。”上海超算中心綜合管理部部長林薇告訴《瞭望東方周刊》。
據介紹,新建平臺是采用國產自研達芬奇架構的人工智能算力平臺,計算峰值能力(FP16)達到100PFlops。主要器件CPU和AI處理器采用冷板式液冷,輔助設備通過風液換熱器進行間接冷卻,能耗PUE低于1.3。目前,三大運營商以及商湯、華為、騰訊等智算中心的算力都在踴躍加盟這一算力調度平臺。
“當然,要實現算力抱團也面臨不小的挑戰。現在各種算力的技術標準、接入方式等都不盡相同,如何通過平臺將這些算力資源匯聚起來,進行統一調度,需要研究相應的策略和方法。”林薇說。
根據中國信通院發布的《中國綜合算力指數(2022年)》,截至2021年底,上海市算力指數排名位列全國第一,綜合算力指數排名位列全國第二。報告顯示,上海市算力、存力、運力發展水平均處于全國前列。從算力規模來看,截至2021年底,上海市在用算力規模超過13EFlops,在建算力規模超過7EFlops。
在上海,集成電路、生物醫藥、人工智能三大先導產業,數字經濟、綠色低碳、元宇宙、智能終端四大新賽道,以及前瞻布局的未來健康、未來智能、未來能源、未來空間、未來材料等五大未來產業,無不是算力需求大戶。
“比如,一名神經系統疾病患者的檢查和治療數據高達500G,急重癥患者每天產生的用藥、化驗數據等,都迫切需要充沛算力輔助。”華山醫院神經外科副主任醫師、教授孫一睿說,“現在,由上海超算中心提供公共服務算力支撐,華為提供自主可控的昇騰芯片及MindSpore昇思人工智能技術框架,上海聯通提供算網一體技術、聯通云和算力集成運營服務,多方共同打造上海公共服務算力孵化人工智能輔助醫學的創新應用,有力推動醫療系統數智化升級。”
“不過,即便上海有這樣的算力基礎,由于全社會對于數字資源的存儲、計算和應用需求與日俱增,導致算力仍供不應求。”丁波濤說。
在國內多地出臺清退落后產能的相關政策文件中,一些東部地區的數據中心也赫然在列。
隨著“雙碳”目標提出和全社會數字化轉型的加速,數據中心作為海量數據的主要存儲與運算處理實體,其規模不斷擴大,由此帶來的能源消耗問題受到廣泛關注。
據中國信通院云計算與大數據研究所測算,到2030年,我國數據中心耗電量將超過3800億千瓦時,如果不采用可再生能源,碳排放量將超過2億噸,算力基礎設施的綠色低碳亟待實現。
為此,國家及各地政府相繼出臺多項政策性文件,對電能利用效率(PUE值)指標控制呈現嚴格趨勢,在數據中心建設項目審批、運營管理、差別電價等方面不斷將PUE值作為剛性指標。
根據工信部《新型數據中心發展三年行動計劃(2021-2023年)》發布的數據,到2023年底,全國數據中心機架規模年均增速保持在20%左右,平均利用率力爭提升到60%以上。
同時,在國內多地出臺清退落后產能的相關政策文件中,一些東部地區的數據中心也赫然在列。廣東省提出,珠三角地區60%中高時延數據業務遷至粵東粵西粵北地區;浙江省提出,對于省內數據中心整體上架率(建成投用1年以上)低于50%的運營單位,不支持新建大型和超大型數據中心項目,對已建數據中心“整合一批、改造一批、淘汰一批”;北京市出臺《低效數據中心綜合治理工作方案》,對低效數據中心,分批開展整治工作,有序遷移關閉。
“淘汰一部分東部數據中心、把一部分算力轉移到西部,本質上都是基于實現‘雙碳目標的考慮,‘東數西算不僅能夠節約‘西電東送的成本,還能提高對西部光伏、風電等綠色能源的使用。”丁波濤說。
“UCloud幫助客戶將原本部署在東部的服務器中對時延敏感性低的業務西遷至烏蘭察布數據中心,遷移后可以幫助客戶將IT運營成本降低50%。” 劉杰說。
“我們公司的主營業務是云計算。云計算本身就是一種綠色的計算資源,通過集群化管理、高效運營,相對于傳統架構,降低能源消耗和資源消耗;烏蘭察布數據中心選址可以助力新能源消納,同時降低數據中心的PUE和耗電量;上海青浦云計算中心建設光伏發電,抵消自身碳排放。” UCloud基礎設施工程管理經理楊淑寶告訴《瞭望東方周刊》。
“同時,我們的數據中心還利用很多創新性技術手段,諸如自然冷卻、間接蒸發、熱回收、高壓直流、智能化運營等,降低數據中心PUE,降低能耗和碳排放。比如在上海數據中心采用的白露間接蒸發冷卻技術,通過重構間接蒸發冷卻流程,極大地提高了制冷效率。”楊淑寶補充道,這項技術獲得了2022年“云計算中心科技獎卓越獎”。
“‘東數西算工程剛啟動一年多,相關規劃和基礎設施目前還在推進過程中。對于企業來說,‘東數要不要‘西算,目前看來是可選項,未來可能是必選項。”丁波濤說。

國家超級計算深圳中心(深圳云計算中心)
注釋:EFlops 即每秒100 億億(=1018) 次浮點運算。