近年來,國家及地方政府鼓勵并積極開展智算設施建設,從《新型數據中心發展三年行動計劃(2021—2023年)》的實施,再到《算力基礎設施高質量發展行動計劃》的發布,都推動了我國算力產業的高質量發展。進入2024年,Sora模型再次點燃了各界對于生成式AI的熱情,加強對圖像、視頻、多模態模型的訓練,將加大對AI算力的底層需求。目前我國算力產業在快速發的同時,也存在多重挑戰。在中美人工智能競爭的環境下,能源消耗、網絡互聯、軟件和硬件的未來發展趨勢,將成為我國算力發展的重要影響因素。

據工信部數據,截至今年5月底,全國規劃具有高性能計算機集群的智算中心已達十余個。不久前,全國一體化算力網絡八大樞紐節點——粵港澳大灣區一體化數據中心在廣東韶關完工,將全面提升跨區域算力調度能力。目前,我國基礎電信運營商全網智算規模超過每秒30百億億次浮點運算。從全國來看,智能算力在算力總規模中的比重超過了30%。我國算力結構不斷優化。
同時,算力應用場景也更加多樣。在北京的這個智算基地,2024年以來,在線處理能力每秒最高達到了2萬筆,效率比去年提升了30%,成本卻節省了一半。在濟南這個超算中心,不久前剛剛完成山東境內黃河流域的建模仿真。當前,國家正加快構建算力產業生態,征集算力應用創新項目已超過5000個,覆蓋金融、交通、城市治理等多個領域。下一步,國家將進一步優化算力基礎設施布局,積極推進人工智能計算架構和軟件生態建設,加速突破一批標志性技術產品和方案。同時,加快打造全國統一算力服務大市場,不斷提升算力普惠易用水平。
與此同時,我國算力發展仍存在一些挑戰。一是算力協同有待加強。我國東西部算力協作發展不僅需要依靠自身努力,也需要一定的商業模式來激勵,我國西部能源供應價格優勢與東部產業西遷成本收益之間的平衡需要一定的協調機制來保障;二是生態方面,我國部分地區數據中心的實際運行業務效果與算力設計規模構想存在一定差距,以“筑巢引鳳”的方式實現“新舊”動能轉換的期待尚未實現,亟待推動從企業個體的位置空間聚集到有機融合的產業鏈條聚集,從而促進算力上、下游產業及應用生態市場協同發展;三是我國算力核心技術創新力度不夠,技術方面仍存在相對短板。在高端芯片和軟件研發方面,我國自主創新能力仍需加強,對進口產品和技術仍有一定依賴,關鍵技術的“卡脖子”風險依然存在,難以支撐大模型、元宇宙等高性能場景建設。此外,國產數據庫、中間件、操作系統等基礎軟件適配性、兼容性不足,對主流軟件應用環境構建的支撐能力偏弱。
算力是集信息計算力、網絡運載力、數據存儲力于一體的新型生產力,是影響我國AI大模型發展的重要新型信息基礎設施。未來,需要從以下幾方面推動中國算力產業發展:發展散熱液冷技術,優化中心運維能力;加強軟件平臺建設,優化算力供給,為算力調度、運營管理提供服務;強化芯片自主研發,擺脫對國際算力芯片大廠商的依賴等。

能源能耗。“AI的盡頭是光伏和儲能。” 據媒體報道,國外超大規模集群的算力供需方都越來越關注大模型在能源方面的需求及能耗問題。我國也在尋找高效清潔能源,同樣也要注意節能環保技術與設計,通過軟件平臺管理更好的優化PUE能效等指標。
軟件平臺。搭建智算中心軟件平臺,通過平臺操作系統的軟件管理,優化AI算力供給,為下游客戶側提供大規模算力資源的資源納管、算力調度、優化監控、運營管理等智算服務,并有望進一步屏蔽底層硬件差異,構建全棧的智算應用軟件生態。
網絡互聯。隨著數據量與計算量飛漲,數據中心需優化網絡帶寬、計算總線協議,實現數據的高吞吐低延遲的傳輸與連接,并進一步優化計算集群的架構與設計,保證數據中心的高效利用率,打造高帶寬、高吞吐、低延遲、自動化的新型智算中心網絡設施。
硬件能力。在中美人工智能競爭的環境下,國產芯片自主創新迫在眉睫。在算力方面,我們也會進一步嘗試擺脫對英偉達等頭部廠商的依賴,以“云巨頭自研自用+獨立/創業公司服務于信創、運營商等To G與To B市場”為兩條主線發展,實現國產AI算力應用的正循環。