算力不足？華為首發算力交換機

2023-06-21 05:13:06顏媛媛

電腦報 2023年23期

關鍵詞：模型

顏媛媛

華為版ChatGPT被否認已提前上線

日前有報道稱，華為將發布一款直接對標ChatGPT的多模態大模型產品，名為“盤古Chat”。預計華為盤古Chat 將在今年7 月7 日舉行的華為云開發者大會上對外發布以及內測，產品主要面向政企端客戶。

據中國商標網顯示，華為技術有限公司于近期申請注冊了兩枚“HUAWEI NETGPT”商標，國際分類為科學儀器、網站服務，當前商標狀態為申請中。此外，華為已成功注冊多枚“盤古”“PANGU”商標。

此前在中關村論壇現場，針對記者提問華為是否有信心去承載ChatGPT 這類規模的應用，華為昇騰計算業務CTO 周斌回應稱，完全沒有問題。“我們已經服務了國內幾十家合作伙伴的大模型，至少從底層技術軟硬件的規模上來講，華為不比ChatGPT 少，ChatGPT所需的算力需求，我們已經經過了大規模驗證，是完全沒問題的。”周斌表示。

周斌在人工智能開放生態建設分論壇的演講中稱，華為基于“昇騰+ 昇思”全棧軟硬件整合能力，支持適配AI 開源大模型。華為在支持大規模模型的分布式訓練上做了非常多的工作，尤其是基于MindSpore AI 框架做自動化并行處理，可以極大減少大模型開發和調試工作。

隨著關注度的提升，華為相關負責人對媒體表示，在此次云開發者大會上，華為不會發布“ 盤古Chat”。以后是否會推出相關產品尚不明確，但不對標ChatGPT。目前華為依舊在大模型上加強研發。

華為將利用AI做什么？

AI 浪潮勢不可當的背景下，華為將如何結合AI 技術發展業務？

據了解，目前，AI 團隊分散在華為多個部門或業務線，比如華為云、計算產品線以及５G 相關部門等，并沒有一個整體統一的AI 部門。

不過，早在幾年前，華為就已開始布局大模型領域。

根據華為披露的時間表，華為盤古大模型從2020 年啟動研發，2021 年4 月，華為發布了盤古NLP（中文語言）大模型、盤古視覺大模型、盤古科學計算大模型；2021 年9 月，華為推出用于藥物研發細分場景的大模型；2022 年，華為與能源集團合作發布了盤古礦山大模型、盤古氣象大模型、盤古海浪大模型、盤古金融OCR大模型。

目前，華為云盤古大模型已經在醫藥研發、電力、煤礦、氣象、小語種等領域落地。去年，華為云就已交付了一個阿拉伯語的千億參數大模型，盤古科學計算大模型也用在了氣象預報、海浪預測等方向。

今年4 月，華為云AI 領域首席科學家田奇透露，過去幾年，華為主要聚焦打造“盤古”系列的預訓練大模型。大模型誕生分兩個階段：第一是預訓練階段，由海量數據來運行鏈路的通用底座基礎模型；第二是針對下游的千行百業的具體任務，基于行業數據進行微調，同時華為也布局了第三步，即大模型迭代。

華為發布全球首款算力路由

相對語言模型，華為面向全球發布首款800GE 數據中心核心交換機——CloudEngine 16800-X 系列，正式開啟數據中心800GE 時代。

算力應用的浪潮興起再次引爆企業對于AI 的大力投入，由此帶來計算能力等底層技術的升級，數據中心的吞吐量將被提升到全新高度。以互聯網行業為代表的大型企業，急需網絡滿足大帶寬、低時延、高性能等高要求。隨著400GE 在超大規模數據中心應用的普及，數據中心網絡正朝著更高的速度發展——800GE。根據研究機構DellOro Group 發布的《數據中心交換機市場五年期預測報告》顯示，預計2025 年800GE 交換端口的速率有望超過400GE。

華為數據通信產品線副總裁邱月峰表示，據中國算力發展指數白皮書顯示，預計2023 年智能算力占比將高達70%，以ChatGPT 為代表的AI 大模型參數量將增長115 倍，預計2030 年AI 算力將增長500 倍。海量數據來襲，數據中心需要超強性能的設備來構筑行業智算“高速公路”。本次發布的業界首款800GE 數據中心核心交換機CloudEngine 16800-X 系列，具備業界288×800GE 端口數量，可高效支撐AI 訓練等業務，100% 釋放算力。