顏媛媛

日前有報道稱,華為將發布一款直接對標ChatGPT的多模態大模型產品,名為“盤古Chat”。預計華為盤古Chat 將在今年7 月7 日舉行的華為云開發者大會上對外發布以及內測,產品主要面向政企端客戶。
據中國商標網顯示,華為技術有限公司于近期申請注冊了兩枚“HUAWEI NETGPT”商標,國際分類為科學儀器、網站服務,當前商標狀態為申請中。此外,華為已成功注冊多枚“盤古”“PANGU”商標。
此前在中關村論壇現場,針對記者提問華為是否有信心去承載ChatGPT 這類規模的應用,華為昇騰計算業務CTO 周斌回應稱,完全沒有問題。“我們已經服務了國內幾十家合作伙伴的大模型,至少從底層技術軟硬件的規模上來講,華為不比ChatGPT 少,ChatGPT所需的算力需求,我們已經經過了大規模驗證,是完全沒問題的。”周斌表示。
周斌在人工智能開放生態建設分論壇的演講中稱,華為基于“昇騰+ 昇思”全棧軟硬件整合能力,支持適配AI 開源大模型。華為在支持大規模模型的分布式訓練上做了非常多的工作,尤其是基于MindSpore AI 框架做自動化并行處理,可以極大減少大模型開發和調試工作。
隨著關注度的提升, 華為相關負責人對媒體表示, 在此次云開發者大會上, 華為不會發布“ 盤古Chat”。以后是否會推出相關產品尚不明確,但不對標ChatGPT。目前華為依舊在大模型上加強研發。
AI 浪潮勢不可當的背景下,華為將如何結合AI 技術發展業務?
據了解,目前,AI 團隊分散在華為多個部門或業務線,比如華為云、計算產品線以及5G 相關部門等,并沒有一個整體統一的AI 部門。
不過,早在幾年前,華為就已開始布局大模型領域。
根據華為披露的時間表,華為盤古大模型從2020 年啟動研發,2021 年4 月,華為發布了盤古NLP(中文語言)大模型、盤古視覺大模型、盤古科學計算大模型;2021 年9 月,華為推出用于藥物研發細分場景的大模型;2022 年,華為與能源集團合作發布了盤古礦山大模型、盤古氣象大模型、盤古海浪大模型、盤古金融OCR大模型。
目前,華為云盤古大模型已經在醫藥研發、電力、煤礦、氣象、小語種等領域落地。去年,華為云就已交付了一個阿拉伯語的千億參數大模型,盤古科學計算大模型也用在了氣象預報、海浪預測等方向。
今年4 月,華為云AI 領域首席科學家田奇透露,過去幾年,華為主要聚焦打造“盤古”系列的預訓練大模型。大模型誕生分兩個階段:第一是預訓練階段,由海量數據來運行鏈路的通用底座基礎模型;第二是針對下游的千行百業的具體任務,基于行業數據進行微調,同時華為也布局了第三步,即大模型迭代。

相對語言模型,華為面向全球發布首款800GE 數據中心核心交換機——CloudEngine 16800-X 系列,正式開啟數據中心800GE 時代。
算力應用的浪潮興起再次引爆企業對于AI 的大力投入,由此帶來計算能力等底層技術的升級,數據中心的吞吐量將被提升到全新高度。以互聯網行業為代表的大型企業,急需網絡滿足大帶寬、低時延、高性能等高要求。隨著400GE 在超大規模數據中心應用的普及,數據中心網絡正朝著更高的速度發展——800GE。根據研究機構DellOro Group 發布的《數據中心交換機市場五年期預測報告》顯示,預計2025 年800GE 交換端口的速率有望超過400GE。
華為數據通信產品線副總裁邱月峰表示,據中國算力發展指數白皮書顯示,預計2023 年智能算力占比將高達70%, 以ChatGPT 為代表的AI 大模型參數量將增長115 倍,預計2030 年AI 算力將增長500 倍。海量數據來襲,數據中心需要超強性能的設備來構筑行業智算“高速公路”。本次發布的業界首款800GE 數據中心核心交換機CloudEngine 16800-X 系列,具備業界288×800GE 端口數量,可高效支撐AI 訓練等業務,100% 釋放算力。