王攀 陳宇軒 白瑜

7月7日,華為技術有限公司在華為開發者大會2023上正式發布人工智能(AI)大模型華為云盤古大模型3.0。
只需要1臺服務器,再加上10秒鐘的耐心,氣象專家就能完成臺風未來10天路徑的推理預測。然而,過去這樣的工作需要在大約3000臺服務器的高性能計算機集群上、花費5小時進行仿真模擬計算。
這樣的改變得益于人工智能大模型的發展。在7日舉行的“華為開發者大會2023”上,華為云正式發布人工智能大模型“盤古大模型3.0”和“昇騰AI云服務”,包含以“鯤鵬”“昇騰”為基礎的AI算力、計算引擎、全場景AI框架以及AI開發平臺等,實現全棧自主創新。
在氣象領域,盤古氣象大模型采用了三維高分辨率人工智能氣象預報方法,預報精度超過了傳統數值預報方法,能夠有效應對氣象預報領域長期存在的精度低、可解釋性差、極端天氣預測不準等挑戰。相關研究成果日前發表于國際權威期刊《自然》雜志。
今年以來,人工智能大模型在中國掀起了新一輪熱潮。中國科技部新一代人工智能發展研究中心5月底發布的《中國人工智能大模型地圖研究報告》顯示,中國10億參數規模以上的大模型已發布79個。除百度外,阿里、科大訊飛、美團、百川智能、云知聲、騰訊等頭部企業相繼在該領域布局。
“除了對話、寫詩、作畫等應用之外,要將大模型切實投入到城市發展、金融科技、生物醫藥、工業制造、科學研究等領域,在實體產業落地,為社會經濟帶來實實在在的價值。”中國工程院院士鄔賀銓說。
截至目前,中國開發的人工智能大模型已經在智慧礦山、藥物研發、氣象、政務、金融、智能制造、鐵路管理等領域展現出巨大的應用潛力。
中國電子科技集團旗下企業6月初發布了生成式人工智能大模型產品“小可”,包括擬文助手、編碼助手、智能標繪等一系列智能應用。尤其是在智能制造方面,“小可”能夠構建工廠一體化流轉平臺,打破工業控制、運行維護各個系統間數據和工序流轉壁壘,實現崗位工人、產線設備、信息系統之間基于自然語言的交互,優化工廠自動化、數字化、智能化運作流程。
位于深圳的鵬城實驗室此前也發布消息稱,該實驗室將推出“鵬城·腦海”大模型計劃,打造自主可控、安全可控、開源開放的自然語言預訓練大模型底座,尤其是面向數字政務、智慧金融、智能制造等應用場景。
在實踐中,中國人工智能大模型與實體經濟的結合,還在不斷向縱深發展。在7日舉行的“華為開發者大會2023”上,華為常務董事、華為云CEO張平安表示,大模型創新需要對算力、算子、計算框架及平臺進行全棧的創新和優化,才能降低大模型訓練門檻,加快人工智能大模型在實體經濟的落地應用。
例如,盤古藥物分子大模型將先導藥物研發周期從數年縮短至一個月,研發成本降低70%;盤古礦山大模型幫助煤礦企業構建安全高效的智能化系統,已在全國近10個礦井規模化應用;在鐵路貨運方面,盤古鐵路大模型能夠精準識別430多種各類故障,總體故障發現率達到99.8%。
業界專家認為,當前,利用大模型加速千行百業的數字化、智能化轉型,深耕實體經濟行業,已經成為中國產業界的共識。
“下一步,人工智能大模型要加強制造業技術、產業、應用進一步融合,更深入地研發面向制造業的大模型,為中國制造業的數字化轉型和智能化升級提供堅實支撐。”中國工程院院士、系統仿真及制造業信息化專家李伯虎說。(來源:新華社)