科大訊飛：通用大模型賦能千行百業

2024-04-02 05:00:09鄭智維姚薇

民生周刊 2024年7期

鄭智維姚薇

從ChatGPT到Sora，通用人工智能大模型的智慧涌現能力被認為不亞于PC和互聯網的誕生。

作為人工智能領域博弈最核心的“主戰場”，通用大模型的重要性不言而喻。基于國產算力平臺—“飛星一號”，科大訊飛訓練出了訊飛星火3.5認知大模型，效果直逼全世界最好的GPT-4 Turbo，并且在語言理解、數學等方面實現超越。

人工智能既是引領未來的戰略性技術，也是新一輪科技革命和產業變革的核心驅動力。今年的《政府工作報告》提出，要“制定支持數字經濟高質量發展政策”“開展‘人工智能+行動”。

作為新一輪科技革命和產業變革的重要驅動力量，人工智能將是形成新質生產力的重要引擎。在科大訊飛董事長劉慶峰看來，以大模型為代表的人工智能技術，或將改變以人力和時長為主要商業模式的產業形態，從根本上重塑產業的全球競爭力。

作為科大訊飛推出的認知大模型，訊飛星火認知大模型擁有跨領域的知識和語言理解能力，能夠基于自然對話方式理解與執行任務。

依托海量數據和大規模知識，該模型持續進化，實現了從提出、規劃到解決問題的全流程閉環。

2023年上半年，科大訊飛和華為成立了聯合“特戰隊”。同年10月24日，雙方共同打造出我國首個支撐萬億參數大模型訓練的國產算力平臺—“飛星一號”。

在此過程中，雙方進行了數百次基于硬件工具和算子庫的優化，進行了大量bug修訂及算子效率優化，這使得“飛星一號”算力集群可以訓練超大規模的通用人工智能模型。

“在全球政治經濟存在不確定的大背景下，我們必須通過更強的自主創新能力來贏得未來發展的主動權。在產業鏈價值鏈中，如果沒有比較優勢，就很有可能被別人‘卡脖子。”劉慶峰說。

自創業以來，科大訊飛持續聚焦智能語音、自然語言理解、機器學習推理及自主學習等人工智能核心技術研究，這些研究和產品開發平臺已成為科大訊飛的先發優勢。

然而，將大模型建立在自主可控的算力平臺上并非易事。

之所以堅持全面國產化，劉慶峰坦言，和美國的極限施壓相關。2019年10月，科大訊飛被美國列入實體清單。不過，當時含有美國技術25%以內的產品還可以采購。3年后，科大訊飛被美國再次極限施壓，含有美國技術的產品均不能使用。

“美國極限施壓倒逼著我們從核心技術研究、人工智能算法的訓練推理，再到各種消費類產品行業應用，全部都要實現國產自主。”劉慶峰說。

奇瑞汽車出口到講英語、俄羅斯語、西班牙、阿拉伯語、葡萄牙語等語種的國家，背后也有科大訊飛的賦能。

訊飛星火認知大模型正在加速賦能千行百業，助力加快形成新質生產力。以汽車領域為例，劉慶峰表示，科大訊飛將大模型和智能語音結合，來支撐我國汽車的全球化出海戰略。

劉慶峰介紹，大模型不僅促進了多語種交互，還可以讓汽車更智能。通過深度融入汽車座艙系統，星火大模型為汽車賦予了具備深度語言理解能力和復雜任務處理能力的智慧大腦，汽車可以深度理解自由聊天、復合指令、知識提問等用戶的各類語言內容。

1月30日，科大訊飛正式發布“訊飛星火V3.5”。

在研發之初，訊飛星火就確定了“1+N”模式，“1”指的是通用人工智能底座，“N”指的是應用于多個行業領域的專用大模型。去年10月24日，科大訊飛聯合行業龍頭共同發布12個行業大模型，涵蓋金融、汽車、運營商、工業、住建、物業、科普、科技文獻、政務、傳媒、文旅、水利等行業。

如今，訊飛星火認知大模型對產業智能化、數字經濟、社會民生的影響已初步顯現。

以被稱為工業企業“大腦”的應用羚羊iMOM為例。在一個擁有300名員工的汽車零部件制造工廠里，約有三分之二的員工都是車間作業員。從找圖紙到準備生產物料，再到填寫交班日志等工作，讓所有作業員嚴格按照生產流程工作，是一件難以實現的事情。

通過部署企業專屬的羚羊iMOM，剛上崗的機加工車間作業員就可以完全勝任。猶如一個“超級助理”，羚羊iMOM可大幅提升生產成效。

“科大訊飛有信心實現從算法、數據、應用場景到算力，構建一個完全自主可控的繁榮的人工智能生態。”劉慶峰說，真正讓大模型量質齊飛，不僅要加強行業應用，還要在很多關鍵技術創新上聯動。

在醫療領域，“智醫助理”已覆蓋全國超過30個省份的400多個區縣，在規范診療過程及減少診斷錯誤方面發揮了關鍵作用，首次診斷推薦可靠性由2021年的約96%提高至2023年的約98%，處方審核可靠性由2021年的約93%提高至2023年的約96%。

2023年，科大訊飛發布星火醫療大模型，并推出基于星火醫療大模型的訊飛曉醫應用程序及小程序。

患者診前問詢功能可大幅提升問診效率；規劃用藥，大幅減少潛在不合理用藥；解讀診斷和體檢報告，根據報告生成健康提醒，并幫助患者找到正確的科室……

通過軟硬件一體化的方式，把醫院的診后服務、家庭的家庭醫生、個人的尋醫用藥結合起來，為每個醫生打造診療助理，為每個人打造健康助手。

“訊飛星火2024年將繼續保持快速升級，預計上半年達到GPT-4 Turbo當前水平。”劉慶峰說。

自正式發布以來，訊飛星火已實現4次重大迭代升級，進化到V3.5版本。據介紹，該版本的效果整體逼近GPT-4 Turbo，其中數學、語言理解、語音交互能力超GPT-4 Turbo，代碼達到GPT-4 Turbo 96%，多模態理解達到GPT-4V 91%。

國產通用大模型方興未艾。在劉慶峰看來，像水和電一樣，通用大模型未來將是賦能千行百業的基礎能力和基礎設施。

國產通用大模型的發展，離不開生態伙伴的共創。訊飛開放平臺開發者團隊數達609萬，訊飛星火發布以來新增200萬開發者團隊，其中星火大模型開發者超41萬，開發者基于星火大模型打造個人應用，賦能億萬用戶。

今年全國兩會期間，作為全國人大代表的劉慶峰建議，國家制定通用人工智能發展規劃，應對全球AI“系統性競爭”，加快推動我國通用人工智能發展。

“我們要正視差距，聚焦自主可控的底座大模型‘主戰場，從國家層面聚焦資源加快追趕，同時系統性構建通用人工智能生態和應用，打造綜合優勢。”劉慶峰說。

和國民經濟主戰場緊密結合，新質生產力能夠對當前的產業形態進行提升賦能，同時也具備對未來產業的引領性。從人工智能、工業互聯網到大數據，縱觀近年來全球經濟增長的新引擎，無一不是由新技術帶來的新產業，進而形成的新生產力。

“科大訊飛有信心實現從算法、數據、應用場景到算力，構建一個完全自主可控的繁榮的人工智能生態。”談及未來，劉慶峰說，真正讓大模型量質齊飛，不僅要加強行業應用，還要在很多關鍵技術創新上聯動。我國企業界、科學界有信心迎頭趕上。