克林


百舸爭流,奮楫者先
截至2023年5月底,國內10億級參數規模以上基礎大模型至少已經公布了79個,此時距離ChatGPT在國內“破圈”尚不足3個月。
時間來到8月,這股勢頭依然不減。15日,科大訊飛發布星火認知大模型V2.0版本,在代碼及多模態能力方面進行了重大升級;在14日的年度演講上,小米董事長雷軍宣布小愛同學已升級大模型,并開始邀請測試;3日,“神秘”的騰訊混元大模型也浮出水面,目前已進入公司內應用測試階段……
“百模大戰”一觸即發,國內通用類、垂直類大模型呈現井噴之勢發展。IDC預測,2026年中國AI大模型市場規模將達到211億美元,人工智能將進入大規模落地應用關鍵期。
放眼全球,據統計今年上半年全球新發布的大模型已超過400個。麥肯錫的報告《生成式人工智能的經濟潛力》中提到,在其研究的63種應用中使用生成式AI,將為全球經濟帶來每年2.6萬億~4.4萬億美元的增長。
同時,由于通用大模型成本與技術門檻相對較高,國內較多大模型選擇圍繞垂直行業進行開發,模型參數量雖然不大,但是因為有一些行業的核心數據和業務系統的生產數據參與,所以在相應行業解決問題更為高效、直接,特別是在金融、教育、醫療等領域,已經有不少公司發布了相應產品。整體生態呈現出“通用+垂直”模型互相融通的態勢。
千帆競發,勇進者勝
今年6月,ChatGPT訪問量環比下滑9.7%,為其推出以來首次下滑。從全球范圍看,盡管不斷有企業或機構發布或更新大模型,但媒體和公眾似乎不再像幾個月前那般“上頭”。
當大模型回歸理性,市場必然要經歷一場大浪淘沙。關乎技術,更關乎商業模式。
目前幾乎所有的大模型預訓練都基于Transformer架構,雖是“百模大戰”,但各家大模型之間同質化嚴重,實質性的創新相對較少。同時,訓練大模型所耗費的計算資源非常龐大,需要超級算力的支撐,很多公司沒有過往的研究履歷,發布的產品多是“套殼”或者接入其他研發機構的模型,投機現象泛濫。
當下的大模型競爭早已超過了技術的范疇,更多是一種生態層面的比拼,具體表現在有多少應用、有多少插件、有多少開發者以及用戶等。如果沒有良好的可循環生態,那么無論在模型的持續迭代,抑或是變現攤薄巨額研發成本方面,可以預見都會面臨重大困境,對于創業型公司來說更是如此。
考驗的核心就在于大模型的落地能力。
今年獲得世界人工智能大會最高獎項SAIL獎(卓越人工智能引領者獎)的論文《機器學習結合阻抗譜技術預測鋰電池老化》,該文作者、中山大學物理學院副教授張云蔚說,她只采集了2萬個電化學阻抗譜,就實現了AI精準建模。比起海量數據,更重要的是思路。就是這樣一個小模型,將過去需要花費幾天才能實現的電池壽命預測縮短到了15分鐘,且檢測精度是原來的10倍。
越是面對如大模型落地這種復雜的問題,就越是要回歸更本質的層面去思考,考驗的不僅是技術力,更重要的還是要落實在“服務”二字上,更高效、更便捷、更人性化將會是未來可持續探索的重要方向。
結語
1.受關注度或注意力這一綜合性指所反映的也是最綜合性的或整體性的。
2.真正的答案往往要向內去尋找,這是更為根本的解決之道。
3.發展迅猛,未來的中國大模型100強即將出現,敬請期待。