人工智能大模型領域的新探索

2024-07-18 00:00:00初憲

新閱讀 2024年6期

大模型技術的快速發展始于2018年，Transformer模型的提出為大模型訓練奠定了基礎。隨后，GPT系列模型的推出進一步推動了這一領域的發展。從GPT-1到GPT-4，模型參數量從1.17億增長到千億級，模型能力也在不斷提升。在這一背景下，智譜AI緊跟國際前沿，于2018年開始研發GLM系列模型。智譜AI研發的新一代認知智能大模型——GLM系列，目標是通過GLM系列模型的研發，推動中國人工智能技術的進步，開啟出版行業的新紀元。GLM系列模型是智譜公司自主研發，擁有自主知識產權，全面對標OpenAI GPT的產品系列。

大模型技術的發展帶來了顯著的性能提升，同時也帶來了技術挑戰。首先是模型架構的自主化，其次是訓練推理的國產化，最后是內容生成的可控化。

智譜AI研發的千億對話模型ChatGLM在國際測評中取得了顯著成績。在44項國際測評集同參數規模排名首位。最新推出的GLM-4模型，在多語言、數學推理、中英文指令遵從方面表現接近GPT-4，中文對齊能力超過GPT-4。智譜AI的ChatGLM開源社區下載量超過1300萬次，在GitHub累計獲得6萬星標。同時，在科技部發布的《中國人工智能大模型地圖研究報告》中，ChatGLM位列開源大模型影響力第一名。

智譜AI研發的全新自主預訓練框架——GLM，統一了自然語言理解和生成任務，能夠同時學習上下文表示和自回歸生成。GLM-130B在斯坦福大學的世界主流大模型評測中表現出色，是亞洲唯一入選的模型。其準確性和惡意性與GPT-3 175B接近，在魯棒性和校準誤差方面在所有評測模型中表現最佳。

智譜AI的對話模型家族也在快速發展，新一代基座模型GLM-4在多模態能力方面達到了DALL·E3的90%以上水平，中文能力超過了GPT-4。它支持更長的上下文表示、更強的多模態支持，以及更快速的推理等。智譜AI的大模型開源生態自2023年3月14日開源以來，ChatGLM-6B及其后續版本獲得了廣泛應用。在Hugging Face平臺上，下載量超過1300萬次，并在GitHub上獲得了6萬星標。

智譜AI與四十余家國產芯片廠商建立了合作關系，實現了模型在多款國產芯片上的高效運行。與多家數據合作伙伴和業務伙伴建立了緊密的合作關系，共同推動兩千余家用戶進入生成式AI的第二階段。智譜AI的生成式AI服務“智譜清言”是首批國家網信辦審核通過上線的大模型之一。它具備創意寫作、數學計算、AI繪圖、科普問答、編程等全方面綜合能力，下載量已超千萬。大模型的出現對知識獲取方式產生了深遠影響。它可以在幫助人類自動調用工具方面發揮重要作用。以GLM-4為例，它可以實現多工具的自動調用。

大模型對學習方式的改變也是顯而易見的。它可以輔助用戶進行翻譯與本地化，幫助理解專業術語；可以解釋復雜概念，輔助用戶學會提問；還可以根據用戶需求提供個性化學習路徑。大模型在內容創作方面的應用可以加速創作過程，幫助用戶快速生成高質量的內容；可以模仿不同風格，實現風格的轉換；還可以進行角色扮演和互動，提供更有趣的創作體驗。

Aminer大模型學習助手在論文、報告、書籍方面的應用顯著提高了研究效率。它可以幫助用戶快速檢索和篩選相關文獻，從而加速研究進程。通過分析大量文獻和學術數據，Aminer可以發現潛在的學術熱點和前沿領域，為用戶提供有價值的學術洞見。

總結來說，智譜AI的GLM系列大模型在技術創新、應用推廣和國際影響力方面取得了顯著成就。它們不僅在技術上對標國際先進水平，而且在實際應用中展現了強大的性能和廣泛的影響力。智譜AI將繼續致力于大模型技術的發展，推動人工智能領域的進步，為各行各業提供更強大的AI支持。

作者系智譜AI傳媒教育出版行業總經理

新閱讀2024年6期

新閱讀的其它文章: “煒燁燈彩”南京非遺傳承視覺形象設計; 中國山村風景國畫作品; 素樸生葳蕤平淡見天真; “梁曉聲談中國系列”評介; 沒有上帝粒子就沒有人類; 以課堂活動提升中學生“整本書閱讀”能力