大模型技術的快速發展始于2018年,Transformer模型的提出為大模型訓練奠定了基礎。隨后,GPT系列模型的推出進一步推動了這一領域的發展。從GPT-1到GPT-4,模型參數量從1.17億增長到千億級,模型能力也在不斷提升。在這一背景下,智譜AI緊跟國際前沿,于2018年開始研發GLM系列模型。智譜AI研發的新一代認知智能大模型——GLM系列,目標是通過GLM系列模型的研發,推動中國人工智能技術的進步,開啟出版行業的新紀元。GLM系列模型是智譜公司自主研發,擁有自主知識產權,全面對標OpenAI GPT的產品系列。
大模型技術的發展帶來了顯著的性能提升,同時也帶來了技術挑戰。首先是模型架構的自主化,其次是訓練推理的國產化,最后是內容生成的可控化。
智譜AI研發的千億對話模型ChatGLM在國際測評中取得了顯著成績。在44項國際測評集同參數規模排名首位。最新推出的GLM-4模型,在多語言、數學推理、中英文指令遵從方面表現接近GPT-4,中文對齊能力超過GPT-4。智譜AI的ChatGLM開源社區下載量超過1300萬次,在GitHub累計獲得6萬星標。同時,在科技部發布的《中國人工智能大模型地圖研究報告》中,ChatGLM位列開源大模型影響力第一名。
智譜AI研發的全新自主預訓練框架——GLM,統一了自然語言理解和生成任務,能夠同時學習上下文表示和自回歸生成。GLM-130B在斯坦福大學的世界主流大模型評測中表現出色,是亞洲唯一入選的模型。其準確性和惡意性與GPT-3 175B接近,在魯棒性和校準誤差方面在所有評測模型中表現最佳。
智譜AI的對話模型家族也在快速發展,新一代基座模型GLM-4在多模態能力方面達到了DALL·E3的90%以上水平,中文能力超過了GPT-4。它支持更長的上下文表示、更強的多模態支持,以及更快速的推理等。智譜AI的大模型開源生態自2023年3月14日開源以來,ChatGLM-6B及其后續版本獲得了廣泛應用。在Hugging Face平臺上,下載量超過1300萬次,并在GitHub上獲得了6萬星標。
智譜AI與四十余家國產芯片廠商建立了合作關系,實現了模型在多款國產芯片上的高效運行。與多家數據合作伙伴和業務伙伴建立了緊密的合作關系,共同推動兩千余家用戶進入生成式AI的第二階段。智譜AI的生成式AI服務“智譜清言”是首批國家網信辦審核通過上線的大模型之一。它具備創意寫作、數學計算、AI繪圖、科普問答、編程等全方面綜合能力,下載量dMh/BLWEHjn1XiVv/mK93azZNZZ4I1KyucbnmxCciEU=已超千萬。大模型的出現對知識獲取方式產生了深遠影響。它可以在幫助人類自動調用工具方面發揮重要作用。以GLM-4為例,它可以實現多工具的自動調用。
大模型對學習方式的改變也是顯而易見的。它可以輔助用戶進行翻譯與本地化,幫助理解專業術語;可以解釋復雜概念,輔助用戶學會提問;還可以根據用戶需求提供個性化學習路徑。大模型在內容創作方面的應用可以加速創作過程,幫助用戶快速生成高質量的內容;可以模仿不同風格,實現風格的轉換;還可以進行角色扮演和互動,提供更有趣的創作體驗。
Aminer大模型學習助手在論文、報告、書籍方面的應用顯著提高了研究效率。它可以幫助用戶快速檢索和篩選相關文獻,從而加速研究進程。通過分析大量文獻和學術數據,Aminer可以發現潛在的學術熱點和前沿領域,為用戶提供有價值的學術洞見。
總結來說,智譜AI的GLM系列大模型在技術創新、應用推廣和國際影響力方面取得了顯著成就。它們不僅在技術上對標國際先進水平,而且在實際應用中展現了強大的性能和廣泛的影響力。智譜AI將繼續致力于大模型技術的發展,推動人工智能領域的進步,為各行各業提供更強大的AI支持。
作者系智譜AI傳媒教育出版行業總經理