剛剛過去的2024年,人工智能技術發展突飛猛進,目前AI技術已經實現了從靜態輸出轉向跨文本、語音和視覺輸入的動態實時交互。在人工智能時代已經開啟的背景下,眾多企業和機構參與到人工智能技術的開發和應用推廣之中,近來,國產大模型DeepSeek因其表現被認為可與OpenAI的大語言模型o1相媲美,且具有訓練成本大幅可控的優勢,一時受到廣泛關注。開放、充分的競爭是推動人工智能技術日益進步的重要條件,深度求索只是國內進行人工智能大模型研發的眾多參與者之一,本文根據公開信息收集整理了幾個國內大模型產品,通過對這些模型的介紹,讓讀者了解國產大模型DeepSeek取得今日成績并非偶然,因為我國有大量的優秀團隊在你追我趕,人工智能技術的進步就是依靠這些力量不斷推動的。
無問芯穹
無問芯穹的優勢包括其軟硬協同優化和異構算力整合能力。
其利用軟硬協同優化技術,實現了多源異構算力的整合利用,提供了異構算力最優解。
其發布了全球首個千卡規模異構芯片混訓平臺,該平臺支持包括AMD、華為昇騰、天數智芯、沐曦、摩爾線程、NVIDIA等六種異構芯片在內的大模型混合訓練,算力利用率最高可達97.6%。
其Infini-AI云平臺是全球首個可進行單任務千卡規模異構芯片混合訓練的平臺,具備萬卡擴展性,支持多種大模型和異構芯片的自由搭配和組合,已支持30多個模型和10余種計算卡,既支持單一算法與芯片的一對一連接,又支持多種模型和多種芯片的組合使用。
無問芯穹創始人團隊來自清華大學。
潞晨科技
潞晨科技的創始人尤洋是一位“90后”教授,擁有清華大學和加州大學伯克利分校的學術背景,并在多個頂級會議上發表過論文。尤洋在高性能計算領域有著顯著的成就,曾被加州大學伯克利分校提名為ACM Doctoral Dissertation Award候選人。
潞晨科技自研并發布了全球首個開源類Sora架構視頻生成模型Open-Sora,展示了其在視頻大模型方面的能力。
其專注于人工智能基礎設施領域,特別是在大模型訓練和推理方面,所推出的訓推一體機和大模型平臺能夠顯著降低訓練和推理的成本,同時提升效率和速度。
其產品在大模型訓練和推理方面表現不錯,能夠幫助企業像做PPT一樣簡單快速地完成大模型開發,模型訓練/推理加速2-10倍,效率和成本亦可優化。
零一萬物
在LMSYS盲測榜單上,Yi-Lightning超越了OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet,排名世界第六,中國第一。
與上一代旗艦模型Yi-Large相比,Yi-Lightning的最高生成速度提升了近四成,首包時間縮短了一倍。在保持高性能的同時,推理成本也得到了進一步的降低,每百萬Token僅需0.99元,接近行業最低價。
Yi-Lightning采用了Mixture of Experts(MoE)混合專家模型架構,引入了混合注意力機制和動態Top-P路由機制,提供了更高起點的標準化基座模型,能更快速、高效、低成本地完成定制模型訓練。
基于動態Top-P路由機制,Yi-Lightning能根據任務的難度動態自動選擇最合適的專家網絡組合,平衡推理成本和模型性能。
Yi-Lightning的訓練過程采用了多階段訓練模式,前期注重數據多樣性,后期側重于更豐富、知識性更強的數據,這種訓練方法有助于模型吸收不同階段的知識,通過調整batch size和學習率(LR)來保證訓練速度和穩定性。
零一萬物推出的基于Yi-Lightning模型的AI 2.0數字人解決方案,聚焦零售和電商等場景,提供了動作訓練、表情生成、多國語言和情感表達、智能對話等能力,在實際應用中取得了顯著的GMV提升。
MiniMax
MiniMax視頻大模型平臺具有以下特點:可生成原生高分辨率、高幀率視頻;平臺支持多種風格的視頻生成;能夠根據用戶輸入的文本提示,快速生成與之匹配的視頻內容,實現文生視頻的便捷轉換。
MiniMax視頻大模型平臺的應用場景廣泛,包括:為內容創作者提供強大的創意支持,提高內容創作的效率和質量;快速生成多種風格的廣告視頻,提升廣告效果;輔助影視制作團隊快速生成預覽視頻和特效鏡頭,提高制作效率;生成教學視頻、動畫故事等,豐富視覺體驗。
MiniMax視頻大模型平臺的市場潛力主要體現在:高質量視頻生成,對應的是用戶對高質量視頻內容的追求;多樣化,對應的是支持多種風格的視頻生成,提高用戶滿意度和忠誠度;輔助工具,對應的是幫助用戶提高內容創作的效率和質量,降低制作成本,提高市場競爭力。
百川智能
百川智能的大模型解決方案包括Baichuan4-Turbo和Baichuan4-Air。
Baichuan4-Turbo在文本生成、知識問答、多語言處理等核心能力上相比Baichuan 4有顯著提升,只需2卡4090的算力即可完成部署,且部署成本最低,非常適合企業探索復雜場景。
Baichuan4-Air則適用于較大規模流量的場景,推理成本行業最低,僅為Baichuan 4的1%,百萬Token只需0.98元。
百川智能的一站式大模型商業化解決方案能夠幫助企業以最低成本實現效果最佳的私有化部署,支持企業將專有數據與百川智能自用的全鏈路優質訓練數據混合,對模型進行調優和增強,實現了行業最高的96%多場景可用率。
其大模型在多個權威評測基準上表現優異,其產品矩陣包括全鏈路優質通用訓練數據、Baichuan4-Turbo和Baichuan4-Air兩款模型,以及全鏈路領域增強工具鏈,工具多、速度快、效果好、成本低。
百川智能通過大量適配工作解決了不同硬件的適配問題,可高效適配多種主流芯片。
月之暗面
月之暗面的核心產品Kimi Chat能夠處理長達20萬字的長文本,這一技術優勢使其在處理復雜文檔和長文本時表現出色。
例如,在情況比較特殊的法律領域,Kimi Chat可快速處理復雜的合同條款和法律判例。
Kimi Chat亦具備無損記憶和長文本處理功能,能夠在多輪對話中保持上下文一致性,提供更加智能和個性化的服務。
創始人楊植麟擁有清華大學計算機系本科和卡內基梅隆大學計算機學院的博士學位,并曾在Google Brain和FAIR等頂級公司工作,具有行業經驗和學術背景。
其團隊成員大多來自Google、盤古、智源悟道等大模型領域的參與者。
智譜AI
智譜AI不僅提供了知識圖譜相關技術和語言模型等基礎功能,還推出了如AutoGLM這樣的自主智能體,能夠模擬人類操作手機執行各種任務,以及端到端情感語音模型GLM-4-Voice,能夠理解情感并實現高度擬人的情緒表達。
其在底層通用模型、國產算力芯片適配、多模態生成以及AI Agent智能體等方面取得了顯著進展,打通了人工智能產業鏈中全流程的技術和商業閉環。
其比較高效的信息檢索和深度推理能力,支持超過100個網頁的并發搜索,能夠在數秒內迅速閱讀、總結信息,提高了獲取信息的效率。
其深度推理能力使得它能夠通過邏輯推演,得到更為準確的答案,特別是在數據分析方面,可發現數據的潛在趨勢并生成直觀的結果。
智譜AI的優勢包括其智能互聯能力,以及生態系統的構建等。
智譜AI是清華大學計算機系技術成果轉化的公司,CEO為張鵬,其清華校友劉德兵、王紹蘭分別任董事長和總裁。
(以上不分先后)