AI大模型進入“開源盛世”

2025-03-04 00:00:00榮智慧

看世界 2025年5期

關鍵詞：百度模型

2月21日，國內AI公司深度求索（DeepSeek）發(fā)布“開源周”計劃，從2月24日開始，每日開源新內容，總共5個代碼庫。一系列重磅炸彈，攪得開源社區(qū)好不熱鬧。

而在更早前，百度已經(jīng)來了一個 180 度轉彎。

2月13日，百度宣布聊天機器人“文心一言”于4月1日起免費。2月14日，百度又宣布文心大模型4.5系列陸續(xù)推出，6月30日正式開源。

在開源的DeepSeek面向大眾之前，百度一直是閉源模型和收費服務的擁護者。

然而，連人工智能領頭羊OpenAI也扛不住壓力，早一步拋出“免費加開源”消息；一眾互聯(lián)網(wǎng)巨頭如英偉達、亞馬遜、微軟均將DeepSeek模型集成到自家平臺；一堆做“DeepSeek入口”的應用也趁機撈了一把流量，包括不缺流量的支付寶和微信。

百度的轉變并不是一個孤立事件。

受DeepSeek的開源“刺激”，全球人工智能大模型競爭技術路線，逐漸有開源壓倒閉源之勢。開源和閉源并沒有絕對的優(yōu)劣之分，只是當市場上出現(xiàn)顛覆者后，原先的主導者失去閉源的盈利護城河，不得不借“開源盛世”來擴張生態(tài)。

這場由DeepSeek引發(fā)的效率革命，標志著大模型競爭進入“后暴力計算時代”：模型效率取代絕對性能，成為核心競爭力；同時，全球AI權力秩序被重構，美國“一家獨大”霸權遭到削弱。

在后浪推前浪的趨勢下，未來的勝出者將是平衡駕馭二者的“變色龍”，既通過開源獲取生態(tài)勢能，也利用閉源實現(xiàn)價值捕獲。

“順勢而為”

DeepSeek“以小博大”，顛覆了人工智能大模型玩家的舊格局。

監(jiān)測網(wǎng)站Similarweb數(shù)據(jù)顯示，2025年1月，DeepSeek網(wǎng)站的訪問量環(huán)比增長2257%，單月訪問量達2.78億次，雖然與ChatGPT高達38億次的訪問量還有不小差距，但依然超過了蘋果iCloud、Salesforce等大公司網(wǎng)站。

OpenAI最先亂了陣腳，不斷開放新功能“挽尊”。

1月31日，放出推理模型o3-mini。2月3日，搜索網(wǎng)頁提煉文獻的深度研究（Deep Research）上線。2月5日，帶有網(wǎng)頁搜索功能的ChatGPT面向所有用戶開放。

2月13日，CEO薩姆·奧特曼在社交媒體宣布下一代AI大模型路線圖，GPT-5大模型基礎版將對ChatGPT免費用戶無限量開放。ChatGPT的付費訂閱者中，Plus版、Pro版訂閱者可以解鎖更“聰明”的GPT-5。模型功能將包含語音、Canvas（寫作、編碼工具）、搜索、深度研究等。

幾乎同時，百度也打出“免費加開源”牌。先是PC端聊天應用“文心一言”和移動端應用“文小言”將于4月1日起全面免費，文心大模型4.5也將在6月30日開源。

環(huán)球同此涼熱，巨頭也擔心“下課”。

OpenAI和百度齊齊從閉源轉向開源，原因比較接近：二者都是人工智能模型領域的先行者和主導者，本來可以靠閉源和收費來賺錢。如今DeepSeek物特別美、價尤其廉、人民群眾十分喜歡，他們再唱老調就真的賺不到錢了。

在美國，靠ChatGPT一舉成名的OpenAI，最早推出收費模式。2022年11月ChatGPT免費上線，2023年2月便推出20美元/月的Plus會員。2024年5月GPT-4o面世，12月推出200美元/月的Pro版本。

ChatGPT至今有4個收費計劃，Team、Enterprise面向企業(yè)，Plus、Pro面向個人。Plus可以使用OpenAI全部模型，也可以創(chuàng)建GPTs；Pro用戶在Plus的權益之外，還可以使用今年1月剛推出的智能體功能Operator（操作員）。

在中國，百度較早入局人工智能大模型領域。2021年7月推出文心大模型3.0，2023年3月推出聊天機器人“文心一言”。2023年6月，文心大模型升級到3.5版本。10月，文心大模型4.0版本發(fā)布。2024年6月，4.0 Turbo發(fā)布。

據(jù)百度稱，2024年文心大模型日均調用量超過15億次，較2023年增長超30倍。

2023年11月，百度文心一言推出付費會員模式，連續(xù)包月價格為49.9元/月，會員可以使用2023年10月發(fā)布的、目前仍是百度最新的模型文心一言4.0，此外還有圖片生成、網(wǎng)頁插件等權益。

中國其他大模型公司也有收費模式。智譜AI的聊天機器人智譜清言，連續(xù)包月價格為19元/月，可解鎖最新模型的無限次使用、視頻生成等功能；月之暗面旗下的Kimi智能助手有打賞功能，但并未綁定使用權益。

總體來看，在人工智能大模型本身就存在開源路線、Meta的開源大模型Llama實力雄厚的情況下，閉源模型并不存在高枕無憂的護城河。

開源的DeepSeek一問世，“頭鐵”的OpenAI、百度就不得不“順勢而為”了。

開閉之爭

開源和閉源的“源”，指的是“源代碼”。開放源代碼，允許其他開發(fā)者使用、傳播，技術可以持續(xù)改進。“開源”理念源自20世紀90年代開發(fā)者社區(qū)。

“戰(zhàn)爭”是埃隆·馬斯克挑起來的。2024年2月，作為OpenAI的創(chuàng)始人和最早投資人之一，馬斯克起訴OpenAI違背創(chuàng)始協(xié)議、追逐商業(yè)利益，將AI大模型閉源。OpenAI反唇相譏，稱馬斯克早就認可其“追逐商業(yè)利益”。

當年3月，馬斯克將旗下大模型Grok-1開源，以此證明自己“并非逐利”。一個月后，Meta發(fā)布Llama3系列模型，是當時最強大的開源大模型。原本閉源的谷歌也有點坐不住了， 2024年2月發(fā)布開源模型系列Gemma。

美國的開源模型陣營，對閉源的生成式預訓練模型GPT窮追不舍。業(yè)界普遍認為閉源模型的能力把開源模型甩開“一年半左右”。

在中國，由于算力受到阻礙，開源還是閉源的討論很少。2024年，百度創(chuàng)始人、CEO李彥宏多次表示，“模型開源的意義其實不是很大”“開源模型會越來越落后”。

也有一些公司選擇開源路線。

金沙江創(chuàng)投主管合伙人朱嘯虎的言論“不會投資中國的基座大模型創(chuàng)業(yè)公司”曾激起熱議，他認為開源大模型隨時會顛覆閉源基座模型。阿里云先后開源多個模型；創(chuàng)業(yè)公司里，零一萬物、百川智能、面壁智能都在打造開源模型。

中國各地方政府支持的實驗室或研究所也聚焦開源大模型，包括科技部和北京市政府支持成立的智源研究院，深圳市政府主導的鵬城實驗室，上海市政府主導的上海AI實驗室，以及粵港澳大灣區(qū)數(shù)字經(jīng)濟研究院等。

雖然開源模型和閉源模型還有一定差距，但隨著技術路線的清晰和開源技術的迭代，開源和閉源的差距將不斷縮小、直至拉平。

但堅持“閉源更好”的百度，當時的判斷是，開源并不便宜，且技術會越發(fā)落后，“開源模型沒有商業(yè)模式”。這一判斷基于三個條件：一是算力和工程能力門檻高，只有科技大廠才有實力主導開源模型；二是研發(fā)成本高，傳統(tǒng)開源軟件的商業(yè)模式“沒錢可燒”；三是閉源模型通過程序接口（API）調用，可供企業(yè)部署軟件。

DeepSeek“異軍突起”，恰恰證明這三個條件并不完全成立。

而且，百度期待的“企業(yè)級客戶”也興趣寥寥。因為數(shù)據(jù)是企業(yè)最寶貴的資源，一旦放在大廠平臺上，日后是否真正屬于自己就不好說了。移動互聯(lián)網(wǎng)時代的“像素級復制”，曾給中國創(chuàng)業(yè)者最沉重的打擊。

論中國互聯(lián)網(wǎng)三巨頭BAT，阿里是押注開源的典型代表。2022年11月，阿里發(fā)布了中文AI大模型開源社區(qū)“魔搭”（Model Scope）。通義千問模型也是開源的。2023年8月以來，阿里云先后開源和更新了數(shù)十個參數(shù)版本的模型。

騰訊的“混元大模型”去年選擇開源，其公開說法是，經(jīng)過一年多的探索，在閉源模式下將產(chǎn)品和技術積累到一定程度后，才選擇了開源。

2025年初，DeepSeek第一次令中國企業(yè)看到了開源模式的商業(yè)價值和影響力、看到了產(chǎn)業(yè)格局變化的可能性、看到了生態(tài)開放的沖擊力—技術民主化的拐點已經(jīng)到來。

“最后”，百度選擇開源。

“開源盛世”？

互聯(lián)網(wǎng)時代，一貫存在“巨頭守成”加“新銳破局”的競爭。

由于“新銳”DeepSeek的顛覆性沖擊，巨頭OpenAI立刻作出“免費”反應，隨即產(chǎn)生了傳導效應—GPT-4o免費后，中國AI初創(chuàng)公司的API調用成本下降30%，百度隨之失去了收費壁壘。而OpenAI的閉源數(shù)據(jù)飛輪仍在加速，其日均新增訓練數(shù)據(jù)量動輒是中國企業(yè)的5倍以上，技術代差可能進一步拉大。

對于AI企業(yè)而言，開源或閉源只是一種發(fā)展手段，不是什么“絕對理想”。

要理解開源模型和閉源模型的核心差異，可以從基礎條件、技術原理、應用場景、可營利性和局限性等五個維度來觀察。

從基礎條件看，開源模型以公開數(shù)據(jù)集、社區(qū)貢獻數(shù)據(jù)為數(shù)據(jù)來源，以分布式的、開發(fā)者自有的GPU集群為算力支撐，開發(fā)主體是社區(qū)協(xié)作者，比如GitHub的開發(fā)者，需要處理開源協(xié)議兼容性，存在一些合規(guī)成本。

閉源模型以專有數(shù)據(jù)如用戶行為日志、私有數(shù)據(jù)庫、清洗后公開數(shù)據(jù)為數(shù)據(jù)來源，靠集中式的超算中心為算力支撐，開發(fā)主體是企業(yè)級團隊，需要承擔數(shù)據(jù)隱私、版權訴訟風險等合規(guī)成本，像紐約時報就因數(shù)據(jù)來源跟OpenAI打過官司。

光看成本，還是開源模型省錢。Meta的Llama2訓練成本約250萬美元，OpenAI的GPT-4依賴微軟Azure算力，單次訓練成本超1億美元。

從技術原理看，開源模型的架構多為稠密Transformer（注意力機制深度學習模型）變體，訓練方法為公開強化學習框架，靠社區(qū)反饋迭代，靠外部審查保障安全，比如抱臉（Hugging Face）的模型掃描。

閉源模型的架構為融合私有架構，像GPT-4是稀疏化MoE（混合專家模型），訓練方法為定制化強化學習，靠用戶交互數(shù)據(jù)實時反哺迭代，內置內容過濾機制。

閉源模型在稀疏激活（激活極少比例參數(shù)處理每個Token）和多模態(tài)對齊（文本—圖像—代碼聯(lián)合表征）領域，領先開源模型1.5—2年左右。

從應用場景看，開源模型可以為企業(yè)做私有化部署，模型剪裁后進行邊緣計算，在手機端運行，可以為社區(qū)貢獻數(shù)據(jù)。閉源模型可以為企業(yè)提供標準化SaaS服務，在云端進行計算和推理，依賴商業(yè)價值導向來處理長尾需求。

像彭博基于開源Llama做了一個金融領域模型，成本降低了70%。Salesforce Einstein GPT直接調用了GPT-4的API，開發(fā)CRM（客戶關系管理）工具。

從收入差異看，開源模型靠技術服務—模型優(yōu)化和部署賺錢，但定價受社區(qū)生態(tài)制約，邊際成本會隨著用戶增長而攤薄（開發(fā)者貢獻算力），護城河則來自生態(tài)規(guī)模，像“抱臉”積累了15萬個模型。

閉源模型靠訂閱費用賺錢，壟斷定價權，邊際成本則隨用戶線性增長而上升（云計算資源被消耗），護城河來自技術代差。

開源模型一般5—7年才能盈利，靠開發(fā)出售Linux套件的Red Hat就是例子。閉源模型3年內就能實現(xiàn)正向現(xiàn)金流，OpenAI在2023年營收超16億美元。

從局限性看，開源模型的迭代比較慢，有合規(guī)風險和安全漏洞，一旦開發(fā)者流失就失去了可持續(xù)性。閉源模型由于存在技術黑箱，無法修改底層模型，很難針對性優(yōu)化，數(shù)據(jù)隱私問題和單點故障也很難解決，還面臨高資本的開支壓力。

開源模型最大的限制就是生態(tài)碎片化。閉源模型則無力克服技術鎖死效應。

實際上，開源與閉源并非對立，二者可能構成AI進化的雙螺旋結構：開源加速技術民主化，閉源推動商業(yè)可持續(xù)性。

未來的勝出者將是平衡駕馭二者的“變色龍”，既通過開源獲取生態(tài)勢能，也利用閉源實現(xiàn)價值捕獲。