
2月21日,國內AI公司深度求索(DeepSeek)發(fā)布“開源周”計劃,從2月24日開始,每日開源新內容,總共5個代碼庫。一系列重磅炸彈,攪得開源社區(qū)好不熱鬧。
而在更早前,百度已經(jīng)來了一個 180 度轉彎。
2月13日,百度宣布聊天機器人“文心一言”于4月1日起免費。2月14日,百度又宣布文心大模型4.5系列陸續(xù)推出,6月30日正式開源。
在開源的DeepSeek面向大眾之前,百度一直是閉源模型和收費服務的擁護者。
然而,連人工智能領頭羊OpenAI也扛不住壓力,早一步拋出“免費加開源”消息;一眾互聯(lián)網(wǎng)巨頭如英偉達、亞馬遜、微軟均將DeepSeek模型集成到自家平臺;一堆做“DeepSeek入口”的應用也趁機撈了一把流量,包括不缺流量的支付寶和微信。
百度的轉變并不是一個孤立事件。
受DeepSeek的開源“刺激”,全球人工智能大模型競爭技術路線,逐漸有開源壓倒閉源之勢。開源和閉源并沒有絕對的優(yōu)劣之分,只是當市場上出現(xiàn)顛覆者后,原先的主導者失去閉源的盈利護城河,不得不借“開源盛世”來擴張生態(tài)。
這場由DeepSeek引發(fā)的效率革命,標志著大模型競爭進入“后暴力計算時代”:模型效率取代絕對性能,成為核心競爭力;同時,全球AI權力秩序被重構,美國“一家獨大”霸權遭到削弱。
在后浪推前浪的趨勢下,未來的勝出者將是平衡駕馭二者的“變色龍”,既通過開源獲取生態(tài)勢能,也利用閉源實現(xiàn)價值捕獲。
DeepSeek“以小博大”,顛覆了人工智能大模型玩家的舊格局。
監(jiān)測網(wǎng)站Similarweb數(shù)據(jù)顯示,2025年1月,DeepSeek網(wǎng)站的訪問量環(huán)比增長2257%,單月訪問量達2.78億次,雖然與ChatGPT高達38億次的訪問量還有不小差距,但依然超過了蘋果iCloud、Salesforce等大公司網(wǎng)站。
OpenAI最先亂了陣腳,不斷開放新功能“挽尊”。
1月31日,放出推理模型o3-mini。2月3日,搜索網(wǎng)頁提煉文獻的深度研究(Deep Research)上線。2月5日,帶有網(wǎng)頁搜索功能的ChatGPT面向所有用戶開放。
2月13日,CEO薩姆·奧特曼在社交媒體宣布下一代AI大模型路線圖,GPT-5大模型基礎版將對ChatGPT免費用戶無限量開放。ChatGPT的付費訂閱者中,Plus版、Pro版訂閱者可以解鎖更“聰明”的GPT-5。模型功能將包含語音、Canvas(寫作、編碼工具)、搜索、深度研究等。
幾乎同時,百度也打出“免費加開源”牌。先是PC端聊天應用“文心一言”和移動端應用“文小言”將于4月1日起全面免費,文心大模型4.5也將在6月30日開源。

環(huán)球同此涼熱,巨頭也擔心“下課”。
OpenAI和百度齊齊從閉源轉向開源,原因比較接近:二者都是人工智能模型領域的先行者和主導者,本來可以靠閉源和收費來賺錢。如今DeepSeek物特別美、價尤其廉、人民群眾十分喜歡,他們再唱老調就真的賺不到錢了。
在美國,靠ChatGPT一舉成名的OpenAI,最早推出收費模式。2022年11月ChatGPT免費上線,2023年2月便推出20美元/月的Plus會員。2024年5月GPT-4o面世,12月推出200美元/月的Pro版本。
ChatGPT至今有4個收費計劃,Team、Enterprise面向企業(yè),Plus、Pro面向個人。Plus可以使用OpenAI全部模型,也可以創(chuàng)建GPTs;Pro用戶在Plus的權益之外,還可以使用今年1月剛推出的智能體功能Operator(操作員)。
在中國,百度較早入局人工智能大模型領域。2021年7月推出文心大模型3.0,2023年3月推出聊天機器人“文心一言”。2023年6月,文心大模型升級到3.5版本。10月,文心大模型4.0版本發(fā)布。2024年6月,4.0 Turbo發(fā)布。
據(jù)百度稱,2024年文心大模型日均調用量超過15億次,較2023年增長超30倍。
2023年11月,百度文心一言推出付費會員模式,連續(xù)包月價格為49.9元/月,會員可以使用2023年10月發(fā)布的、目前仍是百度最新的模型文心一言4.0,此外還有圖片生成、網(wǎng)頁插件等權益。
中國其他大模型公司也有收費模式。智譜AI的聊天機器人智譜清言,連續(xù)包月價格為19元/月,可解鎖最新模型的無限次使用、視頻生成等功能;月之暗面旗下的Kimi智能助手有打賞功能,但并未綁定使用權益。
總體來看,在人工智能大模型本身就存在開源路線、Meta的開源大模型Llama實力雄厚的情況下,閉源模型并不存在高枕無憂的護城河。
開源的DeepSeek一問世,“頭鐵”的OpenAI、百度就不得不“順勢而為”了。
開源和閉源的“源”,指的是“源代碼”。開放源代碼,允許其他開發(fā)者使用、傳播,技術可以持續(xù)改進。“開源”理念源自20世紀90年代開發(fā)者社區(qū)。
“戰(zhàn)爭”是埃隆·馬斯克挑起來的。2024年2月,作為OpenAI的創(chuàng)始人和最早投資人之一,馬斯克起訴OpenAI違背創(chuàng)始協(xié)議、追逐商業(yè)利益,將AI大模型閉源。OpenAI反唇相譏,稱馬斯克早就認可其“追逐商業(yè)利益”。
當年3月,馬斯克將旗下大模型Grok-1開源,以此證明自己“并非逐利”。一個月后,Meta發(fā)布Llama3系列模型,是當時最強大的開源大模型。原本閉源的谷歌也有點坐不住了, 2024年2月發(fā)布開源模型系列Gemma。
美國的開源模型陣營,對閉源的生成式預訓練模型GPT窮追不舍。業(yè)界普遍認為閉源模型的能力把開源模型甩開“一年半左右”。
在中國,由于算力受到阻礙,開源還是閉源的討論很少。2024年,百度創(chuàng)始人、CEO李彥宏多次表示,“模型開源的意義其實不是很大”“開源模型會越來越落后”。
也有一些公司選擇開源路線。
金沙江創(chuàng)投主管合伙人朱嘯虎的言論“不會投資中國的基座大模型創(chuàng)業(yè)公司”曾激起熱議,他認為開源大模型隨時會顛覆閉源基座模型。阿里云先后開源多個模型;創(chuàng)業(yè)公司里,零一萬物、百川智能、面壁智能都在打造開源模型。
中國各地方政府支持的實驗室或研究所也聚焦開源大模型,包括科技部和北京市政府支持成立的智源研究院,深圳市政府主導的鵬城實驗室,上海市政府主導的上海AI實驗室,以及粵港澳大灣區(qū)數(shù)字經(jīng)濟研究院等。

雖然開源模型和閉源模型還有一定差距,但隨著技術路線的清晰和開源技術的迭代,開源和閉源的差距將不斷縮小、直至拉平。
但堅持“閉源更好”的百度,當時的判斷是,開源并不便宜,且技術會越發(fā)落后,“開源模型沒有商業(yè)模式”。這一判斷基于三個條件:一是算力和工程能力門檻高,只有科技大廠才有實力主導開源模型;二是研發(fā)成本高,傳統(tǒng)開源軟件的商業(yè)模式“沒錢可燒”;三是閉源模型通過程序接口(API)調用,可供企業(yè)部署軟件。
DeepSeek“異軍突起”,恰恰證明這三個條件并不完全成立。
而且,百度期待的“企業(yè)級客戶”也興趣寥寥。因為數(shù)據(jù)是企業(yè)最寶貴的資源,一旦放在大廠平臺上,日后是否真正屬于自己就不好說了。移動互聯(lián)網(wǎng)時代的“像素級復制”,曾給中國創(chuàng)業(yè)者最沉重的打擊。
論中國互聯(lián)網(wǎng)三巨頭BAT,阿里是押注開源的典型代表。2022年11月,阿里發(fā)布了中文AI大模型開源社區(qū)“魔搭”(Model Scope)。通義千問模型也是開源的。2023年8月以來,阿里云先后開源和更新了數(shù)十個參數(shù)版本的模型。
騰訊的“混元大模型”去年選擇開源,其公開說法是,經(jīng)過一年多的探索,在閉源模式下將產(chǎn)品和技術積累到一定程度后,才選擇了開源。
2025年初,DeepSeek第一次令中國企業(yè)看到了開源模式的商業(yè)價值和影響力、看到了產(chǎn)業(yè)格局變化的可能性、看到了生態(tài)開放的沖擊力—技術民主化的拐點已經(jīng)到來。
“最后”,百度選擇開源。
互聯(lián)網(wǎng)時代,一貫存在“巨頭守成”加“新銳破局”的競爭。
由于“新銳”DeepSeek的顛覆性沖擊,巨頭OpenAI立刻作出“免費”反應,隨即產(chǎn)生了傳導效應—GPT-4o免費后,中國AI初創(chuàng)公司的API調用成本下降30%,百度隨之失去了收費壁壘。而OpenAI的閉源數(shù)據(jù)飛輪仍在加速,其日均新增訓練數(shù)據(jù)量動輒是中國企業(yè)的5倍以上,技術代差可能進一步拉大。
對于AI企業(yè)而言,開源或閉源只是一種發(fā)展手段,不是什么“絕對理想”。

要理解開源模型和閉源模型的核心差異,可以從基礎條件、技術原理、應用場景、可營利性和局限性等五個維度來觀察。
從基礎條件看,開源模型以公開數(shù)據(jù)集、社區(qū)貢獻數(shù)據(jù)為數(shù)據(jù)來源,以分布式的、開發(fā)者自有的GPU集群為算力支撐,開發(fā)主體是社區(qū)協(xié)作者,比如GitHub的開發(fā)者,需要處理開源協(xié)議兼容性,存在一些合規(guī)成本。
閉源模型以專有數(shù)據(jù)如用戶行為日志、私有數(shù)據(jù)庫、清洗后公開數(shù)據(jù)為數(shù)據(jù)來源,靠集中式的超算中心為算力支撐,開發(fā)主體是企業(yè)級團隊,需要承擔數(shù)據(jù)隱私、版權訴訟風險等合規(guī)成本,像紐約時報就因數(shù)據(jù)來源跟OpenAI打過官司。
光看成本,還是開源模型省錢。Meta的Llama2訓練成本約250萬美元,OpenAI的GPT-4依賴微軟Azure算力,單次訓練成本超1億美元。
從技術原理看,開源模型的架構多為稠密Transformer(注意力機制深度學習模型)變體,訓練方法為公開強化學習框架,靠社區(qū)反饋迭代,靠外部審查保障安全,比如抱臉(Hugging Face)的模型掃描。
閉源模型的架構為融合私有架構,像GPT-4是稀疏化MoE(混合專家模型),訓練方法為定制化強化學習,靠用戶交互數(shù)據(jù)實時反哺迭代,內置內容過濾機制。
閉源模型在稀疏激活(激活極少比例參數(shù)處理每個Token)和多模態(tài)對齊(文本—圖像—代碼聯(lián)合表征)領域,領先開源模型1.5—2年左右。
從應用場景看,開源模型可以為企業(yè)做私有化部署,模型剪裁后進行邊緣計算,在手機端運行,可以為社區(qū)貢獻數(shù)據(jù)。閉源模型可以為企業(yè)提供標準化SaaS服務,在云端進行計算和推理,依賴商業(yè)價值導向來處理長尾需求。

像彭博基于開源Llama做了一個金融領域模型,成本降低了70%。Salesforce Einstein GPT直接調用了GPT-4的API,開發(fā)CRM(客戶關系管理)工具。
從收入差異看,開源模型靠技術服務—模型優(yōu)化和部署賺錢,但定價受社區(qū)生態(tài)制約,邊際成本會隨著用戶增長而攤薄(開發(fā)者貢獻算力),護城河則來自生態(tài)規(guī)模,像“抱臉”積累了15萬個模型。
閉源模型靠訂閱費用賺錢,壟斷定價權,邊際成本則隨用戶線性增長而上升(云計算資源被消耗),護城河來自技術代差。
開源模型一般5—7年才能盈利,靠開發(fā)出售Linux套件的Red Hat就是例子。閉源模型3年內就能實現(xiàn)正向現(xiàn)金流,OpenAI在2023年營收超16億美元。
從局限性看,開源模型的迭代比較慢,有合規(guī)風險和安全漏洞,一旦開發(fā)者流失就失去了可持續(xù)性。閉源模型由于存在技術黑箱,無法修改底層模型,很難針對性優(yōu)化,數(shù)據(jù)隱私問題和單點故障也很難解決,還面臨高資本的開支壓力。
開源模型最大的限制就是生態(tài)碎片化。閉源模型則無力克服技術鎖死效應。
實際上,開源與閉源并非對立,二者可能構成AI進化的雙螺旋結構:開源加速技術民主化,閉源推動商業(yè)可持續(xù)性。
未來的勝出者將是平衡駕馭二者的“變色龍”,既通過開源獲取生態(tài)勢能,也利用閉源實現(xiàn)價值捕獲。