
2月21日,國內(nèi)AI公司深度求索(DeepSeek)發(fā)布“開源周”計劃,從2月24日開始,每日開源新內(nèi)容,總共5個代碼庫。一系列重磅炸彈,攪得開源社區(qū)好不熱鬧。
而在更早前,百度已經(jīng)來了一個 180 度轉(zhuǎn)彎。
2月13日,百度宣布聊天機(jī)器人“文心一言”于4月1日起免費(fèi)。2月14日,百度又宣布文心大模型4.5系列陸續(xù)推出,6月30日正式開源。
在開源的DeepSeek面向大眾之前,百度一直是閉源模型和收費(fèi)服務(wù)的擁護(hù)者。
然而,連人工智能領(lǐng)頭羊OpenAI也扛不住壓力,早一步拋出“免費(fèi)加開源”消息;一眾互聯(lián)網(wǎng)巨頭如英偉達(dá)、亞馬遜、微軟均將DeepSeek模型集成到自家平臺;一堆做“DeepSeek入口”的應(yīng)用也趁機(jī)撈了一把流量,包括不缺流量的支付寶和微信。
百度的轉(zhuǎn)變并不是一個孤立事件。
受DeepSeek的開源“刺激”,全球人工智能大模型競爭技術(shù)路線,逐漸有開源壓倒閉源之勢。開源和閉源并沒有絕對的優(yōu)劣之分,只是當(dāng)市場上出現(xiàn)顛覆者后,原先的主導(dǎo)者失去閉源的盈利護(hù)城河,不得不借“開源盛世”來擴(kuò)張生態(tài)。
這場由DeepSeek引發(fā)的效率革命,標(biāo)志著大模型競爭進(jìn)入“后暴力計算時代”:模型效率取代絕對性能,成為核心競爭力;同時,全球AI權(quán)力秩序被重構(gòu),美國“一家獨大”霸權(quán)遭到削弱。
在后浪推前浪的趨勢下,未來的勝出者將是平衡駕馭二者的“變色龍”,既通過開源獲取生態(tài)勢能,也利用閉源實現(xiàn)價值捕獲。
DeepSeek“以小博大”,顛覆了人工智能大模型玩家的舊格局。
監(jiān)測網(wǎng)站Similarweb數(shù)據(jù)顯示,2025年1月,DeepSeek網(wǎng)站的訪問量環(huán)比增長2257%,單月訪問量達(dá)2.78億次,雖然與ChatGPT高達(dá)38億次的訪問量還有不小差距,但依然超過了蘋果iCloud、Salesforce等大公司網(wǎng)站。
OpenAI最先亂了陣腳,不斷開放新功能“挽尊”。
1月31日,放出推理模型o3-mini。2月3日,搜索網(wǎng)頁提煉文獻(xiàn)的深度研究(Deep Research)上線。2月5日,帶有網(wǎng)頁搜索功能的ChatGPT面向所有用戶開放。
2月13日,CEO薩姆·奧特曼在社交媒體宣布下一代AI大模型路線圖,GPT-5大模型基礎(chǔ)版將對ChatGPT免費(fèi)用戶無限量開放。ChatGPT的付費(fèi)訂閱者中,Plus版、Pro版訂閱者可以解鎖更“聰明”的GPT-5。模型功能將包含語音、Canvas(寫作、編碼工具)、搜索、深度研究等。
幾乎同時,百度也打出“免費(fèi)加開源”牌。先是PC端聊天應(yīng)用“文心一言”和移動端應(yīng)用“文小言”將于4月1日起全面免費(fèi),文心大模型4.5也將在6月30日開源。

環(huán)球同此涼熱,巨頭也擔(dān)心“下課”。
OpenAI和百度齊齊從閉源轉(zhuǎn)向開源,原因比較接近:二者都是人工智能模型領(lǐng)域的先行者和主導(dǎo)者,本來可以靠閉源和收費(fèi)來賺錢。如今DeepSeek物特別美、價尤其廉、人民群眾十分喜歡,他們再唱老調(diào)就真的賺不到錢了。
在美國,靠ChatGPT一舉成名的OpenAI,最早推出收費(fèi)模式。2022年11月ChatGPT免費(fèi)上線,2023年2月便推出20美元/月的Plus會員。2024年5月GPT-4o面世,12月推出200美元/月的Pro版本。
ChatGPT至今有4個收費(fèi)計劃,Team、Enterprise面向企業(yè),Plus、Pro面向個人。Plus可以使用OpenAI全部模型,也可以創(chuàng)建GPTs;Pro用戶在Plus的權(quán)益之外,還可以使用今年1月剛推出的智能體功能Operator(操作員)。
在中國,百度較早入局人工智能大模型領(lǐng)域。2021年7月推出文心大模型3.0,2023年3月推出聊天機(jī)器人“文心一言”。2023年6月,文心大模型升級到3.5版本。10月,文心大模型4.0版本發(fā)布。2024年6月,4.0 Turbo發(fā)布。
據(jù)百度稱,2024年文心大模型日均調(diào)用量超過15億次,較2023年增長超30倍。
2023年11月,百度文心一言推出付費(fèi)會員模式,連續(xù)包月價格為49.9元/月,會員可以使用2023年10月發(fā)布的、目前仍是百度最新的模型文心一言4.0,此外還有圖片生成、網(wǎng)頁插件等權(quán)益。
中國其他大模型公司也有收費(fèi)模式。智譜AI的聊天機(jī)器人智譜清言,連續(xù)包月價格為19元/月,可解鎖最新模型的無限次使用、視頻生成等功能;月之暗面旗下的Kimi智能助手有打賞功能,但并未綁定使用權(quán)益。
總體來看,在人工智能大模型本身就存在開源路線、Meta的開源大模型Llama實力雄厚的情況下,閉源模型并不存在高枕無憂的護(hù)城河。
開源的DeepSeek一問世,“頭鐵”的OpenAI、百度就不得不“順勢而為”了。
開源和閉源的“源”,指的是“源代碼”。開放源代碼,允許其他開發(fā)者使用、傳播,技術(shù)可以持續(xù)改進(jìn)。“開源”理念源自20世紀(jì)90年代開發(fā)者社區(qū)。
“戰(zhàn)爭”是埃隆·馬斯克挑起來的。2024年2月,作為OpenAI的創(chuàng)始人和最早投資人之一,馬斯克起訴OpenAI違背創(chuàng)始協(xié)議、追逐商業(yè)利益,將AI大模型閉源。OpenAI反唇相譏,稱馬斯克早就認(rèn)可其“追逐商業(yè)利益”。
當(dāng)年3月,馬斯克將旗下大模型Grok-1開源,以此證明自己“并非逐利”。一個月后,Meta發(fā)布Llama3系列模型,是當(dāng)時最強(qiáng)大的開源大模型。原本閉源的谷歌也有點坐不住了, 2024年2月發(fā)布開源模型系列Gemma。
美國的開源模型陣營,對閉源的生成式預(yù)訓(xùn)練模型GPT窮追不舍。業(yè)界普遍認(rèn)為閉源模型的能力把開源模型甩開“一年半左右”。
在中國,由于算力受到阻礙,開源還是閉源的討論很少。2024年,百度創(chuàng)始人、CEO李彥宏多次表示,“模型開源的意義其實不是很大”“開源模型會越來越落后”。
也有一些公司選擇開源路線。
金沙江創(chuàng)投主管合伙人朱嘯虎的言論“不會投資中國的基座大模型創(chuàng)業(yè)公司”曾激起熱議,他認(rèn)為開源大模型隨時會顛覆閉源基座模型。阿里云先后開源多個模型;創(chuàng)業(yè)公司里,零一萬物、百川智能、面壁智能都在打造開源模型。
中國各地方政府支持的實驗室或研究所也聚焦開源大模型,包括科技部和北京市政府支持成立的智源研究院,深圳市政府主導(dǎo)的鵬城實驗室,上海市政府主導(dǎo)的上海AI實驗室,以及粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院等。

雖然開源模型和閉源模型還有一定差距,但隨著技術(shù)路線的清晰和開源技術(shù)的迭代,開源和閉源的差距將不斷縮小、直至拉平。
但堅持“閉源更好”的百度,當(dāng)時的判斷是,開源并不便宜,且技術(shù)會越發(fā)落后,“開源模型沒有商業(yè)模式”。這一判斷基于三個條件:一是算力和工程能力門檻高,只有科技大廠才有實力主導(dǎo)開源模型;二是研發(fā)成本高,傳統(tǒng)開源軟件的商業(yè)模式“沒錢可燒”;三是閉源模型通過程序接口(API)調(diào)用,可供企業(yè)部署軟件。
DeepSeek“異軍突起”,恰恰證明這三個條件并不完全成立。
而且,百度期待的“企業(yè)級客戶”也興趣寥寥。因為數(shù)據(jù)是企業(yè)最寶貴的資源,一旦放在大廠平臺上,日后是否真正屬于自己就不好說了。移動互聯(lián)網(wǎng)時代的“像素級復(fù)制”,曾給中國創(chuàng)業(yè)者最沉重的打擊。
論中國互聯(lián)網(wǎng)三巨頭BAT,阿里是押注開源的典型代表。2022年11月,阿里發(fā)布了中文AI大模型開源社區(qū)“魔搭”(Model Scope)。通義千問模型也是開源的。2023年8月以來,阿里云先后開源和更新了數(shù)十個參數(shù)版本的模型。
騰訊的“混元大模型”去年選擇開源,其公開說法是,經(jīng)過一年多的探索,在閉源模式下將產(chǎn)品和技術(shù)積累到一定程度后,才選擇了開源。
2025年初,DeepSeek第一次令中國企業(yè)看到了開源模式的商業(yè)價值和影響力、看到了產(chǎn)業(yè)格局變化的可能性、看到了生態(tài)開放的沖擊力—技術(shù)民主化的拐點已經(jīng)到來。
“最后”,百度選擇開源。
互聯(lián)網(wǎng)時代,一貫存在“巨頭守成”加“新銳破局”的競爭。
由于“新銳”DeepSeek的顛覆性沖擊,巨頭OpenAI立刻作出“免費(fèi)”反應(yīng),隨即產(chǎn)生了傳導(dǎo)效應(yīng)—GPT-4o免費(fèi)后,中國AI初創(chuàng)公司的API調(diào)用成本下降30%,百度隨之失去了收費(fèi)壁壘。而OpenAI的閉源數(shù)據(jù)飛輪仍在加速,其日均新增訓(xùn)練數(shù)據(jù)量動輒是中國企業(yè)的5倍以上,技術(shù)代差可能進(jìn)一步拉大。
對于AI企業(yè)而言,開源或閉源只是一種發(fā)展手段,不是什么“絕對理想”。

要理解開源模型和閉源模型的核心差異,可以從基礎(chǔ)條件、技術(shù)原理、應(yīng)用場景、可營利性和局限性等五個維度來觀察。
從基礎(chǔ)條件看,開源模型以公開數(shù)據(jù)集、社區(qū)貢獻(xiàn)數(shù)據(jù)為數(shù)據(jù)來源,以分布式的、開發(fā)者自有的GPU集群為算力支撐,開發(fā)主體是社區(qū)協(xié)作者,比如GitHub的開發(fā)者,需要處理開源協(xié)議兼容性,存在一些合規(guī)成本。
閉源模型以專有數(shù)據(jù)如用戶行為日志、私有數(shù)據(jù)庫、清洗后公開數(shù)據(jù)為數(shù)據(jù)來源,靠集中式的超算中心為算力支撐,開發(fā)主體是企業(yè)級團(tuán)隊,需要承擔(dān)數(shù)據(jù)隱私、版權(quán)訴訟風(fēng)險等合規(guī)成本,像紐約時報就因數(shù)據(jù)來源跟OpenAI打過官司。
光看成本,還是開源模型省錢。Meta的Llama2訓(xùn)練成本約250萬美元,OpenAI的GPT-4依賴微軟Azure算力,單次訓(xùn)練成本超1億美元。
從技術(shù)原理看,開源模型的架構(gòu)多為稠密Transformer(注意力機(jī)制深度學(xué)習(xí)模型)變體,訓(xùn)練方法為公開強(qiáng)化學(xué)習(xí)框架,靠社區(qū)反饋迭代,靠外部審查保障安全,比如抱臉(Hugging Face)的模型掃描。
閉源模型的架構(gòu)為融合私有架構(gòu),像GPT-4是稀疏化MoE(混合專家模型),訓(xùn)練方法為定制化強(qiáng)化學(xué)習(xí),靠用戶交互數(shù)據(jù)實時反哺迭代,內(nèi)置內(nèi)容過濾機(jī)制。
閉源模型在稀疏激活(激活極少比例參數(shù)處理每個Token)和多模態(tài)對齊(文本—圖像—代碼聯(lián)合表征)領(lǐng)域,領(lǐng)先開源模型1.5—2年左右。
從應(yīng)用場景看,開源模型可以為企業(yè)做私有化部署,模型剪裁后進(jìn)行邊緣計算,在手機(jī)端運(yùn)行,可以為社區(qū)貢獻(xiàn)數(shù)據(jù)。閉源模型可以為企業(yè)提供標(biāo)準(zhǔn)化SaaS服務(wù),在云端進(jìn)行計算和推理,依賴商業(yè)價值導(dǎo)向來處理長尾需求。

像彭博基于開源Llama做了一個金融領(lǐng)域模型,成本降低了70%。Salesforce Einstein GPT直接調(diào)用了GPT-4的API,開發(fā)CRM(客戶關(guān)系管理)工具。
從收入差異看,開源模型靠技術(shù)服務(wù)—模型優(yōu)化和部署賺錢,但定價受社區(qū)生態(tài)制約,邊際成本會隨著用戶增長而攤薄(開發(fā)者貢獻(xiàn)算力),護(hù)城河則來自生態(tài)規(guī)模,像“抱臉”積累了15萬個模型。
閉源模型靠訂閱費(fèi)用賺錢,壟斷定價權(quán),邊際成本則隨用戶線性增長而上升(云計算資源被消耗),護(hù)城河來自技術(shù)代差。
開源模型一般5—7年才能盈利,靠開發(fā)出售Linux套件的Red Hat就是例子。閉源模型3年內(nèi)就能實現(xiàn)正向現(xiàn)金流,OpenAI在2023年營收超16億美元。
從局限性看,開源模型的迭代比較慢,有合規(guī)風(fēng)險和安全漏洞,一旦開發(fā)者流失就失去了可持續(xù)性。閉源模型由于存在技術(shù)黑箱,無法修改底層模型,很難針對性優(yōu)化,數(shù)據(jù)隱私問題和單點故障也很難解決,還面臨高資本的開支壓力。
開源模型最大的限制就是生態(tài)碎片化。閉源模型則無力克服技術(shù)鎖死效應(yīng)。
實際上,開源與閉源并非對立,二者可能構(gòu)成AI進(jìn)化的雙螺旋結(jié)構(gòu):開源加速技術(shù)民主化,閉源推動商業(yè)可持續(xù)性。
未來的勝出者將是平衡駕馭二者的“變色龍”,既通過開源獲取生態(tài)勢能,也利用閉源實現(xiàn)價值捕獲。