DeepSeek,中國人工智能大模型的新里程碑,自2025年1月上線以來受到全球關(guān)注,不僅引爆了新一輪的人工智能應(yīng)用熱潮,更是在短期內(nèi)引發(fā)了市場對人工智能大模型企業(yè)巨額算力資源投入的廣泛質(zhì)疑,觸發(fā)美股部分算力相關(guān)科技股的劇烈震蕩,在全球算力產(chǎn)業(yè)界掀起波瀾。算力芯片領(lǐng)域的巨頭英偉達(dá),其股價(jià)在1月27日暴跌約17%,市值瞬間蒸發(fā)近6000億美元,這一跌幅創(chuàng)下了美國歷史上單日市值跌幅的新紀(jì)錄,截至3月上旬,英偉達(dá)已經(jīng)較1月的市值高點(diǎn)跌去了約一萬億美元。深度求索公司(DeepSeek)推出的系列開源大模型之所以備受業(yè)界關(guān)注,主要在于其提供了高性能且成本低廉的訓(xùn)練方案,這引發(fā)了業(yè)界對算力基礎(chǔ)設(shè)施深度投資和價(jià)值利用的新思考,對整個算力產(chǎn)業(yè)產(chǎn)生了廣泛而深遠(yuǎn)的影響。
引發(fā)新一輪人工智能熱潮
自ChatGPT引爆人工智能大模型概念以來,全球大模型規(guī)模和數(shù)量不斷增加,其性能也實(shí)現(xiàn)了顯著提升。然而,相應(yīng)的人工智能大模型規(guī)模的訓(xùn)練成本也在急速上升。在DeepSeek出現(xiàn)之前,以中美為代表的多個人工智能企業(yè)均選擇在大模型算力基建上進(jìn)行超高投入,被外界形象地稱為AI領(lǐng)域的“軍備競賽”。
一般來說,降低人工智能大模型訓(xùn)練和應(yīng)用成本的方法有二:一是依賴于計(jì)算設(shè)備設(shè)施的技術(shù)革新或硬件成本下降,通過計(jì)算效率的提升來降低成本,例如,以英偉達(dá)為代表的算力芯片供應(yīng)商通過軟硬件技術(shù)的進(jìn)步推動芯片計(jì)算效率的提升,但芯片計(jì)算效率的提高也可能導(dǎo)致芯片價(jià)格等硬件成本的增加。二是靠大模型技術(shù)優(yōu)化和算法革新,以減少訓(xùn)練所需的計(jì)算資源或時間成本。
DeepSeek選擇的是第二種。2024年12月,DeepSeek-V3正式發(fā)布,作為一款強(qiáng)大的MoE(混合專家模型)語言模型,DeepSeek-V3在數(shù)學(xué)、代碼等任務(wù)上表現(xiàn)出色,甚至能與一些閉源大模型如GPT-4o、Claude-3.5-sonnet相媲美。據(jù)官方技術(shù)論文披露,DeepSeek-V3的訓(xùn)練成本僅為557.6萬美元,遠(yuǎn)低于其他大型語言模型。2025年1月發(fā)布的DeepSeek-R1是推理模型,擅長處理復(fù)雜任務(wù),其在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上比肩OpenAI-o1,小模型超越o1-mini;并且DeepSeek團(tuán)隊(duì)將R1推理能力蒸餾到更小的模型中,讓小模型在保持高性能的同時,更易于部署。
自DeepSeek-R1發(fā)布后,在無任何廣告投放的情況下,DeepSeek"APP在7天內(nèi)便實(shí)現(xiàn)了1億用戶增長,迅速躍升為全球增速最快的AI應(yīng)用,各行各業(yè)掀起了DeepSeek大模型的適配和接入應(yīng)用潮。在算力芯片領(lǐng)域,華為、摩爾線程、英特爾、英偉達(dá)等企業(yè)迅速響應(yīng),不僅宣布了DeepSeek大模型的適配與上線計(jì)劃,還推出了具備DeepSeek大模型本地部署能力的算力芯片產(chǎn)品。在云服務(wù)領(lǐng)域,硅基流動宣布率先和華為云合作推出基于昇騰云的DeepSeek-R1amp;V3的推理服務(wù),其他廠商諸如阿里云、騰訊云、浪潮云等也紛紛加入戰(zhàn)局;在互聯(lián)網(wǎng)領(lǐng)域,騰訊系軟件如微信、騰訊文檔、騰訊元寶、QQ瀏覽器等紛紛宣布接入DeepSeek-R1滿血版,同時,三大運(yùn)營商、各大手機(jī)廠商及新能源汽車廠商也迅速跟進(jìn),接入了DeepSeek-R1。在機(jī)構(gòu)方面,多地政府在探索DeepSeek大模型的接入,各大金融機(jī)構(gòu)、高等院校、大量中小企業(yè)等也陸續(xù)接入并開展AI應(yīng)用。
相較于已有的推理型大模型,DeepSeek-R1的爆火有以下原因:一是高效能。DeepSeek大模型在模型效率上實(shí)現(xiàn)了質(zhì)的飛躍,大幅削減了訓(xùn)練和推理成本,進(jìn)一步降低了人工智能的應(yīng)用門檻。同時,憑借創(chuàng)新技術(shù),確保蒸餾后的小模型依然保持卓越性能,便于在低成本環(huán)境下實(shí)現(xiàn)本地部署。二是開源生態(tài)。深度求索公司選擇了開源之路,于2月中旬連續(xù)五日公開五大核心代碼庫及詳盡技術(shù)文檔,迅速吸引全球AI開發(fā)者的密切關(guān)注。開源策略不僅加速了各行各業(yè)的快速接入,還使得開源的蒸餾小模型獲得和部署更為便捷,從而極大地提升了行業(yè)影響力,拓寬了應(yīng)用范圍。三是本土化適配。DeepSeek大模型針對中文語境或特定行業(yè)需求(如合規(guī)性、數(shù)據(jù)安全)進(jìn)行了一定程度的優(yōu)化,在中文NLP(自然語言處理)任務(wù)中表現(xiàn)優(yōu)于國際通用型,在網(wǎng)絡(luò)爆火后,短時間內(nèi)吸引了大量用戶嘗試使用,并進(jìn)一步造成了二次廣泛傳播,徹底激活國內(nèi)人工智能市場。
對短期算力市場形成波動
實(shí)事求是地說,DeepSeek的橫空出世與相關(guān)算力科技股的短期波動之間,并不存在單一的因果關(guān)系,而是受到多重因素的共同影響。2024年第四季度財(cái)報(bào)顯示,美股“七姐妹”(蘋果、谷歌、亞馬遜、微軟、Meta、特斯拉、英偉達(dá))中的部分企業(yè)增長不及預(yù)期,加之云服務(wù)業(yè)務(wù)供給增長放緩,進(jìn)一步加劇了投資者對人工智能領(lǐng)域巨額投資回報(bào)前景的擔(dān)憂,進(jìn)而引發(fā)了市場對過去幾年人工智能行業(yè)泡沫的擔(dān)憂。但股市波動顯示了市場普遍對人工智能需要更高算力堆砌的說法的質(zhì)疑,各類大模型的高價(jià)收費(fèi)和會員費(fèi)難以支撐其核心賣點(diǎn),短期內(nèi)AI大模型領(lǐng)域掀起了新一輪的降價(jià)潮,阿里云、騰訊、字節(jié)跳動、智譜等國內(nèi)廠商均宣布其旗下的模型API降價(jià)。
深度求索公司的開源策略也刺激了各類大模型企業(yè):阿里云開源了全尺寸多模態(tài)的阿里萬相大模型(Wan2.1),3月初又開源了QwQ-32B推理模型,后者“展現(xiàn)出與DeepSeek-R1(激活參數(shù)37B/總參數(shù)671B)相匹敵的性能”;百度宣布將開源下一代文心大模型;字節(jié)跳動豆包大模型團(tuán)隊(duì)聯(lián)合北京交通大學(xué)等開發(fā)的視頻生成實(shí)驗(yàn)?zāi)P蚔ideoWorld正式開源;月之暗面Kimi宣布開源大模型Moonlight;OpenAl向包括免費(fèi)用戶在內(nèi)的所有用戶開放了o3-mini的使用權(quán)限,并且未來也計(jì)劃對免費(fèi)用戶開放GPT-5。
DeepSeek通過算法優(yōu)化,使得原本在大模型訓(xùn)練領(lǐng)域占據(jù)絕對主導(dǎo)地位的英偉達(dá)系列算力芯片失去了壓倒性優(yōu)勢,而且DeepSeek模型在其他算力芯片上的表現(xiàn)同樣出色,且成本更低,這為國產(chǎn)算力芯片的發(fā)展帶來了積極的影響。
長期看智算供需均將保持增長
深度求索公司通過一系列技術(shù)創(chuàng)新和開源策略,提出了以“算法驅(qū)動”為核心的大模型訓(xùn)練和推理新模式,推動了人工智能應(yīng)用向著高效率、低成本和普惠化方向演進(jìn)。長期看,人工智能應(yīng)用和智能算力均將保持高速增長態(tài)勢。
人工智能擴(kuò)張,算力需求將持續(xù)增長。短期內(nèi),DeepSeek對算力市場造成了一定沖擊,特別是對算力基礎(chǔ)設(shè)施大規(guī)模投入的成效提出了挑戰(zhàn)。然而,從宏觀和長遠(yuǎn)視角來看,DeepSeek所引發(fā)的人工智能熱潮及其與各行業(yè)的深度融合,將促進(jìn)算力資源需求的持續(xù)增長,并加速算力從通用向智能的轉(zhuǎn)變進(jìn)程。微軟首席執(zhí)行官納德拉嘗試用杰文斯悖論(Jevons"Paradox)來解釋這一現(xiàn)象,即當(dāng)技術(shù)進(jìn)步提高了效率,資源消耗不僅沒有減少,反而激增,如瓦特改良的蒸汽機(jī)讓煤炭燃燒更加高效,但結(jié)果卻是煤炭需求飆升,又如福特的流水線讓汽車制造更快、更便宜,直接影響卻是全球石油消耗的猛漲。
當(dāng)下,人工智能大模型成為新質(zhì)生產(chǎn)力的重要代表,全球人工智能大模型的數(shù)量和參數(shù)規(guī)模迅速膨脹,多模態(tài)大模型的出現(xiàn)進(jìn)一步推高了算力需求,AI越強(qiáng)大,參與者越多,應(yīng)用越廣泛,整體對算力資源的需求也將越高。盡管DeepSeek通過算法和技術(shù)進(jìn)步在一定程度上提升了大模型訓(xùn)練和推理的效率,但這種效率的提升也吸引了更多的參與者,降低了大模型本地化部署的門檻,從而促進(jìn)了更多大模型的構(gòu)建與訓(xùn)練。此外,這新一波的人工智能浪潮激發(fā)了各大人工智能大模型企業(yè)的技術(shù)進(jìn)步,使得算力全產(chǎn)業(yè)鏈得到了賦能升級,再加上各行業(yè)多樣化的需求,進(jìn)一步推動了算力資源需求多樣性的提升??梢?,人工智能技術(shù)的普惠化將驅(qū)動算力需求側(cè)的爆發(fā)式增長,也就是說,DeepSeek等大模型越好用,越可能推動算力的“過度擴(kuò)張”,形成“效率提升→需求激增→資源消耗”的循環(huán)。
國家算力基建持續(xù)推進(jìn),智算轉(zhuǎn)型占比提升。2025年的國務(wù)院《政府工作報(bào)告》指出:持續(xù)推進(jìn)“人工智能+”行動,將數(shù)字技術(shù)與制造優(yōu)勢、市場優(yōu)勢更好結(jié)合起來,支持大模型廣泛應(yīng)用,大力發(fā)展智能網(wǎng)聯(lián)新能源汽車、人工智能手機(jī)和電腦、智能機(jī)器人等新一代智能終端以及智能制造裝備。該政策顯示我國正積極推動人工智能技術(shù)在實(shí)體經(jīng)濟(jì)中的深度應(yīng)用,DeepSeek引領(lǐng)的人工智能浪潮,將成為推動我國算力基礎(chǔ)設(shè)施建設(shè)的重要力量。在“十四五”規(guī)劃期間,我國在全國算力基礎(chǔ)設(shè)施領(lǐng)域進(jìn)行了一系列戰(zhàn)略布局。2022年,“東數(shù)西算”工程正式啟動,著力構(gòu)建全國一體化算力網(wǎng),目前已布局的八大國家樞紐節(jié)點(diǎn)和十大國家數(shù)據(jù)中心集群在有序建設(shè)中。2024年3月,工業(yè)和信息化部等七部門印發(fā)《推動工業(yè)領(lǐng)域設(shè)備更新實(shí)施方案》,提出要推動“云邊端”算力協(xié)同發(fā)展,加大高性能智算供給,在算力樞紐節(jié)點(diǎn)建設(shè)智算中心;同年10月,《關(guān)于加快公共數(shù)據(jù)資源開發(fā)利用的意見》印發(fā),文件進(jìn)一步提出要聚焦算力網(wǎng)絡(luò)和可信流通,支持?jǐn)?shù)據(jù)基礎(chǔ)設(shè)施企業(yè)發(fā)展,更加明確了我國算力產(chǎn)業(yè)的重點(diǎn)任務(wù)是聚焦算力網(wǎng)絡(luò)建設(shè)應(yīng)用和智算中心應(yīng)用。根據(jù)工業(yè)和信息化部統(tǒng)計(jì)數(shù)據(jù),截至2024年9月底,我國在用算力中心超過880萬標(biāo)準(zhǔn)機(jī)架,算力總規(guī)模達(dá)268EFLOPS(每秒百億億次浮點(diǎn)運(yùn)算,以FP32單精度計(jì)算)。人工智能熱潮使得智能算力的需求猛增,正促使算力基礎(chǔ)設(shè)施向智能領(lǐng)域轉(zhuǎn)型。國際數(shù)據(jù)公司(IDC)和浪潮信息聯(lián)合發(fā)布的《2025年中國人工智能計(jì)算力發(fā)展評估報(bào)告》測算顯示,2025年中國智能算力規(guī)模將達(dá)到1037.3EFLOPS,預(yù)計(jì)到2028年將達(dá)到2781.9EFLOPS,2023—2028年期間,中國智能算力規(guī)模的五年年復(fù)合增長率預(yù)計(jì)達(dá)到46.2%。
算力供給多元化發(fā)展,本地化部署步伐加快。DeepSeek熱潮帶火算力供給市場。隨著算力需求的急劇增長及其多元化趨勢,算力供給方迎來了前所未有的市場機(jī)遇和發(fā)展空間。人工智能大模型應(yīng)用門檻的降低,也降低了人工智能對高端算力芯片的需求,激活了中國算力芯片市場,打破了美國試圖用封鎖高端算力芯片出口來維持技術(shù)代差的如意算盤。眾多國產(chǎn)AI芯片廠商正積極行動,一方面加速DeepSeek模型在智算中心的適配與部署,推出智能算力集群產(chǎn)品;另一方面,致力于研發(fā)推理芯片,以滿足日益增長的市場需求。DeepSeek為國內(nèi)人工智能算力芯片企業(yè)帶來了新機(jī)遇,也是我國人工智能自主可控道路上的重要節(jié)點(diǎn)。在數(shù)據(jù)敏感的行業(yè)領(lǐng)域,DeepSeek大模型的廣泛部署促進(jìn)了本地化部署的實(shí)踐,這不僅有助于保護(hù)數(shù)據(jù)隱私,還能構(gòu)建私有知識庫,并且降低模型使用的成本。在本地化部署方面,人工智能大模型一體機(jī)相比人工智能服務(wù)器部署來說具有更高的定制化自由度,減少了企業(yè)成本和時間,近期多家企業(yè)陸續(xù)發(fā)布AI一體機(jī)產(chǎn)品。據(jù)浙商證券測算,2025—2027年智算一體機(jī)的市場需求將達(dá)15萬—72萬臺,市場規(guī)模突破5200億元。
展望未來,隨著人工智能技術(shù)的不斷進(jìn)步和與實(shí)體經(jīng)濟(jì)的深度融合,對智能算力的需求將持續(xù)增長,而算力的供給也將朝著更加多樣化和智能化的方向演進(jìn)。
(作者單位:清華大學(xué)互聯(lián)網(wǎng)產(chǎn)業(yè)研究院)
責(zé)任編輯:何樂