2024年至今,人工智能產(chǎn)業(yè)發(fā)生了階段性轉(zhuǎn)變。截至2024年10月9日,網(wǎng)信辦共通過(guò)了188項(xiàng)生成式人工智能備案,有188個(gè)大模型可以上線提供生成式人工智能服務(wù)。超過(guò)三成的大模型在通過(guò)備案后未進(jìn)一步公開(kāi)其進(jìn)展情況;僅有約一成的大模型仍在加速訓(xùn)練模型;接近一半的大模型則轉(zhuǎn)向了Al應(yīng)用的開(kāi)發(fā)。
這一變化也傳導(dǎo)至上游的算力市場(chǎng)。2024年9月27日至29日在中國(guó)算力大會(huì)召開(kāi)期間,算力運(yùn)營(yíng)方、建設(shè)方和芯片供應(yīng)商都表示,國(guó)內(nèi)算力的供需關(guān)系已不再緊張。
2022年以來(lái),互聯(lián)網(wǎng)公司、人工智能企業(yè)爭(zhēng)相采購(gòu)算力設(shè)備,以運(yùn)營(yíng)商為代表的央國(guó)企投入巨資建設(shè)算力中心。供應(yīng)鏈上的AI服務(wù)器經(jīng)常缺貨,算力GPU \"一卡難求”,數(shù)月內(nèi)價(jià)格翻倍。
從2024年開(kāi)始,采購(gòu)和租用算力設(shè)備的企業(yè)顯著減少,2024年下半年以來(lái),算力中心的機(jī)架出現(xiàn)了一定程度的空置,曾被炒到15萬(wàn)元一塊的英偉達(dá)高性能加速卡A100的價(jià)格不再上漲,另一款性能配置相對(duì)較低的4090顯卡被算力企業(yè)頻繁采購(gòu)用作算力加速芯片。算力已經(jīng)轉(zhuǎn)入買方市場(chǎng)。
01
大模型企業(yè)分化
算力的使用者——大模型企業(yè)正出現(xiàn)分化。
截至2024年8月底,網(wǎng)信辦共通過(guò)了188項(xiàng)生成式人工智能備案。然而,據(jù)統(tǒng)計(jì),有60個(gè)(32%)大模型在備案通過(guò)后,沒(méi)有再公布過(guò)提升大模型參數(shù)量級(jí)或應(yīng)用落地的進(jìn)展,有9個(gè)(5%)大模型更新了版本,但未說(shuō)明參數(shù)量級(jí)及預(yù)訓(xùn)練數(shù)據(jù)量變化。這些模型絕大多數(shù)來(lái)自中小型企業(yè)或機(jī)構(gòu),例如深言科技、聆心智能等企業(yè)的多個(gè)開(kāi)源社區(qū)項(xiàng)目近一年沒(méi)有更新。
這188個(gè)大模型中,仍有22個(gè)模型在加速訓(xùn)練,在今年更新了版本并增加參數(shù)量及預(yù)訓(xùn)練數(shù)據(jù)量。這些模型主要來(lái)自大型互聯(lián)網(wǎng)公司、運(yùn)營(yíng)商、AI大模型企業(yè),其中只有4家企業(yè)發(fā)布萬(wàn)億級(jí)參數(shù)的大模型,且大規(guī)模增加了預(yù)訓(xùn)練的數(shù)據(jù)量,包括騰訊、中國(guó)電信以及兩家大模型創(chuàng)業(yè)公司MiniMax和階躍星辰。這些企業(yè)對(duì)用于訓(xùn)練大模型的算力明顯增加了需求。2024年以來(lái),騰訊、中國(guó)電信已經(jīng)建成萬(wàn)卡集群算力池,MiniMax則是在3月首批入駐中國(guó)電信上海臨港國(guó)產(chǎn)萬(wàn)卡算力池。
另外18個(gè)模型的參數(shù)量在百億至千億級(jí)別,參數(shù)量和預(yù)訓(xùn)練數(shù)據(jù)量的增加較為有限,這些模型來(lái)自百度、阿里巴巴、科大訊飛、商湯科技、華為等企業(yè)。這些廠商也在加速更新基礎(chǔ)模型。阿里巴巴發(fā)布了通義千問(wèn)2.5版本,參數(shù)量達(dá)到千億級(jí)別,這是繼去年10月2.0版本后的一次重大更新。2024年上半年,商湯科技將“日日新”大模型推進(jìn)至6000億參數(shù)規(guī)模。相比之下,去年更新較快的百度步伐有所放緩,其文心4.0大模型自去年10月以來(lái)未有新版本發(fā)布。一位百度公司的技術(shù)人士表示,百度的基礎(chǔ)模型一直在進(jìn)行最前沿的AI訓(xùn)練,只是目前還沒(méi)公布成果。
此外,在通過(guò)備案的大模型中,有接近50%在今年轉(zhuǎn)向AI應(yīng)用。大多數(shù)模型已落地到已有應(yīng)用中或推出了新應(yīng)用。例如,360瀏覽器接入360智腦大模型后,增加了AI搜索功能,能夠根據(jù)提問(wèn)生成深度回答并進(jìn)行多輪追問(wèn);金山辦公在WPS辦公套件中增加了AI生成PPT和文案的功能。這些模型通常用于實(shí)際任務(wù),即從訓(xùn)練階段進(jìn)入推理階段,所需算力會(huì)明顯減少。
一些大模型廠商的基礎(chǔ)模型在達(dá)到百億參數(shù)量后轉(zhuǎn)向了行業(yè)應(yīng)用,為避免后期使用成本過(guò)高就沒(méi)有擴(kuò)充參數(shù)量,因此也不需要過(guò)大的算力。
IDC中國(guó)副總裁兼首席分析師武連峰稱,“百模大戰(zhàn)”開(kāi)啟一年多以來(lái),市場(chǎng)出現(xiàn)了分化現(xiàn)象:少數(shù)模型繼續(xù)沿著通用大模型的路徑,邁向千億或萬(wàn)億參數(shù)量級(jí);另一些從基礎(chǔ)模型研發(fā)轉(zhuǎn)向了應(yīng)用層面的開(kāi)發(fā),市場(chǎng)上也涌現(xiàn)出一批基于大模型技術(shù)的工具類應(yīng)用。這些應(yīng)用同質(zhì)化明顯,沒(méi)有出現(xiàn)廣泛使用的案例。
根據(jù)第三方數(shù)據(jù)服務(wù)商AI產(chǎn)品榜發(fā)布的9月數(shù)據(jù),全球排名前十的AI應(yīng)用中有7個(gè)來(lái)自美國(guó),2個(gè)來(lái)自中國(guó)——百度搜索AI智能回答和360AI搜索。美國(guó)AI應(yīng)用ChatGPT的月訪問(wèn)量為32.3億,百度搜索AI智能回答的月訪問(wèn)量約為ChatGPT的八分之一,360AI搜索的訪問(wèn)量不到ChatGPT的十分之一。
02
算力變成買方市場(chǎng)
大模型市場(chǎng)與算力市場(chǎng)關(guān)聯(lián)密切。按照規(guī)模定律(Scaling law)的原理,如果要訓(xùn)練更大的大模型,需要增加參數(shù)量或預(yù)訓(xùn)練數(shù)據(jù)量,如果模型的參數(shù)量增加10倍,所需算力可能增加100倍甚至更多。
當(dāng)前,一些大模型停留在了訓(xùn)練階段,另一些轉(zhuǎn)向了應(yīng)用和實(shí)際交付階段,但尚未被廣泛使用。從需求方看,相關(guān)企業(yè)對(duì)訓(xùn)練算力的需求明顯減少,對(duì)推理算力的需求也沒(méi)有出現(xiàn)爆發(fā)式增長(zhǎng),而從供給方看,中國(guó)已建和正在建設(shè)的智算中心超250個(gè),算力持續(xù)供給仍未停止。
建造一座算力設(shè)施通常需要投資方、運(yùn)營(yíng)方、建設(shè)方的合作。投資方主要是地方政府和央企、國(guó)企;運(yùn)營(yíng)方包括電信運(yùn)營(yíng)商以及互聯(lián)網(wǎng)公司、華為等企業(yè),還有少數(shù)房地產(chǎn)等傳統(tǒng)企業(yè)跨界參與;建設(shè)方通常包含服務(wù)器提供商和GPU芯片提供商。
2024年以來(lái),采購(gòu)算力服務(wù)的客戶逐漸減少,而詢價(jià)和談判時(shí)間更長(zhǎng),買方越來(lái)越注重產(chǎn)品的性價(jià)比和技術(shù)規(guī)格。此外,智算中心也出現(xiàn)了一定程度的空置。中國(guó)電信在全國(guó)各地投產(chǎn)了10個(gè)智算中心,但很多算力中心都沒(méi)有被充分利用。
根據(jù)中國(guó)信息通信研究院數(shù)據(jù),中國(guó)算力設(shè)施中的機(jī)架數(shù)量在2024年上半年僅增長(zhǎng)2.5%,而2023年全年增長(zhǎng)了25%。算力設(shè)施中的機(jī)架數(shù)量間接反映了實(shí)際的算力規(guī)模。
2024年《政府工作報(bào)告》提出,適度超前建設(shè)數(shù)字基礎(chǔ)設(shè)施,加快形成全國(guó)一體化算力體系,培育算力產(chǎn)業(yè)生態(tài)。諸多地區(qū)當(dāng)下的算力建設(shè)規(guī)模是根據(jù)未來(lái)2年至3年的算力需求來(lái)規(guī)劃的,在模型計(jì)算尚未爆發(fā)的階段,必然出現(xiàn)利用率不足的情況。
有業(yè)內(nèi)人士表示,當(dāng)前的算力已經(jīng)來(lái)到了買方市場(chǎng)的時(shí)代,用戶有更多算力價(jià)格的議價(jià)權(quán)。投資方的態(tài)度也更為謹(jǐn)慎和理性,開(kāi)始對(duì)運(yùn)營(yíng)方提出相應(yīng)的回報(bào)要求與考核。運(yùn)營(yíng)方一方面轉(zhuǎn)向采購(gòu)性價(jià)比更高的算力設(shè)備,另一方面采用了更靈活的策略,比如按需建設(shè)算力,在產(chǎn)能規(guī)劃上布置了上千臺(tái)機(jī)架,接到明確的用戶需求和訂單才會(huì)真正采購(gòu)算力設(shè)備并上架運(yùn)行?!白鳛檫\(yùn)營(yíng)方,我們已經(jīng)不能像原來(lái)一樣不計(jì)成本地投入,要想盡快回收成本,必須考慮成本投入和投資回報(bào)周期?!币晃恢袊?guó)電信的工作人員稱。
產(chǎn)業(yè)對(duì)算力芯片的采購(gòu)也更注重性價(jià)比。2024年以來(lái),國(guó)內(nèi)對(duì)英偉達(dá)4090顯卡的需求正在上升,目前,這款頂級(jí)游戲顯卡的價(jià)格從年初的12000元漲至18000元。
一位英偉達(dá)代理商表示,2024年下半年以來(lái),4090顯卡的周轉(zhuǎn)率非常高,到貨3天就賣出去了。相比之下,A100的單價(jià)不再上漲,維持在15萬(wàn)元不變,周轉(zhuǎn)率卻在下降。
4090和A100都屬于GPU芯片,在英偉達(dá)產(chǎn)品線中,4090是一款面向玩家的高端游戲顯卡,A100則是賣給算力中心的高性能加速卡。4090在部分性能上弱于A100,但也能滿足一部分模型的推理任務(wù),最重要的是,其價(jià)格是A系列和H系列加速卡的十分之一。
這一波4090顯卡的買家絕大多數(shù)是企業(yè),大多是智算中心的建設(shè)方或者技術(shù)提供方,用平價(jià)顯卡替代高價(jià)的A100或H100芯片。
隨著大模型進(jìn)入商業(yè)閉環(huán)階段,企業(yè)對(duì)算力的需求也在變化,過(guò)去公司不計(jì)成本地采購(gòu)算力,如今更追求算力的性價(jià)比,各大模型企業(yè)要采用智能算力調(diào)度等技術(shù)來(lái)提升算力效能。(微信公眾號(hào)“經(jīng)濟(jì)觀察報(bào)”)