封面故事：2023中國(guó)大模型TOP70

2023-09-16 14:32:16克林

互聯(lián)網(wǎng)周刊 2023年17期

克林

百舸爭(zhēng)流，奮楫者先

截至2023年5月底，國(guó)內(nèi)10億級(jí)參數(shù)規(guī)模以上基礎(chǔ)大模型至少已經(jīng)公布了79個(gè)，此時(shí)距離ChatGPT在國(guó)內(nèi)“破圈”尚不足3個(gè)月。

時(shí)間來(lái)到8月，這股勢(shì)頭依然不減。15日，科大訊飛發(fā)布星火認(rèn)知大模型V2.0版本，在代碼及多模態(tài)能力方面進(jìn)行了重大升級(jí)；在14日的年度演講上，小米董事長(zhǎng)雷軍宣布小愛(ài)同學(xué)已升級(jí)大模型，并開(kāi)始邀請(qǐng)測(cè)試；3日，“神秘”的騰訊混元大模型也浮出水面，目前已進(jìn)入公司內(nèi)應(yīng)用測(cè)試階段……

“百模大戰(zhàn)”一觸即發(fā)，國(guó)內(nèi)通用類(lèi)、垂直類(lèi)大模型呈現(xiàn)井噴之勢(shì)發(fā)展。IDC預(yù)測(cè)，2026年中國(guó)AI大模型市場(chǎng)規(guī)模將達(dá)到211億美元，人工智能將進(jìn)入大規(guī)模落地應(yīng)用關(guān)鍵期。

放眼全球，據(jù)統(tǒng)計(jì)今年上半年全球新發(fā)布的大模型已超過(guò)400個(gè)。麥肯錫的報(bào)告《生成式人工智能的經(jīng)濟(jì)潛力》中提到，在其研究的63種應(yīng)用中使用生成式AI，將為全球經(jīng)濟(jì)帶來(lái)每年2.6萬(wàn)億～4.4萬(wàn)億美元的增長(zhǎng)。

同時(shí)，由于通用大模型成本與技術(shù)門(mén)檻相對(duì)較高，國(guó)內(nèi)較多大模型選擇圍繞垂直行業(yè)進(jìn)行開(kāi)發(fā)，模型參數(shù)量雖然不大，但是因?yàn)橛幸恍┬袠I(yè)的核心數(shù)據(jù)和業(yè)務(wù)系統(tǒng)的生產(chǎn)數(shù)據(jù)參與，所以在相應(yīng)行業(yè)解決問(wèn)題更為高效、直接，特別是在金融、教育、醫(yī)療等領(lǐng)域，已經(jīng)有不少公司發(fā)布了相應(yīng)產(chǎn)品。整體生態(tài)呈現(xiàn)出“通用+垂直”模型互相融通的態(tài)勢(shì)。

千帆競(jìng)發(fā)，勇進(jìn)者勝

今年6月，ChatGPT訪問(wèn)量環(huán)比下滑9.7%，為其推出以來(lái)首次下滑。從全球范圍看，盡管不斷有企業(yè)或機(jī)構(gòu)發(fā)布或更新大模型，但媒體和公眾似乎不再像幾個(gè)月前那般“上頭”。

當(dāng)大模型回歸理性，市場(chǎng)必然要經(jīng)歷一場(chǎng)大浪淘沙。關(guān)乎技術(shù)，更關(guān)乎商業(yè)模式。

目前幾乎所有的大模型預(yù)訓(xùn)練都基于Transformer架構(gòu)，雖是“百模大戰(zhàn)”，但各家大模型之間同質(zhì)化嚴(yán)重，實(shí)質(zhì)性的創(chuàng)新相對(duì)較少。同時(shí)，訓(xùn)練大模型所耗費(fèi)的計(jì)算資源非常龐大，需要超級(jí)算力的支撐，很多公司沒(méi)有過(guò)往的研究履歷，發(fā)布的產(chǎn)品多是“套殼”或者接入其他研發(fā)機(jī)構(gòu)的模型，投機(jī)現(xiàn)象泛濫。

當(dāng)下的大模型競(jìng)爭(zhēng)早已超過(guò)了技術(shù)的范疇，更多是一種生態(tài)層面的比拼，具體表現(xiàn)在有多少應(yīng)用、有多少插件、有多少開(kāi)發(fā)者以及用戶(hù)等。如果沒(méi)有良好的可循環(huán)生態(tài)，那么無(wú)論在模型的持續(xù)迭代，抑或是變現(xiàn)攤薄巨額研發(fā)成本方面，可以預(yù)見(jiàn)都會(huì)面臨重大困境，對(duì)于創(chuàng)業(yè)型公司來(lái)說(shuō)更是如此。

考驗(yàn)的核心就在于大模型的落地能力。

今年獲得世界人工智能大會(huì)最高獎(jiǎng)項(xiàng)SAIL獎(jiǎng)（卓越人工智能引領(lǐng)者獎(jiǎng)）的論文《機(jī)器學(xué)習(xí)結(jié)合阻抗譜技術(shù)預(yù)測(cè)鋰電池老化》，該文作者、中山大學(xué)物理學(xué)院副教授張?jiān)莆嫡f(shuō)，她只采集了2萬(wàn)個(gè)電化學(xué)阻抗譜，就實(shí)現(xiàn)了AI精準(zhǔn)建模。比起海量數(shù)據(jù)，更重要的是思路。就是這樣一個(gè)小模型，將過(guò)去需要花費(fèi)幾天才能實(shí)現(xiàn)的電池壽命預(yù)測(cè)縮短到了15分鐘，且檢測(cè)精度是原來(lái)的10倍。

越是面對(duì)如大模型落地這種復(fù)雜的問(wèn)題，就越是要回歸更本質(zhì)的層面去思考，考驗(yàn)的不僅是技術(shù)力，更重要的還是要落實(shí)在“服務(wù)”二字上，更高效、更便捷、更人性化將會(huì)是未來(lái)可持續(xù)探索的重要方向。

結(jié)語(yǔ)

1.受關(guān)注度或注意力這一綜合性指所反映的也是最綜合性的或整體性的。

2.真正的答案往往要向內(nèi)去尋找，這是更為根本的解決之道。

3.發(fā)展迅猛，未來(lái)的中國(guó)大模型100強(qiáng)即將出現(xiàn)，敬請(qǐng)期待。