
近日,埃隆·馬斯克旗下人工智能公司xAI正式發(fā)布新一代AI模型Grok3。馬斯克在直播中稱其為“聰明得可怕”,并宣布其能力比前代Grok2“高出一個(gè)數(shù)量級(jí)”,在多項(xiàng)基準(zhǔn)測(cè)試中超越了OpenAI的GPT-4o和中國(guó)DeepSeek的R1模型。
Grok3的開發(fā)得益于xAI打造的“巨人”(Colossus)超級(jí)計(jì)算機(jī),該系統(tǒng)搭載10萬(wàn)塊英偉達(dá)H100GPU,提供2億GPU小時(shí)的訓(xùn)練時(shí)長(zhǎng),算力達(dá)到Grok2的10倍。據(jù)了解,xAI采用三大創(chuàng)新訓(xùn)練方法:
合成數(shù)據(jù)集——通過(guò)模擬場(chǎng)景生成多樣化數(shù)據(jù),解決隱私問(wèn)題;
自我糾正機(jī)制——模型可識(shí)別并修正自身錯(cuò)誤;
強(qiáng)化學(xué)習(xí)——通過(guò)獎(jiǎng)懲機(jī)制優(yōu)化決策能力。
在AIME(美國(guó)數(shù)學(xué)邀請(qǐng)賽)和GPQA(一個(gè)極其困難的知識(shí)數(shù)據(jù)集,其中問(wèn)題由生物學(xué)、物理學(xué)、化學(xué)等領(lǐng)域的博士水平的專家設(shè)計(jì))等基準(zhǔn)測(cè)試中,Grok3表現(xiàn)優(yōu)異,其推理Beta版在復(fù)雜科學(xué)問(wèn)題上的準(zhǔn)確率顯著領(lǐng)先。
據(jù)了解,Grok3并非單一模型,而是一個(gè)系列,包括Grok3旗艦版、迷你版、快速版等。其中,旗艦版擅長(zhǎng)金融、醫(yī)療、法律等專業(yè)領(lǐng)域,迷你版即輕量版,響應(yīng)更快但精度略低;高速版則適合實(shí)時(shí)任務(wù)的快速響應(yīng)。
功能創(chuàng)新方面,Grok3引入深度檢索(DeepSearch)功能,可快速檢索網(wǎng)絡(luò)和社交平臺(tái)內(nèi)容,生成詳細(xì)研究報(bào)告。例如,在一次演示中,它整合了15條社交平臺(tái)X的帖子和32個(gè)網(wǎng)站信息來(lái)回答問(wèn)題。此外,其“大頭腦”(BigBrain)模式通過(guò)延長(zhǎng)思考時(shí)間提升回答深度,但目前僅限付費(fèi)用戶使用。


據(jù)悉,Grok3已應(yīng)用于客服、醫(yī)療診斷、金融風(fēng)控等領(lǐng)域。例如,在醫(yī)療中可分析病歷和影像數(shù)據(jù)輔助診斷;在金融中能實(shí)時(shí)監(jiān)測(cè)欺詐交易。
面對(duì)OpenAI的GPT-5和中國(guó)DeepSeek的競(jìng)爭(zhēng),馬斯克強(qiáng)調(diào)Grok3“優(yōu)先追求真相”。不過(guò),分析指出,DeepSeek等低成本高效模型正促使全球AI公司重新評(píng)估技術(shù)路線。
xAI計(jì)劃在未來(lái)幾個(gè)月開源Grok2,并推出Grok3的語(yǔ)音模式和API服務(wù)。隨著技術(shù)迭代,Grok3或?qū)⒊蔀锳I領(lǐng)域的重要競(jìng)爭(zhēng)者,但其能否持續(xù)領(lǐng)先仍需觀察。