
深度求索發(fā)布R1推理模型后,芯片制造商英偉達(dá)股價(jià)大幅下跌,其他多家科技公司的估值也急劇下降。有人稱,這是中美人工智能競(jìng)爭(zhēng)中的“斯普特尼克時(shí)刻”。
美國(guó)科技行業(yè)在人工智能領(lǐng)域的投資規(guī)模巨大,高盛估計(jì),“未來幾年,大型科技公司、企業(yè)和公用事業(yè)公司將在資本支出上,花費(fèi)約1萬億美元支持人工智能”。然而長(zhǎng)期以來,包括我在內(nèi)的許多觀察家,都對(duì)美國(guó)的人工智能投資和發(fā)展方向提出了質(zhì)疑。
所有領(lǐng)先公司都在遵循基本相同的游戲規(guī)則(盡管Meta略有不同,采用部分開源模式),整個(gè)行業(yè)似乎把所有雞蛋都放在了同一個(gè)籃子里。美國(guó)科技公司無一例外地癡迷于規(guī)模。它們宣揚(yáng)尚未被證實(shí)的“規(guī)模法則”,認(rèn)為向模型輸入更多數(shù)據(jù)和算力是釋放更強(qiáng)能力的關(guān)鍵。有些人甚至斷言,“規(guī)模就是你所需要的一切”。
在1月20日之前,美國(guó)公司不愿意考慮用海量數(shù)據(jù)集預(yù)先訓(xùn)練的基礎(chǔ)模型,來預(yù)測(cè)序列中的下一個(gè)單詞。根據(jù)它們的優(yōu)先事項(xiàng),它們幾乎只關(guān)注旨在執(zhí)行人類任務(wù)的擴(kuò)散模型和聊天機(jī)器人。雖然深度求索的方法大致相同,但它似乎更依賴于強(qiáng)化學(xué)習(xí)、專家混合方法(使用許多更小、更高效的模型)、蒸餾,以及精煉思維鏈推理。據(jù)報(bào)道,這一策略使其能夠以較低的成本制作出具有競(jìng)爭(zhēng)力的模型。
這一事件暴露了美國(guó)人工智能行業(yè)的“群體思維”。它對(duì)其他更便宜、更有前景的方法的無視,再加上炒作,成就了西蒙·約翰遜和我在《力量與進(jìn)步》一書中的預(yù)言(我們?cè)谏墒饺斯ぶ悄軙r(shí)代開始之前就寫了這本書)。現(xiàn)在的問題是,美國(guó)產(chǎn)業(yè)界是否還有其他更危險(xiǎn)的盲點(diǎn)?例如,美國(guó)的領(lǐng)先科技公司是否錯(cuò)失了將其模式推向更“親人類方向”的機(jī)會(huì)?我猜答案是肯定的,但只有時(shí)間才能證明。
深度求索是建立在美國(guó)(以及歐洲的一些國(guó)家)多年的進(jìn)步的基礎(chǔ)之上。幾十年前,學(xué)術(shù)研究機(jī)構(gòu)就開發(fā)出了專家混合模型和強(qiáng)化學(xué)習(xí);而正是美國(guó)的大科技公司引入了轉(zhuǎn)換器模型、思維鏈推理和蒸餾法。然而,深度求索所做的是在工程領(lǐng)域取得成功:比美國(guó)公司更有效地結(jié)合了相同的方法。中國(guó)的公司和研究機(jī)構(gòu)是否能更進(jìn)一步,推出改變游戲規(guī)則的技術(shù)、產(chǎn)品和方法,我們拭目以待。
深度求索在功能較弱的舊芯片上訓(xùn)練了其最新模型(V3和R1),但它可能仍然需要功能最強(qiáng)大的芯片來取得進(jìn)一步發(fā)展和擴(kuò)大規(guī)模。盡管如此,美國(guó)的零和方針顯然是行不通的,也是不明智的。這樣的戰(zhàn)略只有當(dāng)你相信我們正在邁向AGI(人工通用智能),并且誰能率先實(shí)現(xiàn)人工通用智能,誰就能獲得巨大的地緣政治優(yōu)勢(shì)時(shí)才有意義。
由于抱持這些假設(shè),我們?cè)谠S多領(lǐng)域都無法與中國(guó)開展富有成效的合作。這種合作比如,如果有一個(gè)國(guó)家生產(chǎn)出了能提高人類生產(chǎn)力或幫助我們更好地管理能源的模型,那么這種創(chuàng)新對(duì)兩國(guó)都是有益的,尤其是它被廣泛應(yīng)用的話。
與它的美國(guó)同行一樣,深度求索也渴望開發(fā)AGI,而創(chuàng)建一個(gè)訓(xùn)練成本更低的模型,可能會(huì)改變游戲規(guī)則。但是,用已知的方法降低開發(fā)成本,并不能讓我們?cè)谖磥韼啄陜?nèi)奇跡般地實(shí)現(xiàn)AGI。近期能否實(shí)現(xiàn)AGI,仍是一個(gè)懸而未決的問題(它是否可取更值得商榷)。
即使我們還不知道深度求索如何開發(fā)其模型的所有細(xì)節(jié),也不知道它取得的明顯成就對(duì)人工智能產(chǎn)業(yè)的未來意味著什么,但有一點(diǎn)似乎是明確的:中國(guó)的后起之秀戳破了科技產(chǎn)業(yè)對(duì)規(guī)模的癡迷,甚至可能使其擺脫了自滿。