999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

從ChatGPT到AGI:大國(guó)博弈的入場(chǎng)券、主戰(zhàn)場(chǎng)和主力軍

2023-12-29 00:00:00安筱鵬
新經(jīng)濟(jì)導(dǎo)刊 2023年3期

摘 要:通用人工智能(AGI)正成為全球新一輪數(shù)字技術(shù)競(jìng)爭(zhēng)的新賽道和制高點(diǎn),必將對(duì)未來(lái)世界發(fā)展產(chǎn)生深遠(yuǎn)影響。AI大模型的出現(xiàn)是一個(gè)劃時(shí)代的里程碑,以ChatGPT為代表的AI大模型實(shí)現(xiàn)了四個(gè)突破和跨越。大模型將會(huì)被各行各業(yè)廣泛應(yīng)用,帶來(lái)生產(chǎn)力的巨大提升,并深刻改變我們的生活方式。以ChatGPT為代表的通用人工智能技術(shù)產(chǎn)業(yè)有五大特點(diǎn):顛覆性、涌現(xiàn)性、工程化、通用性和密集型。面對(duì)美國(guó)的領(lǐng)先優(yōu)勢(shì),中國(guó)人工智能產(chǎn)業(yè)正處于奮起直追的關(guān)鍵時(shí)期,亟待找到一條人工智能高質(zhì)量發(fā)展的新路,構(gòu)建完整的AI技術(shù)生態(tài)和產(chǎn)業(yè)生態(tài),培育算力和AI服務(wù)的統(tǒng)一大市場(chǎng)。我國(guó)AI大模型技術(shù)創(chuàng)新與產(chǎn)業(yè)化,面臨著統(tǒng)一大市場(chǎng)、高端芯片、數(shù)據(jù)資源和創(chuàng)新生態(tài)等多重挑戰(zhàn)。

關(guān)鍵詞:ChatGPT;AGI;技術(shù)跨越;產(chǎn)業(yè)特征;高質(zhì)量發(fā)展

2022年11月30日,美國(guó)OpenAI公司發(fā)布人工智能聊天機(jī)器人程序ChatGPT,引起全球廣泛關(guān)注。ChatGPT是AI大模型創(chuàng)新從量變到質(zhì)變長(zhǎng)期積累的必然結(jié)果,是通用人工智能(AGI,Artificial General Intelligence)發(fā)展的重要里程碑。AGI正成為全球新一輪數(shù)字技術(shù)競(jìng)爭(zhēng)的新賽道和制高點(diǎn),必將對(duì)未來(lái)5年至10年全球技術(shù)創(chuàng)新、企業(yè)競(jìng)爭(zhēng)、社會(huì)發(fā)展和國(guó)家博弈產(chǎn)生深遠(yuǎn)影響。

一、AI大模型技術(shù)的四個(gè)跨越

AI大模型的出現(xiàn)是一個(gè)劃時(shí)代的里程碑,人類將進(jìn)入到一個(gè)全新的智能化時(shí)代。觀察發(fā)展軌跡,以ChatGPT為代表的AI大模型實(shí)現(xiàn)了四個(gè)突破和跨越。

一是從弱(專用,Narrow)人工智能到強(qiáng)(通用,General)人工智能的跨越。事實(shí)上,人工智能特定領(lǐng)域能力早已超過人類,如1997年IBM沃森的智力競(jìng)賽、2016年谷歌AlphaGo的圍棋競(jìng)賽。GPT大模型實(shí)現(xiàn)了AI從單一專項(xiàng)能力超越人類到通用能力逼近人類的跨越,實(shí)現(xiàn)了從單模態(tài)到多模態(tài)的跨越,如從過去“文本到文本”“圖片到圖片”,擴(kuò)展到“文字到圖片”“圖片到視頻”等跨模態(tài)的內(nèi)容生成(如圖1所示)。

二是AI產(chǎn)品服務(wù)實(shí)現(xiàn)從2B到2C大規(guī)模普及的跨越。ChatGPT等AI大模型可用性大幅度提高,可服務(wù)于2C的出游計(jì)劃、網(wǎng)上購(gòu)物、信息檢索等各個(gè)領(lǐng)域,將AI融入搜索引擎,嵌入Word、PowerPoint、Excel等Office辦公軟件,成為生產(chǎn)力提升新工具。ChatGPT成為互聯(lián)網(wǎng)歷史上用戶增長(zhǎng)最快的應(yīng)用,發(fā)布兩個(gè)月達(dá)到1億用戶。

三是模型訓(xùn)練實(shí)現(xiàn)從手工作坊到規(guī)模化生產(chǎn)的跨越。Transformer使用無(wú)監(jiān)督和自我監(jiān)督的預(yù)訓(xùn)練,減少了注釋訓(xùn)練數(shù)據(jù)工作量,這是OpenAI技術(shù)團(tuán)隊(duì)一直追求并不斷探索的方向。模型訓(xùn)練實(shí)現(xiàn)上下游分工、流水線協(xié)同,改變了手工作坊式的訓(xùn)練模式,形成“大模型+微調(diào)”的新范式。

四是互聯(lián)網(wǎng)數(shù)據(jù)組織形式實(shí)現(xiàn)從數(shù)據(jù)網(wǎng)頁(yè)(Web Page)到語(yǔ)義網(wǎng)絡(luò)(Semantic Web)的跨越。GPT成功將神經(jīng)網(wǎng)絡(luò)算法落地為神經(jīng)網(wǎng)絡(luò)大模型,讓神經(jīng)網(wǎng)絡(luò)成為一種新的數(shù)據(jù)存儲(chǔ)模型,也讓信息檢索方式,從關(guān)鍵字檢索轉(zhuǎn)變成具備完整語(yǔ)義的自然語(yǔ)言人機(jī)交互檢索。對(duì)基于爬蟲、分詞、索引、特征工程等傳統(tǒng)搜索引擎而言,GPT是技術(shù)體系上的顛覆。

二、AI大模型產(chǎn)業(yè)的五大特征

就像工業(yè)革命一樣,大模型將會(huì)被各行各業(yè)廣泛應(yīng)用,帶來(lái)生產(chǎn)力的巨大提升,并深刻改變我們的生活方式。以ChatGPT為代表的通用人工智能技術(shù)產(chǎn)業(yè)有五大特點(diǎn):顛覆性、涌現(xiàn)性、工程化、通用性和密集型(如圖2所示)。

(一)顛覆性:AI大模型具有顛覆性技術(shù)的潛質(zhì)

顛覆性技術(shù)是以意想不到的方式取代現(xiàn)有主流技術(shù),并改變競(jìng)爭(zhēng)格局和競(jìng)爭(zhēng)規(guī)則的技術(shù)。從金屬冶煉、火藥制作,到移動(dòng)互聯(lián)、智能交互、增材制造等,很多時(shí)候,顛覆性技術(shù)在發(fā)展初期都是被嘲笑的對(duì)象。ARM發(fā)展初期性能無(wú)法和X86相比,但其優(yōu)勢(shì)是能耗低;第一代智能手機(jī)功能殘缺,沒有應(yīng)用商店(APP Store),但它重新定義了智能。

不要嘲笑新技術(shù)的缺陷和不足,而要準(zhǔn)確判斷新技術(shù)的長(zhǎng)項(xiàng)和優(yōu)勢(shì)的價(jià)值和潛力,就如互聯(lián)網(wǎng)和智能手機(jī)的出現(xiàn)。人們對(duì)“大模型”能力的預(yù)估,也許都是“低估”,AI大模型具有顛覆性技術(shù)的潛質(zhì)。僅僅幾個(gè)月,全球這一領(lǐng)域就涌現(xiàn)出5萬(wàn)多家創(chuàng)業(yè)公司,有些估值已經(jīng)超過10億美元。不要問AGI能顛覆什么,而要問AGI不能顛覆什么。

人機(jī)交互突破。從鍵盤、鼠標(biāo)、觸摸、XR到語(yǔ)音,每一次人機(jī)交互技術(shù)的突破,都將帶來(lái)一次產(chǎn)業(yè)重構(gòu)。AI大模型可能會(huì)重塑“人機(jī)交互”方式,這種“升維競(jìng)爭(zhēng)”會(huì)改變用戶使用搜索引擎、軟件工具、人機(jī)互動(dòng)等方式,重構(gòu)產(chǎn)業(yè)競(jìng)爭(zhēng)格局。

知識(shí)創(chuàng)造突破。方舟投資(ARK Invest)發(fā)布報(bào)告預(yù)測(cè),到 2030 年,AI 將輔助知識(shí)工作者(包括教師、律師、醫(yī)生、財(cái)務(wù)、程序員等白領(lǐng)職業(yè))提升140%的工作效率,這將是繼人類歷史上的動(dòng)力革命讓人類擺脫繁重的體力勞動(dòng)之后,又一次偉大的技術(shù)革命。

軟件產(chǎn)業(yè)變革。GPT4的編碼能力,已相當(dāng)于谷歌年薪18萬(wàn)美元的L3工程師;CDSN調(diào)查顯示,GPT4相當(dāng)于中國(guó)月薪3萬(wàn)元的軟件開發(fā)人員。未來(lái),50%的軟件代碼將會(huì)被AI接管。SaaS技術(shù)、產(chǎn)業(yè)、商業(yè)及生態(tài)模式將會(huì)重構(gòu),從“在線化”走向“智能化”新階段。

研發(fā)模式突破。AI大模型正成為加速科研進(jìn)程的助推器,推動(dòng)基因編輯、合成生物等技術(shù)進(jìn)步,加速生物領(lǐng)域取得突破性成果。ChatGPT的出現(xiàn),意味著知識(shí)創(chuàng)造的方式將發(fā)生改變,這將從最底層對(duì)科學(xué)研究形成影響。

白領(lǐng)崗位重塑。AI大模型顛覆了那種認(rèn)為技術(shù)優(yōu)先替代體力勞動(dòng)者、AI無(wú)法具有人類創(chuàng)意的社會(huì)偏見,被機(jī)器智能首先取代的可能是“白領(lǐng)”而非通常認(rèn)為的“藍(lán)領(lǐng)”。據(jù)預(yù)測(cè),美國(guó)80%的員工工作內(nèi)容至少10%會(huì)被改變,還有19%的員工工作內(nèi)容至少有50%要被改變。

機(jī)器智能突破。AI將會(huì)從“線上”走到“線下”,從數(shù)字世界走到物理世界,將AI大模型裝到更多的物理設(shè)備和機(jī)器上,或許幾年后“GPT8”會(huì)融入波士頓動(dòng)力機(jī)器人和特斯拉汽車。正如英偉達(dá)CEO黃仁勛所說,未來(lái)10年最大的機(jī)會(huì)在于AI與物理世界機(jī)器的融合。

AI大模型仍處于快速進(jìn)化中,正如阿里巴巴郭敏對(duì)GPT3到GPT4的評(píng)價(jià):它實(shí)現(xiàn)從“文本理解”到“圖像理解”、從“普通生”到“尖子生”、從“文科生”到“理科生”、從“本手”到“妙手”、從“對(duì)話理解”到“全文理解”、從“意圖理解”到“創(chuàng)意實(shí)現(xiàn)”的跨越。今天的AI大模型可能就像歷史上的火藥,正從放煙花時(shí)代走向槍炮時(shí)代,實(shí)現(xiàn)從冷兵器到熱兵器的跨越。今天,打敗你的不是AI,而是有AI加持的競(jìng)爭(zhēng)對(duì)手。

(二)涌現(xiàn)性:模型參數(shù)超過臨界值,人工智能能力實(shí)現(xiàn)突變

本輪人工智能突破的基礎(chǔ)來(lái)自2017年谷歌提出的Transformer理論模型。在Transformer工程化的道路上,OpenAI和谷歌選擇了不同的技術(shù)路線,兩種路線的競(jìng)爭(zhēng)相當(dāng)于100年前交流電和直流電在剛發(fā)明電力時(shí)的競(jìng)爭(zhēng)。實(shí)踐證明,OpenAI的工程化路線更有效,該技術(shù)路線的重大突破在于,模型參數(shù)超過某個(gè)臨界點(diǎn)之后,AI模型效果出現(xiàn)指數(shù)級(jí)增長(zhǎng),呈現(xiàn)“涌向效應(yīng)”(如圖3所示)。

大模型的“涌現(xiàn)能力”。2022年,谷歌發(fā)表了研究AI大模型涌現(xiàn)問題的論文。基于MMLU(Multi-task language understanding)中數(shù)學(xué)、歷史、法律等測(cè)試集,對(duì)大模型進(jìn)行測(cè)試,發(fā)現(xiàn)當(dāng)大模型參數(shù)在百億量級(jí)時(shí),模型性能出現(xiàn)指數(shù)級(jí)增長(zhǎng)。如在思維鏈測(cè)試中,LaMAD大模型在參數(shù)達(dá)到680億時(shí)開始出現(xiàn)“涌現(xiàn)效應(yīng)”,就像人到了18歲突然有了能力和心智上的突破。AI大模型效果提升與參數(shù)增長(zhǎng)的“飛輪效應(yīng)”,引發(fā)模型研發(fā)進(jìn)入?yún)?shù)擴(kuò)張的“軍備競(jìng)賽”,模型參數(shù)從幾十億、幾百億、上千億擴(kuò)展到上萬(wàn)億。所有人都好奇:智能的極限在哪里?

“涌現(xiàn)”中的“泛化能力”。語(yǔ)言是人類智能的核心載體,“泛化能力”是大模型給人能帶來(lái)驚艷的重要標(biāo)志。所謂“泛化能力”就是具備舉一反三的能力,有能力回答那些沒有經(jīng)過專門訓(xùn)練的問題。比爾·蓋茨說,ChatGPT不亞于互聯(lián)網(wǎng)的誕生, 他平生見識(shí)過兩次革命性的技術(shù)突破,一次是圖形用戶界面,一次是AI大模型。令他吃驚的是大模型的泛化能力,就像學(xué)習(xí)物理、化學(xué)后,盡管沒有學(xué)過生物,也能回答對(duì)AP生物考試中60道選擇題中的59道。

(三)工程化:AI大模型一半是工程、一半是理論

AI大模型是工程化的重大創(chuàng)新,其核心技術(shù)壁壘是數(shù)據(jù)、算法、算力等要素資源的精巧組合。正如OpenAI首席科學(xué)家IIya Sutskever所認(rèn)為的,Transformer+GPT+互聯(lián)網(wǎng)無(wú)標(biāo)注數(shù)據(jù)=AI大模型。成就來(lái)自O(shè)penAI對(duì)通用人工智能(AGI)的極度信仰,對(duì)智能極限的極度追求,他們不只是一群科學(xué)家,更是一群動(dòng)手能力極強(qiáng)的工程師。這種工程化挑戰(zhàn),體現(xiàn)在三個(gè)方面。

一是對(duì)數(shù)據(jù)清洗質(zhì)量有極致要求。數(shù)據(jù)預(yù)處理能力決定了數(shù)據(jù)質(zhì)量,而數(shù)據(jù)質(zhì)量決定了大模型的效果。數(shù)據(jù)前期處理能力是非常重要的工程能力,也是核心競(jìng)爭(zhēng)力。OpenAI在GPT3訓(xùn)練時(shí)語(yǔ)料清洗前為45TB,清洗后為570GB,數(shù)據(jù)顯示,專家們對(duì)數(shù)據(jù)清洗質(zhì)量有著極致的追求。

二是數(shù)據(jù)“喂養(yǎng)”訓(xùn)練過程中的Know How。模型訓(xùn)練要解決類似模型災(zāi)難性遺忘(catastrophic forgetting)等一系列重大技術(shù)難題,以及語(yǔ)料結(jié)構(gòu)、邏輯和“投喂”順序的關(guān)鍵性訓(xùn)練。

三是大規(guī)模高質(zhì)量的算力構(gòu)建。智能算力的培養(yǎng),算力規(guī)模從千張到萬(wàn)張GPU卡,如何保證算力不衰減,對(duì)算力的高帶寬、存算一體等均提出新要求,需要底層平臺(tái)+分布式框架+加速算法的高效集成,有些全球領(lǐng)先的算力公司花1年半也沒能搭建好。

(四)通用性:AI大模型是人類最大的通用目的技術(shù)(GPT)

技術(shù)具有不同的影響和價(jià)值,人類社會(huì)的技術(shù)可以分為兩類:專用目的技術(shù)(SPT, Special Purpose Technology)和通用目的技術(shù)(GPT, General Purpose Technology)。通用目的技術(shù)(GPT)是對(duì)人類經(jīng)濟(jì)社會(huì)產(chǎn)生巨大、深遠(yuǎn)而廣泛影響的革命性技術(shù),如輪子、印刷、內(nèi)燃機(jī)、電力、計(jì)算機(jī)、互聯(lián)網(wǎng)等。

AI大模型是人類社會(huì)最大的通用目的技術(shù)之一。AI大模型加速了智能時(shí)代的到來(lái),所有產(chǎn)品都值得用大模型重新升級(jí),未來(lái)將看到應(yīng)用爆發(fā)、效率革命,AI將成為各行各業(yè)的新型生產(chǎn)力。究其原因,是這種技術(shù)具有通用目的技術(shù)(GPT)的四個(gè)特征。

一是可以廣泛地應(yīng)用在各個(gè)領(lǐng)域(Variety of applications)。大模型商業(yè)化才剛剛開始,已廣泛融入教育、醫(yī)療、制造、軍事、辦公、律師、游戲、藝術(shù)等多個(gè)領(lǐng)域。更重要的是AI普及的速度:2023年1月,在達(dá)沃斯世界經(jīng)濟(jì)論壇上,微軟CEO薩蒂亞說,“我一生中從未見過,美國(guó)西海岸的先進(jìn)科技可以在幾個(gè)月內(nèi),以非常真實(shí)的方式出現(xiàn)在印度農(nóng)村。對(duì)于知識(shí)型工作者來(lái)說,也許這一次完全等于工業(yè)革命?!?/p>

二是促進(jìn)生產(chǎn)率提高、降低使用成本,具有不斷改造的空間。在工業(yè)時(shí)代,以蒸汽機(jī)、內(nèi)燃機(jī)為代表的通用目的技術(shù)替代、賦能的是體力勞動(dòng)者。AI大模型重構(gòu)了人類知識(shí)檢索、創(chuàng)造、運(yùn)用的基本方式,升級(jí)為支持、賦能腦力勞動(dòng)者,是一種新的生產(chǎn)力。

三是與傳統(tǒng)技術(shù)之間有強(qiáng)力的互補(bǔ)性(Complementarity)。幾乎沒有一種技術(shù)能像AI大模型這樣,可以如此快速、便捷、無(wú)縫、大規(guī)模地與其它技術(shù)融合,與云計(jì)算、互聯(lián)網(wǎng)、軟件結(jié)合,服務(wù)于科研、農(nóng)業(yè)、制造、生活等方方面面,并大規(guī)模推廣普及。

四是促進(jìn)生產(chǎn)及組織管理方式變革。盡管現(xiàn)在AI對(duì)組織管理方式的變革還沒有大規(guī)模顯現(xiàn),但這只是一個(gè)時(shí)間問題(如圖4所示)。

(五)密集型:AI大模型是技術(shù)、資本、人才密集型產(chǎn)業(yè)

只有大市場(chǎng),才能形成技術(shù)資本密集型產(chǎn)業(yè)研發(fā)制造的“規(guī)模經(jīng)濟(jì)”,從而攤銷前期的高投入成本,形成良性的商業(yè)閉環(huán)。全球航空工業(yè)是由空客、波音主導(dǎo),A380研發(fā)需要十多年、250億美元;集成電路市場(chǎng)上只有臺(tái)積電和三星具有3納米的生產(chǎn)能力,3萬(wàn)片3納米產(chǎn)線需要投資200億美元。面對(duì)產(chǎn)業(yè)研發(fā)和生產(chǎn)成本投入巨大的現(xiàn)實(shí),只有全球的市場(chǎng)才能覆蓋投資成本,形成高投入的攤銷商業(yè)閉環(huán),這是產(chǎn)業(yè)發(fā)展的規(guī)律。

AI大模型具有重投入、長(zhǎng)周期、快迭代、高風(fēng)險(xiǎn)等特點(diǎn)。2012年以來(lái),AI算力每三四個(gè)月增長(zhǎng)一倍。GPT的訓(xùn)練需要近萬(wàn)張A100 GPU芯片+超過20萬(wàn)核的CPU;ChatGPT每月運(yùn)行成本為7500萬(wàn)美元,訓(xùn)練一次成本高達(dá)千萬(wàn)美元,微軟投資OpenAI的100億美元,大多是以算力券形式提供。今天,這場(chǎng)高投入的競(jìng)爭(zhēng)才剛剛開始,有機(jī)構(gòu)估計(jì),2023—2028年,AI算力增長(zhǎng)將超過100萬(wàn)倍。

大算力、大數(shù)據(jù)、大模型決定了AI大模型競(jìng)爭(zhēng)是大國(guó)的游戲、巨人的戰(zhàn)場(chǎng)、工具的革命,是技術(shù)產(chǎn)業(yè)生態(tài)進(jìn)化的力量,更是一種通用目的技術(shù)的新突破。

三、中國(guó)通用人工智能高質(zhì)量發(fā)展之路:全球AI大模型競(jìng)爭(zhēng)的入場(chǎng)券、主力軍、主戰(zhàn)場(chǎng)

美國(guó)不斷鞏固和強(qiáng)化其全球AI大模型產(chǎn)業(yè)革命的領(lǐng)導(dǎo)地位。中國(guó)人工智能產(chǎn)業(yè)正處于奮起直追的關(guān)鍵時(shí)期,亟待找到一條人工智能高質(zhì)量發(fā)展的新路,核心是要建設(shè)集約化、在線化的算力基礎(chǔ)設(shè)施,發(fā)揮大型科技企業(yè)的算力、數(shù)據(jù)、人才等優(yōu)勢(shì),構(gòu)建完整的AI技術(shù)生態(tài)和產(chǎn)業(yè)生態(tài),培育算力和AI服務(wù)的統(tǒng)一大市場(chǎng)。

(一)入場(chǎng)券:“公共云+AI”的系統(tǒng)能力是AI大模型技術(shù)創(chuàng)新和產(chǎn)業(yè)化的入場(chǎng)券

大模型是一場(chǎng)“AI+云計(jì)算”的全方位競(jìng)爭(zhēng),超千億參數(shù)的大模型研發(fā),并不僅僅是算法問題,而是囊括了底層龐大算力、網(wǎng)絡(luò)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等諸多領(lǐng)域的復(fù)雜系統(tǒng)性工程,需要有超大規(guī)模AI基礎(chǔ)設(shè)施的支撐。目前,AI與云計(jì)算相互依賴,技術(shù)創(chuàng)新和產(chǎn)業(yè)化與云計(jì)算緊密關(guān)聯(lián),已經(jīng)很難分開。算力成本、數(shù)據(jù)成本、商業(yè)閉環(huán)已成為制約AI發(fā)展的重大挑戰(zhàn)。云計(jì)算是AI大規(guī)模普及的最佳方式,特別是公共云選擇的在線化服務(wù)模式,能夠更好地支撐AI大模型實(shí)現(xiàn)大規(guī)模商業(yè)化。

模型即服務(wù)(MaaS)的崛起,是公共云+AI系統(tǒng)能力的重要體現(xiàn)。AI大模型所需的計(jì)算架構(gòu),在公共云已有的IaaS、PaaS、SaaS三個(gè)層面上,長(zhǎng)出了MaaS層(Model as a Service),推動(dòng)了云計(jì)算整體架構(gòu)體系的演進(jìn)升級(jí)。

IaaS層:異構(gòu)芯片成為AI計(jì)算的關(guān)鍵資產(chǎn),集成了GPU、TPU、NPU等不同架構(gòu)的芯片,能夠更高效地支撐AI大模型進(jìn)行各類復(fù)雜任務(wù)的訓(xùn)練及應(yīng)用。PaaS層:AI算法庫(kù)與工程框架是核心。AI算法庫(kù)是人工智能知識(shí)體系的“樹根”, AI工程框架顯著降低了模型開發(fā)的門檻。MaaS層:MaaS(模型即服務(wù))作為AI大模型服務(wù)層應(yīng)運(yùn)而生,將演變成一種新型的AI基礎(chǔ)設(shè)施。SaaS層:應(yīng)用效果“類人化”驅(qū)動(dòng)場(chǎng)景創(chuàng)新。AI將以更“類人化”的應(yīng)用效果,廣泛應(yīng)用于聊天機(jī)器人、虛擬助手、文本生產(chǎn)、文本摘要、語(yǔ)音識(shí)別等多個(gè)領(lǐng)域(如圖5所示)。

智能化時(shí)代帶來(lái)算力的爆發(fā),同時(shí)也提出了更高的要求。AI大模型的訓(xùn)練和運(yùn)營(yíng)需要集約化、在線的算力基礎(chǔ)設(shè)施。集約化的算力基礎(chǔ)設(shè)施是基礎(chǔ)支撐,要求更高的計(jì)算并行性、更高的計(jì)算效率和更低的計(jì)算成本,并且要求適配各類專用計(jì)算芯片。在線化則對(duì)算力提出更高要求,從模型訓(xùn)練和應(yīng)用看,需要形成“用戶膨脹、使用反饋、模型進(jìn)化”的“飛輪效應(yīng)”,海量用戶在線使用和大規(guī)模API調(diào)用集成等都需要在線化的算力資源。

基于集約化、在線化的需求,云計(jì)算是智能化時(shí)代的創(chuàng)新引擎,也是AI發(fā)展的基石。因此,“公共云+AI”是發(fā)展AI大模型的最優(yōu)解決方案,“云智一體”才能讓智能創(chuàng)新觸手可及,讓產(chǎn)業(yè)全面邁向智能。中美的這一輪競(jìng)爭(zhēng),核心是“大模型訓(xùn)練能力+公共AI服務(wù)能力+公共計(jì)算能力”的競(jìng)爭(zhēng),最終比拼的是兩國(guó)間誰(shuí)能用最低的成本、最高的效率、最專業(yè)化的技術(shù)、最大化地挖掘數(shù)據(jù)要素中的無(wú)限價(jià)值。

人們也許會(huì)問:中國(guó)為什么沒有ChatGPT?其實(shí)這個(gè)問題問錯(cuò)了,正確的問題是:“中國(guó)為什么沒有Open AI?中國(guó)為什么沒有Snowflake(云原生數(shù)據(jù)庫(kù)公司)?中國(guó)為什么沒有Palantir(云原生大數(shù)據(jù)分析公司)?”

今天的ChatGPT只是美國(guó)創(chuàng)新生態(tài)中的一片樹葉,而我們要關(guān)注美國(guó)創(chuàng)新這棵樹是什么樣子——樹根是什么樣子,土壤是什么樣子,乃至整個(gè)森林生態(tài)是什么樣子。美國(guó)的云計(jì)算不僅是一個(gè)商業(yè)基礎(chǔ)設(shè)施,更是一個(gè)創(chuàng)新的基礎(chǔ)設(shè)施,沒有這樣的創(chuàng)新基礎(chǔ)設(shè)施,就不會(huì)有Snowflake、Open AI、Palantir這樣的公司。

(二)主力軍:擁有算力、模型、場(chǎng)景、人才等綜合優(yōu)勢(shì)的大型科技公司,是AI大模型大國(guó)競(jìng)爭(zhēng)的主力軍

ChatGPT是AI大模型工程化的重大創(chuàng)新,其核心的技術(shù)壁壘是數(shù)據(jù)、算法、算力等要素資源的精巧組合。AI大模型的基本特點(diǎn)是具有超大規(guī)模的參數(shù)量,對(duì)算力、數(shù)據(jù)、人才等均提出極高要求。

AI大模型需要大算力支持訓(xùn)練。AI大模型的訓(xùn)練離不開密集型的算力,而且不是簡(jiǎn)單的GPU或CPU的堆積,而是需要將異構(gòu)的算力有效高速地連接起來(lái),并提供高吞吐、低延遲的網(wǎng)絡(luò)方案,這對(duì)大模型訓(xùn)練至關(guān)重要。如之前所述,GPT3用了1萬(wàn)張A100、14.8天,訓(xùn)練一次的成本達(dá)到千萬(wàn)美元級(jí)別,ChatGPT每月運(yùn)行成本為7500萬(wàn)美元。有機(jī)構(gòu)估計(jì),GPT4大約需要2萬(wàn)—3萬(wàn)張A100,訓(xùn)練一個(gè)月左右。

AI大模型需要大數(shù)據(jù)“喂養(yǎng)”和強(qiáng)大的數(shù)據(jù)預(yù)處理能力。數(shù)據(jù)的預(yù)處理能力很大程度決定了數(shù)據(jù)的質(zhì)量,從而影響模型的最終效果。在模型訓(xùn)練之前,通常依賴專業(yè)數(shù)據(jù)團(tuán)隊(duì)對(duì)數(shù)據(jù)集進(jìn)行去重、清洗、分詞、詞的正則化或標(biāo)準(zhǔn)化等一系列預(yù)處理。

AI產(chǎn)業(yè)生態(tài)面臨重構(gòu),基礎(chǔ)模型從“百花齊放”到“幾枝獨(dú)秀”。AI大模型訓(xùn)練及運(yùn)營(yíng)面臨成本高、數(shù)據(jù)獲取難、孵化周期長(zhǎng)的挑戰(zhàn),只有同時(shí)具備并能有機(jī)融合算力、數(shù)據(jù)、場(chǎng)景、人才和資本等優(yōu)勢(shì)的科技公司,才會(huì)成為AI大模型工程化的主力軍。過去十年,全球AI大模型的研發(fā)主體,由科研機(jī)構(gòu)牽頭運(yùn)行的項(xiàng)目占比從60%下降到個(gè)位數(shù)。斯坦福發(fā)布報(bào)告顯示,2014年以前,重大AI理論模型大多來(lái)自學(xué)術(shù)界,而2022年,企業(yè)界生產(chǎn)了 32 個(gè)AI理論模型,學(xué)術(shù)界只生產(chǎn)了 3 個(gè)。

(三)主戰(zhàn)場(chǎng):構(gòu)建技術(shù)生態(tài)和可商業(yè)化閉環(huán)的產(chǎn)業(yè)生態(tài),是AI大模型全球競(jìng)爭(zhēng)的主戰(zhàn)場(chǎng)

AI大模型的競(jìng)爭(zhēng)不僅是企業(yè)間的競(jìng)爭(zhēng),更是生態(tài)與生態(tài)間的競(jìng)爭(zhēng),是“整體戰(zhàn)”和“持久戰(zhàn)”,核心是生態(tài)戰(zhàn)——能夠形成技術(shù)與商業(yè)閉環(huán)。2016年3月AlphaGo擊敗冠軍李世乭,但人工智能一直沒有找到好的商業(yè)模式。過去10年,中國(guó)的人工智能產(chǎn)業(yè)也只在圖像識(shí)別領(lǐng)域找到了商業(yè)化方向。而這一輪AI大模型,將激發(fā)人們無(wú)限商業(yè)可能(如圖6所示)。

打通“模型創(chuàng)新、工程落地、產(chǎn)業(yè)商用”三環(huán)節(jié),形成完整的技術(shù)與商業(yè)閉環(huán)能力,是AI大國(guó)博弈的主戰(zhàn)場(chǎng)。微軟的優(yōu)勢(shì)不僅體現(xiàn)在與OpenAI合作模型訓(xùn)練的先發(fā)優(yōu)勢(shì)上,更體現(xiàn)在AI在2C、2B豐富多元的應(yīng)用場(chǎng)景和商業(yè)閉環(huán)上。歐洲、日本等國(guó)家和地區(qū)或許也可以訓(xùn)練出一個(gè)AI大模型,但由于缺乏云計(jì)算和互聯(lián)網(wǎng)企業(yè)等基礎(chǔ)能力,突破大規(guī)模商業(yè)化閉環(huán)面臨巨大的挑戰(zhàn)。

AI大模型訓(xùn)練和運(yùn)營(yíng)分三個(gè)階段:一是理論大模型階段。核心是基礎(chǔ)架構(gòu)、基礎(chǔ)算法的理論創(chuàng)新與突破, 如Transformer模型。二是工程大模型階段。核心是“大數(shù)據(jù)+大算力+長(zhǎng)期主義”,通過模型對(duì)海量數(shù)據(jù)學(xué)習(xí),實(shí)現(xiàn)AI大模型基礎(chǔ)能力的持續(xù)提升,如從GPT-1到GPT-3到GTP-4。這一階段是大模型和數(shù)據(jù)的“離線”階段,可以不依賴公共云和互聯(lián)網(wǎng)的在線能力。三是商業(yè)大模型階段。核心是實(shí)現(xiàn)“在線化”的商業(yè)閉環(huán),關(guān)鍵是基于工程大模型底座,構(gòu)建“通用服務(wù)大模型”(如ChatGPT)、“行業(yè)專屬大模型”(如基于ChatGPT或開源大模型訓(xùn)練面向電力、創(chuàng)意、法律、醫(yī)療等行業(yè)的服務(wù)能力)和服務(wù)具體企業(yè)的“企業(yè)專屬大模型”(如精準(zhǔn)服務(wù)某律師事務(wù)所或電力企業(yè)的專屬大模型)體系。AI大模型通過“API”等方式以及模型蒸餾等“瘦身”技術(shù),將AI技術(shù)普惠化、低門檻化,在千行百業(yè)的2B市場(chǎng)和億萬(wàn)2C市場(chǎng)中實(shí)現(xiàn)大規(guī)模商業(yè)化運(yùn)營(yíng)。如ChatGPT、New Bing、辦公場(chǎng)景中的Copilot等。

技術(shù)生態(tài)是AI大模型技術(shù)創(chuàng)新的重要載體。圍繞大模型、工程化應(yīng)用等構(gòu)建芯片、算法框架、數(shù)據(jù)治理、知識(shí)分享、行業(yè)應(yīng)用等全棧式AI大模型技術(shù)體系,是AI大模型產(chǎn)業(yè)發(fā)展的重要基礎(chǔ)。

產(chǎn)業(yè)生態(tài)是構(gòu)筑商業(yè)閉環(huán)和競(jìng)爭(zhēng)壁壘的關(guān)鍵。數(shù)字時(shí)代是生態(tài)體系間的競(jìng)爭(zhēng),Wintel生態(tài)體系主導(dǎo)PC時(shí)代,ARM+Android生態(tài)體系主導(dǎo)移動(dòng)互聯(lián)網(wǎng)時(shí)代,基于NVIDIA+Transformer的AI大模型生態(tài)正在形成。越早將大模型推向市場(chǎng),越多吸納用戶的反饋來(lái)反哺大模型,越能實(shí)現(xiàn)“模型越強(qiáng)、應(yīng)用越多,應(yīng)用越多、模型越強(qiáng)”的“飛輪效應(yīng)”。

讓算力更普惠、讓AI更普及是構(gòu)建產(chǎn)業(yè)生態(tài)的重要一環(huán)。國(guó)內(nèi)企業(yè)積極推動(dòng)低代碼及Serverless發(fā)展,降低開發(fā)門檻讓算力更普及,面向企業(yè)提供更普惠的AI基礎(chǔ)設(shè)施和大模型能力。開發(fā)者可以在“魔搭”上下載各類開源AI模型,并直接調(diào)用算力、一站式AI大模型訓(xùn)練及推理平臺(tái)。發(fā)布不到半年,“魔搭”社區(qū)總用戶量已超100萬(wàn),模型總下載量超1600萬(wàn)次,成為國(guó)內(nèi)規(guī)模最大的AI模型社區(qū)。

技術(shù)和商業(yè)閉環(huán)一旦形成,就會(huì)產(chǎn)生巨大的飛輪效應(yīng),構(gòu)筑起較高的產(chǎn)業(yè)壁壘。大生態(tài)離不開大市場(chǎng),歐洲錯(cuò)失互聯(lián)網(wǎng)發(fā)展機(jī)遇的重要原因之一是缺乏單一統(tǒng)一大市場(chǎng),市場(chǎng)規(guī)模決定了資本密集、技術(shù)密集、人才密集型的市場(chǎng)結(jié)構(gòu)和競(jìng)爭(zhēng)格局,也決定了企業(yè)的規(guī)模、成長(zhǎng)性和競(jìng)爭(zhēng)力。AI大模型具有重投入、長(zhǎng)周期、快迭代、高風(fēng)險(xiǎn)等特點(diǎn),其發(fā)展必須依賴大市場(chǎng)的規(guī)模經(jīng)濟(jì)來(lái)支撐。

四、當(dāng)前我國(guó)通用人工智能高質(zhì)量發(fā)展面臨的主要挑戰(zhàn)

我國(guó)AI大模型技術(shù)創(chuàng)新與產(chǎn)業(yè)化,面臨著統(tǒng)一大市場(chǎng)、高端芯片、數(shù)據(jù)資源和創(chuàng)新生態(tài)等多重挑戰(zhàn)。

(一)低水平智算中心建設(shè),消解了我國(guó)統(tǒng)一大市場(chǎng)優(yōu)勢(shì)

ChatGPT激發(fā)了各地建設(shè)智算中心的沖動(dòng),全國(guó)多地市區(qū)縣政府規(guī)劃建設(shè)近百個(gè)私有化部署的智算中心,旨在以本地智算中心服務(wù)本地企業(yè)。這些低水平智算中心不提供公共云服務(wù),主要服務(wù)本地產(chǎn)業(yè)和科研機(jī)構(gòu),無(wú)法向全國(guó)提供算力服務(wù),客戶場(chǎng)景不豐富,市場(chǎng)空間有限,不支持開源模型,生態(tài)能力弱,無(wú)法支撐高質(zhì)量AI大模型發(fā)展。分散的智算中心建設(shè)模式,造成了統(tǒng)一市場(chǎng)的割裂。

蜂擁而上的“大煉模型”,只是低水平的重復(fù)建設(shè)。只有依靠大型科技公司“煉大模型”,才能逐步彌補(bǔ)中美在模型層面的差距。全國(guó)各地“村村點(diǎn)火,處處冒煙”式建設(shè)的智算中心,將全國(guó)統(tǒng)一的人工智能算力市場(chǎng)和服務(wù)市場(chǎng)肢解為一個(gè)個(gè)孤立破碎的小市場(chǎng),而我國(guó)大國(guó)大巿場(chǎng)優(yōu)勢(shì)被消解,制約了AI企業(yè)的培育、生態(tài)的建立、人才的培養(yǎng)和商業(yè)的閉環(huán)。

(二)AI高端芯片出口管制,增加了算力成本、延長(zhǎng)了追趕周期

高性能、低成本算力是AI大模型技術(shù)創(chuàng)新和產(chǎn)業(yè)化的關(guān)鍵資源。人工智能是美國(guó)政府打壓中國(guó)的重點(diǎn)領(lǐng)域。去年,美國(guó)已經(jīng)對(duì)兩款高端GPU芯片——A100和H100實(shí)施對(duì)華出口管制,智算中心也面臨著“卡脖子”。

高端芯片出口管制,也降低了算力性能,增加了技術(shù)風(fēng)險(xiǎn)。H100的性能相當(dāng)于中國(guó)可出口GPU芯片A800的8倍左右,同樣算力需要購(gòu)買更多低性能的芯片,增加了服務(wù)器集群計(jì)算調(diào)度與建設(shè)難度,技術(shù)故障風(fēng)險(xiǎn)與運(yùn)維、運(yùn)營(yíng)成本會(huì)大規(guī)模增加,性能差距也在10倍以上,性價(jià)比在3倍以上。

AI高端芯片出口管制進(jìn)一步拉大了中美AI大模型產(chǎn)業(yè)的差距,需要基于云計(jì)算的大規(guī)模集群統(tǒng)一調(diào)度技術(shù),推廣“一云多芯”的公共云服務(wù),發(fā)揮大規(guī)模集群算力優(yōu)勢(shì)與集約化成本優(yōu)勢(shì)。

(三)數(shù)據(jù)的規(guī)模少、質(zhì)量低和處理能力弱,降低了人工智能大模型的“智商”

大模型的“智商”取決于被訓(xùn)練的數(shù)據(jù)量和知識(shí)密度。我國(guó)大模型數(shù)據(jù)主要存在以下幾個(gè)問題:一是互聯(lián)網(wǎng)中文數(shù)據(jù)較少,中文網(wǎng)站在世界前一百萬(wàn)網(wǎng)站中只有1.3%;二是數(shù)據(jù)質(zhì)量不高;三是數(shù)據(jù)處理能力弱。通用大模型預(yù)訓(xùn)練語(yǔ)料庫(kù)詞條量高達(dá)3000億條,包含了互聯(lián)網(wǎng)網(wǎng)頁(yè)、GitHub代碼、電子圖書館、維基百科等,而能夠?qū)Υ竽P托枰暮A繑?shù)據(jù)進(jìn)行清洗、加工、處理的企業(yè)鳳毛麟角。

(四)創(chuàng)新生態(tài)體系尚未形成,制約了創(chuàng)新型企業(yè)群體涌現(xiàn)

中美技術(shù)競(jìng)爭(zhēng),核心是創(chuàng)新生態(tài)體系的競(jìng)爭(zhēng)。中國(guó)的挑戰(zhàn)在于,一是缺乏顛覆式技術(shù)創(chuàng)新的肥沃土壤。美國(guó)一直主導(dǎo)全球人工智能基礎(chǔ)模型架構(gòu)的突破,2017年谷歌推出的Transformer架構(gòu),標(biāo)志著美國(guó)在人工智能模型底層架構(gòu)上的新突破,奠定了當(dāng)前大模型主流算法架構(gòu)基礎(chǔ),全球也由此開啟了一輪超大規(guī)模人工智能模型訓(xùn)練和應(yīng)用競(jìng)賽。二是創(chuàng)新基礎(chǔ)設(shè)施薄弱,云計(jì)算底座不厚實(shí)。三是支持新業(yè)態(tài)新技術(shù)的有效政策仍待完善。

OpenAI的啟示在于,成功=技術(shù)信仰與長(zhǎng)期主義+風(fēng)險(xiǎn)投資創(chuàng)新+小公司創(chuàng)新與大公司商業(yè)化閉環(huán)。正如OpenAI首席科學(xué)家Ilya Sutskeve所展示的,成功來(lái)自于一個(gè)偏執(zhí)狂的領(lǐng)軍者和一批擁有使命感的天才,他們擁有堅(jiān)定的技術(shù)信仰、方向感和對(duì)AGI的戰(zhàn)略定力,不斷探尋正確的方法論,堅(jiān)持將AI做成產(chǎn)品而不是技術(shù)的底層文化,秉持科學(xué)家+工程師的人才觀,強(qiáng)調(diào)代碼化的執(zhí)行力。OpenAI的啟示還在于,ChatGPT等技術(shù)的差距只是表象,本質(zhì)是創(chuàng)新機(jī)制、創(chuàng)新生態(tài)、創(chuàng)新文化的差距。

五、對(duì)中國(guó)人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展的建議

一是堅(jiān)持市場(chǎng)導(dǎo)向,引導(dǎo)地方智算中心有序健康發(fā)展。規(guī)范智算中心基礎(chǔ)設(shè)施建設(shè)標(biāo)準(zhǔn),減少地方政府直接投資,以市場(chǎng)機(jī)制引導(dǎo)大型科技企業(yè)加大新型基礎(chǔ)設(shè)施投資力度,參與全球競(jìng)爭(zhēng)。

二是采用創(chuàng)新應(yīng)用先行、芯片替代跟上的路徑策略。現(xiàn)在中國(guó)大模型和應(yīng)用創(chuàng)新達(dá)到了國(guó)際先進(jìn)水平,但須逐步完成芯片的國(guó)產(chǎn)化替換。

三是聚焦做強(qiáng)做優(yōu),支持平臺(tái)企業(yè)投入下一代人工智能技術(shù)研發(fā)。

四是構(gòu)建通用人工智能產(chǎn)業(yè)生態(tài)。支持基于公共云搭建從AI芯片、智能算力、AI工程化工具、開源模型庫(kù)到數(shù)據(jù)集的一體化平臺(tái),有效降低大模型訓(xùn)練開發(fā)門檻,構(gòu)建大模型訓(xùn)練、調(diào)試、商業(yè)化的技術(shù)生態(tài)和產(chǎn)業(yè)生態(tài)。

五是創(chuàng)新監(jiān)管理念,營(yíng)造穩(wěn)定、公平、透明、可預(yù)期的營(yíng)商環(huán)境。

(作者單位:阿里研究院。本文許多重要觀點(diǎn),來(lái)自張影強(qiáng)、羅治兵、郭敏、史大治、張?zhí)靹?、李樹翀、陳魯川等多位阿里專家?/p>

主站蜘蛛池模板: 国产黄色爱视频| 狠狠亚洲婷婷综合色香| 国产91精品调教在线播放| 2022国产91精品久久久久久| 国产毛片不卡| 国内精品小视频在线| 国产91久久久久久| 亚洲嫩模喷白浆| 一边摸一边做爽的视频17国产| 亚洲无线国产观看| 无码国产伊人| 呦女精品网站| 欧洲一区二区三区无码| av手机版在线播放| 国产Av无码精品色午夜| 人妻中文字幕无码久久一区| 国产成年女人特黄特色大片免费| 精品国产三级在线观看| 国产精品视频观看裸模| 女人一级毛片| 亚洲国产综合精品中文第一| 国产乱子伦视频在线播放| 亚洲自偷自拍另类小说| 十八禁美女裸体网站| 无码丝袜人妻| 国产欧美日韩综合在线第一| 国产性爱网站| 国产一区二区福利| 高h视频在线| 东京热高清无码精品| 国产h视频在线观看视频| 国产国语一级毛片在线视频| 国产福利免费视频| 国产国产人在线成免费视频狼人色| 永久天堂网Av| 国产毛片片精品天天看视频| 2048国产精品原创综合在线| 亚洲有无码中文网| 久久精品中文字幕少妇| 91无码人妻精品一区| 自拍偷拍一区| 青青青国产免费线在| 久久精品这里只有精99品| 亚洲一区无码在线| 在线播放国产99re| 97se亚洲| 91美女视频在线| 久久精品只有这里有| 中文字幕日韩视频欧美一区| 久久亚洲国产一区二区| 国产极品美女在线观看| 久草热视频在线| 日韩精品欧美国产在线| 毛片久久久| 日本在线欧美在线| 国产精品久久久精品三级| 国产无码精品在线| 亚洲国产第一区二区香蕉| 久久夜色撩人精品国产| 日韩精品亚洲一区中文字幕| 波多野结衣在线se| 日韩高清中文字幕| 国产一级无码不卡视频| 丰满人妻一区二区三区视频| 久久毛片基地| 免费jjzz在在线播放国产| 国产黄色视频综合| 精品福利国产| 尤物在线观看乱码| 97se综合| 中文字幕乱码中文乱码51精品| 永久在线播放| 亚洲国产综合第一精品小说| 亚洲精品视频网| 片在线无码观看| 国产视频一区二区在线观看| 国产精品刺激对白在线| 亚洲免费毛片| 伊人久综合| 亚洲国产精品日韩欧美一区| 日韩无码白| 日韩小视频网站hq|