999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大模型開(kāi)啟革命的序幕

2023-12-28 07:13:12黃耀鵬
中國(guó)汽車(chē)界 2023年9期
關(guān)鍵詞:模型

文 / 黃耀鵬

今年的新能源汽車(chē)產(chǎn)業(yè),如果說(shuō)有什么技術(shù)發(fā)展方向是業(yè)內(nèi)共識(shí)的話,除了高壓快充普及,就是大模型接入了。

7月31日,吉利預(yù)告了大模型技術(shù);8月8日,廣汽推出“廣汽AI大模型平臺(tái)”;本月,奇瑞將發(fā)布自己的AI大模型……在此之前,小鵬、理想、特斯拉都宣稱自己擁有“自動(dòng)化數(shù)據(jù)閉環(huán)系統(tǒng)”(大模型的一種應(yīng)用方向)。李想公開(kāi)宣稱:“大模型的研發(fā)和訓(xùn)練,是智能電動(dòng)車(chē)企業(yè)的必要能力。”

而平臺(tái)級(jí)公司,百度、阿里、騰訊、360、華為都推出了自己的大模型。上半年結(jié)束的時(shí)候,國(guó)內(nèi)大模型已經(jīng)達(dá)到80個(gè)以上。中美兩國(guó)的大模型數(shù)量占據(jù)了全球80%。

面對(duì)大模型,車(chē)企有三種選擇:第一種是從基礎(chǔ)層開(kāi)始,全盤(pán)由自己搭建;第二種是在平臺(tái)級(jí)企業(yè)搭建的基礎(chǔ)層上搭建應(yīng)用層;第三種是直接接入某個(gè)大模型。

目前,三種玩法都有一批企業(yè)參與。百度的文心一言(語(yǔ)言大模型),就有長(zhǎng)安、紅旗、嵐圖、長(zhǎng)城、吉利、東風(fēng)日產(chǎn)、零跑、集度等幾十家車(chē)企接入。

大模型有很多應(yīng)用方向,語(yǔ)言類的集中于智能座艙的優(yōu)化。而汽車(chē)必須首先滿足安全便捷地運(yùn)送乘客,自動(dòng)駕駛能力是剛需。因此,現(xiàn)在車(chē)企部署/接入的大模型,主要就是做自動(dòng)駕駛,或者其中的一些環(huán)節(jié)。

人工智能正在“涌現(xiàn)”

到底什么是“大模型”?

其實(shí)“模型”就是一段計(jì)算機(jī)程序,用來(lái)構(gòu)建一個(gè)虛擬的神經(jīng)網(wǎng)絡(luò)。和生物的神經(jīng)網(wǎng)絡(luò)類似,只有刺激到一定程度,神經(jīng)才會(huì)活躍。如果再?gòu)?qiáng)化刺激,就會(huì)輸出活動(dòng)。

這其實(shí)就是多段函數(shù)的表達(dá)。神經(jīng)網(wǎng)絡(luò)模擬任意連續(xù)函數(shù),也就成了可能。上世紀(jì)80年代之后,這些計(jì)算機(jī)概念就建立起來(lái),并在自動(dòng)駕駛上應(yīng)用,但一直沒(méi)有大的突破。

汽車(chē)變身為行走的計(jì)算終端,其革命性形態(tài)已經(jīng)出現(xiàn)?,F(xiàn)在就參與大模型構(gòu)建和應(yīng)用,就顯得比較重要了。

原因在于參數(shù)量。這是ChatGPT火起來(lái)的重要原因。OpenAI公司發(fā)現(xiàn),模型參數(shù)如果多到一定程度,系統(tǒng)智能(模型精度)就會(huì)極大提升,原理現(xiàn)在無(wú)法解釋,但已經(jīng)有了一個(gè)詞匯來(lái)形容——“涌現(xiàn)”。

多到什么程度呢?一般來(lái)說(shuō),至少要1億左右。當(dāng)然,因?yàn)樽匀徽Z(yǔ)言的信息密度高于圖像,所以ChatGPT-2的參數(shù)量達(dá)到15億個(gè),而ChatGPT-3則達(dá)到1750億個(gè),剛好和人類神經(jīng)元數(shù)量級(jí)別差不多。

不過(guò),自動(dòng)駕駛方面的應(yīng)用,現(xiàn)在用不了那么多參數(shù)。因?yàn)椤坝楷F(xiàn)”現(xiàn)象尚未在計(jì)算機(jī)視覺(jué)領(lǐng)域出現(xiàn)??紤]到成本,車(chē)企們都未將大模型參數(shù)量做到ChatGPT-3那么夸張。但上億是沒(méi)跑的,否則就很難叫大模型,需要部署超算中心或者云端算力中心,來(lái)運(yùn)行如此之多的參數(shù)。

運(yùn)行參數(shù)用來(lái)做什么?對(duì)自動(dòng)駕駛系統(tǒng)進(jìn)行數(shù)據(jù)訓(xùn)練。那么大模型定義就呼之欲出了,就是擁有大量參數(shù)、運(yùn)行于大算力硬件平臺(tái)上,并能夠完成無(wú)監(jiān)督學(xué)習(xí)(自我訓(xùn)練)的計(jì)算機(jī)程序。

自動(dòng)標(biāo)注和預(yù)標(biāo)注

以前都是有監(jiān)督學(xué)習(xí)(人工訓(xùn)練),現(xiàn)在讓AI自我訓(xùn)練,就需要先完成數(shù)據(jù)閉環(huán)。這就是為什么幾家新勢(shì)力說(shuō)自己擁有“自動(dòng)化數(shù)據(jù)標(biāo)注系統(tǒng)”的原因,其實(shí)就是大模型的一個(gè)功能。

而完整的數(shù)據(jù)閉環(huán)則囊括了數(shù)據(jù)采集、數(shù)據(jù)回流、數(shù)據(jù)處理、數(shù)據(jù)標(biāo)注、模型訓(xùn)練、測(cè)試驗(yàn)證諸多環(huán)節(jié)。其中,“數(shù)據(jù)標(biāo)注”是AI自我訓(xùn)練的前提,也是AI訓(xùn)練的成本節(jié)點(diǎn)。

所謂標(biāo)注,就是給視頻或者圖像的關(guān)鍵信息點(diǎn)貼上標(biāo)簽,以便讓系統(tǒng)認(rèn)識(shí)并在實(shí)際操作中做針對(duì)性規(guī)劃。顯然,量產(chǎn)車(chē)采集的場(chǎng)景基本都是重復(fù)的,數(shù)據(jù)意義不大。專門(mén)采集車(chē)則比較貴(成本每天6000元-10000元)。

重點(diǎn)是,如何盡量多地搜集到“長(zhǎng)尾場(chǎng)景”,即不常遇見(jiàn),但駕駛了很多次之后,每個(gè)人幾乎都會(huì)遇上的場(chǎng)景(占5%左右)。

在大模型上線前,都是人工標(biāo)注。1000幀的視頻數(shù)據(jù),人工標(biāo)注成本可能達(dá)到萬(wàn)元。

而大模型目前最有價(jià)值的部分,莫過(guò)于自動(dòng)化數(shù)據(jù)標(biāo)注,可能會(huì)節(jié)約上億元(取決于替代多少人標(biāo)注數(shù)據(jù))。

特斯拉為了打造一套高效數(shù)據(jù)閉環(huán)系統(tǒng),自研了超算中心。超算的另一個(gè)作用,就是有了基底訓(xùn)練數(shù)據(jù)——超過(guò)20億公里,就不太依賴新的實(shí)際路采了。大模型會(huì)改變參數(shù),在電腦里面重建場(chǎng)景,自動(dòng)進(jìn)行長(zhǎng)尾場(chǎng)景的自我訓(xùn)練。比如采了白天的數(shù)據(jù),稍微改一下,就變成黑夜、雨天,或者有司機(jī)急打方向盤(pán)、急踩剎車(chē)造成的混亂等等,都可以模擬。

在超算上運(yùn)行的大模型,對(duì)長(zhǎng)尾場(chǎng)景自動(dòng)進(jìn)行“預(yù)標(biāo)注”。而后續(xù)還要進(jìn)行人工審核,譬如要把漏標(biāo)的框標(biāo)注出來(lái)、把標(biāo)注錯(cuò)誤的框刪掉、把框的大小統(tǒng)一等。如果大模型預(yù)標(biāo)注做得好,那么后續(xù)人工審核工作量就很小了,與采用人海戰(zhàn)術(shù)對(duì)每一個(gè)圖像要素進(jìn)行標(biāo)注,完全不可同日而語(yǔ)。

催化全新合作方式

數(shù)據(jù)閉環(huán)的工作現(xiàn)在已經(jīng)分割給外包供應(yīng)商、大模型平臺(tái)公司(也可以視為供應(yīng)商)和車(chē)企分別來(lái)做。

關(guān)鍵在于,數(shù)據(jù)閉環(huán)能否讓車(chē)企有效迭代自動(dòng)駕駛算法,并提升應(yīng)對(duì)偶發(fā)場(chǎng)景的能力(這幾乎是L4繞不過(guò)去的坎)。落實(shí)到使用層面,通過(guò)多方合作,基于新的標(biāo)注數(shù)據(jù),進(jìn)行新的訓(xùn)練,實(shí)現(xiàn)由數(shù)據(jù)閉環(huán)驅(qū)動(dòng)自動(dòng)駕駛軟件迭代,并通過(guò)OTA部署到終端。

很少有車(chē)企能夠徹頭徹尾地自己部署基礎(chǔ)大模型,自己搞定應(yīng)用層,自己設(shè)計(jì)預(yù)標(biāo)注并實(shí)現(xiàn)數(shù)據(jù)閉環(huán),再驅(qū)動(dòng)算法更新。這即是L4的進(jìn)化之路,它的技術(shù)復(fù)雜度要求車(chē)企與供應(yīng)商充分融合式合作,而非傳統(tǒng)的供應(yīng)商“交付”-主機(jī)廠應(yīng)用。

車(chē)企過(guò)于看重價(jià)值鏈全盤(pán)掌握,強(qiáng)調(diào)全棧自研,可能會(huì)耽誤迭代進(jìn)程。

如果設(shè)計(jì)一種規(guī)則,比如基礎(chǔ)層大模型由平臺(tái)級(jí)公司設(shè)計(jì),車(chē)企負(fù)責(zé)掌握標(biāo)注規(guī)則,并將后續(xù)人工審核交給另外的第三方,拿回標(biāo)注好的數(shù)據(jù)之后,自己進(jìn)行訓(xùn)練。通過(guò)任務(wù)拆解,讓自己處于自動(dòng)駕駛價(jià)值鏈的核心地位。避免在關(guān)鍵技術(shù)上受制于人,也不用被迫接受“全家桶”(即由某個(gè)供應(yīng)商提出軟硬一體的解決方案)。

車(chē)企對(duì)這種方式應(yīng)該駕輕就熟,現(xiàn)在球踢回供應(yīng)商這邊,要求后者也要主動(dòng)參與到車(chē)企的大模型設(shè)計(jì)和訓(xùn)練當(dāng)中,而不必執(zhí)著于“打包交付”。

目前,雖然上馬大模型的車(chē)企越來(lái)越多,但是已經(jīng)實(shí)現(xiàn)數(shù)據(jù)閉環(huán),并部署于量產(chǎn)車(chē)上的,幾乎沒(méi)有。大家都還在拼“誰(shuí)先抵達(dá)下一個(gè)節(jié)點(diǎn)”。好消息是,L4看上去并非那么遙不可及了。

現(xiàn)在的問(wèn)題是,一個(gè)主機(jī)廠面對(duì)好幾個(gè)自動(dòng)駕駛系統(tǒng)供應(yīng)商。各個(gè)供應(yīng)商提供的每一個(gè)模塊,代碼質(zhì)量不一,工具鏈可能也不相同。如何檢驗(yàn)不同供應(yīng)商的模塊是否存在沖突,目前的工程化還不夠成熟。

這就涉及到,新獲得的長(zhǎng)尾數(shù)據(jù),對(duì)決策(規(guī)劃)產(chǎn)生的影響到底是什么。有些新增數(shù)據(jù),上了模型訓(xùn)練之后,效果變好(有效應(yīng)對(duì)了該場(chǎng)景),但總體上效率下降。這樣的局部改善導(dǎo)致整體變差的情況,需要對(duì)全局價(jià)值進(jìn)行一番預(yù)評(píng)估。這是另外的話題了,不展開(kāi)。

轉(zhuǎn)移模型到車(chē)端

不過(guò)有一點(diǎn)需要澄清,大模型部署于超算中心或者云端,但很難部署于車(chē)端。因?yàn)楹笳邲](méi)有那么強(qiáng)的算力,而且車(chē)端的數(shù)據(jù)存儲(chǔ)空間也不勝任。大模型的訓(xùn)練也要在超算平臺(tái)上完成,訓(xùn)練得差不多了(改善可以無(wú)終點(diǎn)),就能上車(chē),大模型就必須縮窄成中模型或者小模型。

數(shù)據(jù)需要壓縮,將知識(shí)體系(從感知輸入到規(guī)控輸出)轉(zhuǎn)移到輕量級(jí)的模型上,后者是車(chē)端算力和存儲(chǔ)可以承受的。

這其實(shí)就是“端到端”的算法。很多人都將“端到端”視為自動(dòng)駕駛算法的終極形態(tài)。所謂“端到端”,即只要有原始數(shù)據(jù)輸入(環(huán)境感知),就可以輸出結(jié)果(操作動(dòng)作),和ChatGPT類似,中間過(guò)程對(duì)觀察者來(lái)說(shuō)是“黑盒子”。

雖說(shuō)人類不需要理解決策過(guò)程,但人們總擔(dān)心自動(dòng)駕駛算法會(huì)輸出匪夷所思的決策。大量實(shí)踐結(jié)果沒(méi)問(wèn)題,也不能打消顧慮。

不過(guò)這很像人類駕駛了。熟練司機(jī)從眼睛看見(jiàn),到轉(zhuǎn)方向盤(pán)、踩剎車(chē)或油門(mén),都是中樞神經(jīng)在工作,人類沒(méi)有覺(jué)得自己花時(shí)間思考了。這就是大腦的“預(yù)訓(xùn)練系統(tǒng)”在起作用。

轉(zhuǎn)移模型還有個(gè)好處,就是避免了云與車(chē)端通訊的時(shí)延問(wèn)題。車(chē)端AI反應(yīng)都是毫秒級(jí),如果指望云端給出關(guān)鍵規(guī)劃,哪怕有邊緣計(jì)算加持,通訊也不能在任何時(shí)候?qū)崟r(shí)保障。

云端的作用,可以發(fā)揮大模型的參數(shù)容量?jī)?yōu)勢(shì),完成數(shù)據(jù)挖掘、自動(dòng)數(shù)據(jù)標(biāo)注等任務(wù)。在車(chē)端,可以部署分管不同子任務(wù)的多個(gè)小模型,合并成一個(gè)“中模型”,以節(jié)省車(chē)端計(jì)算環(huán)節(jié)的推理時(shí)間,增加安全性。不過(guò)車(chē)端模型的參數(shù)量,要比云端少一到兩個(gè)數(shù)量級(jí)。

為了提升ChatGpt的能力,OpenAI在8年間耗費(fèi)十億多美元的訓(xùn)練成本。車(chē)企大概率不會(huì)付出那么高的成本(不過(guò)特斯拉超算中心就花了10億美元)。如何用有限資金,搶占場(chǎng)景落地和商業(yè)化的速度(即訓(xùn)練迭代速度),而非一味追求模型之大、算力之強(qiáng)?

既然AI的應(yīng)用已經(jīng)走到了利用大模型實(shí)行空間(再現(xiàn)物理空間)計(jì)算這一步,那么L4就有可能實(shí)現(xiàn)。這是所有車(chē)企應(yīng)該具備的能力,無(wú)論它們采用什么方式達(dá)致這一目的。

汽車(chē)變身為行走的計(jì)算終端,汽車(chē)的革命性形態(tài),已經(jīng)出現(xiàn)在視野,不再遙遙無(wú)期?,F(xiàn)在就參與大模型構(gòu)建和應(yīng)用,而不是置身事外,就顯得比較重要了。

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 中文字幕亚洲电影| 四虎影视库国产精品一区| 人妻无码一区二区视频| 国产欧美日韩专区发布| 19国产精品麻豆免费观看| 强奷白丝美女在线观看| 日韩在线1| 日韩精品成人网页视频在线| 91成人免费观看| 欧美精品在线免费| 国产偷国产偷在线高清| 亚洲欧美不卡| 香蕉久久永久视频| 欧美国产日本高清不卡| 91欧美在线| 精品国产免费第一区二区三区日韩| 亚洲国产精品成人久久综合影院| 国产精品原创不卡在线| 国产青青草视频| 国产精品青青| 玖玖精品在线| 国产一级毛片在线| 欧美成人免费午夜全| 精品无码一区二区三区在线视频| 欧美一区二区精品久久久| 亚洲男人的天堂久久精品| 欧美另类第一页| 91福利在线观看视频| 国产色婷婷| 国产高清在线丝袜精品一区| 久久精品丝袜高跟鞋| 国产高清毛片| 亚洲色图综合在线| 伊人久久婷婷| 亚洲日韩欧美在线观看| 精品三级在线| 天天躁夜夜躁狠狠躁躁88| 欧美成人午夜视频| 亚洲成人动漫在线观看| 国产成人艳妇AA视频在线| 日本亚洲最大的色成网站www| 国产日韩欧美精品区性色| 国产一级二级三级毛片| 精品人妻AV区| 四虎成人免费毛片| 一本大道无码日韩精品影视| 色综合久久久久8天国| 亚洲av无码久久无遮挡| 国产午夜无码片在线观看网站| 国产免费黄| 91成人在线观看视频| 国产在线一区二区视频| 国产精品浪潮Av| 日韩不卡免费视频| 国产精品视频999| 亚洲av综合网| 欧美三級片黃色三級片黃色1| 免费人成视网站在线不卡| 日韩精品一区二区三区免费在线观看| 日本三级欧美三级| 成年人福利视频| 免费全部高H视频无码无遮掩| 深爱婷婷激情网| 国产96在线 | 麻豆国产在线不卡一区二区| 久久人人爽人人爽人人片aV东京热| h网址在线观看| 欧美伦理一区| 波多野吉衣一区二区三区av| 午夜国产小视频| 久草国产在线观看| 伊人久久大香线蕉综合影视| 欧美成人影院亚洲综合图| 精品黑人一区二区三区| 午夜天堂视频| 国产三级韩国三级理| 精品国产成人高清在线| 午夜天堂视频| 亚洲资源站av无码网址| 日韩欧美国产另类| 久久综合结合久久狠狠狠97色| 97久久超碰极品视觉盛宴|