999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

智能駕駛-AI芯片的算力研究

2019-01-10 07:05:32于繼成王強(qiáng)趙目龍焦育成
汽車文摘 2019年1期

于繼成 王強(qiáng) 趙目龍 焦育成

(中國(guó)第一汽車集團(tuán)有限公司智能網(wǎng)聯(lián)研發(fā)院,長(zhǎng)春 130011)

主題詞:智能駕駛 算力單位 算力計(jì)算方法 算力對(duì)比分析

1 前言

在對(duì)駕駛汽車更便捷、更安全、更舒適的追求下,人類已經(jīng)拉開了無(wú)人駕駛的幕布。縱觀世界,奧迪A8搭載了L3級(jí)自動(dòng)駕駛控制器,可在時(shí)速為60 km/h內(nèi)的城市道路自動(dòng)駕駛,是世界上首輛量產(chǎn)的L3級(jí)別自動(dòng)駕駛車輛,這也開啟了傳統(tǒng)汽車廠商在智能汽車方面的開端,使得豪華車向智能豪華車轉(zhuǎn)變。

智能駕駛汽車現(xiàn)已可配置激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá)、前視攝像頭、環(huán)視攝像頭、夜視紅外攝像頭等大量的傳感器用以采集道路數(shù)據(jù)、感知駕駛環(huán)境,但是只有傳感還不夠,還要有一個(gè)足夠強(qiáng)大的大腦對(duì)數(shù)據(jù)進(jìn)行分析,并做出正確的規(guī)劃和決策。這大腦部分就是由多個(gè)車規(guī)級(jí)的智能駕駛AI芯片搭建而成,包括GPU、FPGA、MCU及ASIC芯片等[1]。

2007年,一汽集團(tuán)與國(guó)防科技大學(xué)合作,在紅旗HQ3車型基礎(chǔ)上完成高速公路自動(dòng)駕駛樣車,開啟了中國(guó)一汽對(duì)自動(dòng)駕駛探索之路。2011年7月,紅旗HQ3無(wú)人車完成了從長(zhǎng)沙到武漢286 km的高速全程無(wú)人駕駛實(shí)驗(yàn),歷時(shí)3小時(shí)22分鐘,展示了一汽集團(tuán)在自動(dòng)駕駛上的探索成果;2015年4月,一汽集團(tuán)正式發(fā)布了其“摯途”技術(shù)戰(zhàn)略,標(biāo)志著一汽集團(tuán)的互聯(lián)智能汽車技術(shù)戰(zhàn)略規(guī)劃正式形成。2015年4月19日,一汽在同濟(jì)大學(xué)舉行了“摯途”技術(shù)實(shí)車體驗(yàn)會(huì),包含有“手機(jī)叫車、自主泊車、擁堵跟車、自主駕駛”等4項(xiàng)智能化技術(shù)[2]。2018年一汽集團(tuán)徐留平董事長(zhǎng)在北京鳥巢發(fā)布了紅旗品牌戰(zhàn)略,新紅旗將突出“新高尚”、“新精致”、“新情懷”的理念,打造卓越產(chǎn)品和服務(wù),發(fā)布了一汽紅旗品牌自動(dòng)駕駛發(fā)展規(guī)劃。

中國(guó)第一汽車集團(tuán)有限公司放眼世界造車趨勢(shì),集全集團(tuán)之力誓將自主紅旗品牌打造為中國(guó)第一、世界著名的汽車品牌。中國(guó)一汽將智能化、網(wǎng)聯(lián)化作為新紅旗汽車的核心魅點(diǎn),匹配當(dāng)前用戶追求極致體驗(yàn)的需求。在2018年上市的紅旗H5身上,消費(fèi)者已經(jīng)切身體驗(yàn)到行業(yè)領(lǐng)先的新紅旗卓越智能駕駛系統(tǒng)。隨后,中國(guó)一汽將不斷推出更加智能化、高度自動(dòng)化、完全自動(dòng)化駕駛的新紅旗產(chǎn)品。其中,2019年推出實(shí)現(xiàn)L3(SAE)級(jí)自動(dòng)駕駛的量產(chǎn)車型,2020年推出實(shí)現(xiàn)L4(SAE)級(jí)自動(dòng)駕駛的量產(chǎn)車型,2025年將實(shí)現(xiàn)L5(SAE)級(jí)自動(dòng)駕駛量產(chǎn)車型,部分內(nèi)容摘自一汽徐留平董事長(zhǎng)紅旗品牌戰(zhàn)略發(fā)布會(huì)講話。

作為從事硬件設(shè)計(jì)的工程師,為了提升對(duì)自動(dòng)駕駛硬件方案的設(shè)計(jì)水平,緩解對(duì)供應(yīng)商硬件方案的評(píng)估壓力,建立對(duì)自動(dòng)駕駛硬件方案的技術(shù)管控能力,需要對(duì)各個(gè)芯片廠家的AI芯片的功能和計(jì)算處理能力清楚掌握。

本文將從AI芯片最基礎(chǔ)的算力資源及算力大小、計(jì)算的角度,揭開自動(dòng)駕駛AI芯片的面紗。

2 自動(dòng)駕駛AI芯片算力

2.1 算力研究的意義

自動(dòng)駕駛域控制器的開發(fā),OEM通常有兩種方式,自主開發(fā)或者向供應(yīng)商采購(gòu)。如果自主開發(fā),AI芯片廠家包括Xilinx、NXP、Renesas、Intel、NVIDIA、TI等所生產(chǎn)的不同AI芯片、不同硬件資源架構(gòu)、不同計(jì)算能力,該如何取舍?如果向供應(yīng)商采購(gòu),供應(yīng)商如恒潤(rùn)、偉世通、地平線、東軟、TTTech等所提供的硬件方案是否能夠滿足應(yīng)用需求、實(shí)現(xiàn)應(yīng)有的功能、規(guī)避項(xiàng)目失敗的風(fēng)險(xiǎn)?這些問題使得我們不得不從硬件設(shè)計(jì)之初,芯片方案選型階段就要充分論證AI芯片的算力資源。

以往,關(guān)于自動(dòng)駕駛芯片算力的信息來(lái)自于AI芯片廠家提供及Tire1方案中的AI芯片對(duì)比數(shù)據(jù),這種模式導(dǎo)致以下幾點(diǎn)問題:

1)不能有效審核Tire1算力評(píng)估的準(zhǔn)確性;2)無(wú)法對(duì)應(yīng)AI芯片本身算力支持的硬件資源;3)不能根據(jù)需求進(jìn)行算力匹配與AI芯片選型。所以,了解各廠家AI芯片的內(nèi)部算力資源、了解算力的計(jì)算方法、統(tǒng)一算力單位成為自動(dòng)駕駛硬件設(shè)計(jì)的重要工作內(nèi)容。

2.2 算力基礎(chǔ)概念

2.2.1 算力單位

OPS(Operations Per Second):每秒完成操作的數(shù)量,乘操作算一個(gè)OP,加操作算一個(gè)OP;

MACS:表示每秒可執(zhí)行的定點(diǎn)乘累加操作次數(shù),可借用于衡量自動(dòng)駕駛計(jì)算平臺(tái)定點(diǎn)數(shù)據(jù)運(yùn)算處理能力,這個(gè)量之前用在那些大量定點(diǎn)乘法累加運(yùn)算的科學(xué)運(yùn)算中,記為MACS。1G MACS等同每秒10億(=109)次的定點(diǎn)乘累加運(yùn)算;

FLOPS(Floating-Point Operations Per Second):每秒可執(zhí)行的浮點(diǎn)運(yùn)算次數(shù)的字母縮寫,它用于衡量計(jì)算機(jī)浮點(diǎn)運(yùn)算處理能力。這個(gè)量經(jīng)常用于需要大量浮點(diǎn)運(yùn)算的科學(xué)運(yùn)算中。在自動(dòng)駕駛領(lǐng)域,由于NVIDIA SOC支持浮點(diǎn)運(yùn)算,且是目前最強(qiáng)處理IC之一。浮點(diǎn)運(yùn)算,實(shí)際上包括了所有涉及小數(shù)的運(yùn)算。浮點(diǎn)運(yùn)算比整數(shù)運(yùn)算更復(fù)雜、更精確、更耗費(fèi)時(shí)間。

DMIPIS(Dhrystone Million Instructions executed Per Second):Dhrystone:是測(cè)量處理器運(yùn)算能力的最常見基準(zhǔn)程序之一,常用于處理器的整型運(yùn)算性能的測(cè)量。MIPS:每秒執(zhí)行百萬(wàn)條指令,用來(lái)計(jì)算同一秒內(nèi)系統(tǒng)的處理能力,即每秒執(zhí)行了多少百萬(wàn)條指令。

2.2.2 基于INT8的深度學(xué)習(xí)架構(gòu)

隨著更精確的深度學(xué)習(xí)模型被開發(fā)出來(lái),它們的復(fù)雜性也帶來(lái)了高計(jì)算強(qiáng)度和高內(nèi)存帶寬方面的難題。能效正在推動(dòng)著深度學(xué)習(xí)推斷新模式開發(fā)方面的創(chuàng)新,這些模式需要的計(jì)算強(qiáng)度和內(nèi)存帶寬較低,但絕不能以犧牲準(zhǔn)確性和吞吐量為代價(jià)。降低這一開銷將最終提升能效,降低所需的總功耗。

INT8除了降低神經(jīng)網(wǎng)絡(luò)計(jì)算中數(shù)據(jù)傳輸帶來(lái)的功耗,較低位寬的計(jì)算方式同時(shí)可以降低內(nèi)存帶寬帶來(lái)的功耗費(fèi)用,可理解為在相同內(nèi)存事務(wù)的情況下傳輸?shù)奈粩?shù)減少了,進(jìn)而降低了總功耗[3]。

研究顯示要保持同樣的準(zhǔn)確性,深度學(xué)習(xí)推斷中無(wú)需浮點(diǎn)計(jì)算,而且圖像分類等許多應(yīng)用只需要INT8或更低定點(diǎn)計(jì)算精度來(lái)保持可接受的推斷準(zhǔn)確性。表1列出了精調(diào)網(wǎng)絡(luò)以及卷積層和完全相連層的動(dòng)態(tài)定點(diǎn)參數(shù)及輸出。括號(hào)內(nèi)的數(shù)字代表未精調(diào)的準(zhǔn)確性。

表1 帶定點(diǎn)精度的CNN模型精度對(duì)比分析[4]

通過(guò)上表可以看出,在自動(dòng)駕駛圖像處理應(yīng)用中,在不同的參數(shù)神經(jīng)網(wǎng)絡(luò)下,INT8與32位浮點(diǎn)的定點(diǎn)精度高度相近,所以在降低功耗,減少數(shù)據(jù)傳輸帶寬的優(yōu)勢(shì)下,INT8成為目前被廣為看好的精度格式。

3 算力計(jì)算公式

3.1 單位換算

3.1.1 MACS與OPS單位轉(zhuǎn)換

深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)使用相對(duì)數(shù)量較少的計(jì)算原語(yǔ)(Computational Primitives),而這些數(shù)量很少的計(jì)算原語(yǔ)卻占用了大部分計(jì)算時(shí)間。矩陣乘法和轉(zhuǎn)置是基本操作。矩陣乘法由乘法累加(MAC)操作組成。Ops/s(每秒完成的操作數(shù)量)指的是通過(guò)每秒可以完成多少個(gè)MAC(每次乘法和累加各被認(rèn)為是1個(gè)operation,因此MAC實(shí)際上是2個(gè)OP)得到[5]。所以,可以得到MACS與OPS之間的換算關(guān)系如下:1MACS=2?OPS。

3.1.2 ARM核算力DMIPS查詢方法及算力計(jì)算

智能駕駛AI芯片內(nèi)部均集成有多個(gè)內(nèi)核,而目前各個(gè)AI芯片廠商尤其以集成ARM內(nèi)核居多。ARM核多用于多圖像處理(轉(zhuǎn)化及提取)、目標(biāo)識(shí)別和融合、具有功能安全定義的決策制定等功能。

這里先介紹一下ARM核的算力查詢方法,ARM公司將其ARM核的算力信息更新在在維基百科上,可通過(guò)以下網(wǎng)址查詢[6],如表2所示。

表2 ARM核工作主頻及算力數(shù)據(jù)表[6]

例如某片SOC內(nèi)部集成4個(gè)A53核,工作主頻為1.2 GHZ,則該SOC內(nèi)部ARM核部分的計(jì)算處理能力為4×(2.3 DMIPS/MHz)×1.2 GHz=11.04 K DMIPS。

當(dāng)然有些AI公司會(huì)自己開發(fā)內(nèi)核,如Infineon的Tricore MCU TC297內(nèi)部集成的是其自己的內(nèi)核,類似于這些非集成ARM內(nèi)核的AI芯片的算力,在選型時(shí)需要與廠家進(jìn)行仔細(xì)確認(rèn)。

3.2 恩智浦S32V算力資源分析

3.2.1 芯片S32V234算力分析

恩智浦(NXP)下一代S32家族計(jì)算平臺(tái)是一個(gè)完全可擴(kuò)展的計(jì)算平臺(tái),基于公用架構(gòu),可以根據(jù)不同的應(yīng)用,像雷達(dá)應(yīng)用、網(wǎng)關(guān)應(yīng)用、視覺的應(yīng)用添加特有的功能IP,派生出針對(duì)功能安全和動(dòng)力總成應(yīng)用的S32S/P、雷達(dá)應(yīng)用的S32R、下一代網(wǎng)關(guān)應(yīng)用的S32G、視覺應(yīng)用的S32V、自動(dòng)駕駛應(yīng)用的S32A和通用的S32K[7]。S32V234有2個(gè)專用的圖形處理加速器APEX[8],如下圖1所示。APEX由2個(gè)APEX-642 ICP核組成,每個(gè)ICP核由2組APU組成,每個(gè)APU包含32個(gè)CU(矢量計(jì)算單元-Computational Units)和1個(gè)ACP(標(biāo)量計(jì)算及調(diào)度)。所以每個(gè)APEX有128個(gè)CU,4個(gè)ACP。其總計(jì)算能力為80 GMACs,即在400 MHz時(shí)鐘內(nèi),每個(gè)時(shí)鐘周期可以完成200次MAC運(yùn)算,這得益于CU的SIMD處理特性。

圖1 S32V234 Block Diagram[8]

3.2.2 下一代產(chǎn)品S32V3xx計(jì)算能力資源簡(jiǎn)介[8]

恩智浦下一代高算力產(chǎn)品S32V3xx的算力資源采用三個(gè)全新架構(gòu)設(shè)計(jì)的APEX-D硬核圖像處理加速器,總算力將比S32V2xx有大幅度提高。

S32V3xx性能的提高主要來(lái)源于以下因素:

(1)S32V3xx采用了全新設(shè)計(jì)的APEX-D加速處理器,架構(gòu)上作了優(yōu)化提升;

(2)時(shí)鐘頻率提升超過(guò)1倍;

(3)每個(gè)CU的處理能力大幅提升,每個(gè)時(shí)鐘周期可以完成更多的MAC運(yùn)算;

(4)整體功耗將控制在更低水平。

具體算力信息待NXP官方宣稱,但可以肯定的是,這款芯片未來(lái)的應(yīng)用場(chǎng)景非常可觀,將會(huì)為自動(dòng)駕駛技術(shù)的發(fā)展注入強(qiáng)勁力量。

3.3 瑞薩R-CAR算力資源分析

R-Car H3基于ARM? Cortex?-A57/A53核構(gòu)建,采用ARM的最新64位CPU核架構(gòu),實(shí)現(xiàn)了40 000 DMIPS(Dhrystone百萬(wàn)指令/每秒)的處理性能。

IMP是瑞薩(Renesas)的AI芯片中的一個(gè)圖像處理加速核,把許多圖像處理相關(guān)的算子進(jìn)行了硬件化。支持的一些預(yù)處理操作包括density-conversion、bit-inversion、normalization等,后處理包括Absolutevalue processing、normalization、density conversion等,像素轉(zhuǎn)換、數(shù)學(xué)運(yùn)算、邏輯運(yùn)算、Convolution、Labeling、Histogram processing和Sobel-filter等。

R-CAR芯片核心是MAC計(jì)算,主要基于5X5卷積運(yùn)算,每個(gè)5X5卷積運(yùn)算是25 MACs/cc,5X5卷積運(yùn)算在一個(gè)Clock cycle可以處理2個(gè)Pixel,每個(gè)Pixel是指一個(gè)8 bit的像素?cái)?shù)據(jù)。

以R-CAR H3為例,H3有4個(gè)5X5卷積運(yùn)算單元,工作頻率533 MHz,算力也就是25 MACs/cc X 2 pixels/cc X 533 MHz X 4 IMP Cores=106 G MACS。

R-CAR H3[9]系統(tǒng)框圖如圖2所示:

圖2 R-CAR H3系統(tǒng)框圖[9]

3.4 德州儀器TDA2S算力分析

德州儀器(TI)的AI芯片內(nèi)部包括ARM核、DSP和專為視覺處理設(shè)計(jì)的完全可編程的視覺加速器。

TDA2x SoC內(nèi)部包含2個(gè)TI知識(shí)產(chǎn)權(quán)定浮點(diǎn)DSP內(nèi)核C66x和4個(gè)專為視覺處理設(shè)計(jì)的視覺加速器EVE,完全可編程,工作主頻可達(dá)到650 MHz。

TDA2S的DSP內(nèi)核是TI自己開發(fā)的產(chǎn)品[10],可在其官網(wǎng)上對(duì)DSP算力進(jìn)行查詢,網(wǎng)址為:http://www.ti.com/processors/dsp/c6000-dsp/c66x/overview.html,查詢結(jié)果如表3所示。

TI的EVE@650MHz視覺圖像處理硬件加速器的算力為11.5 G OPS,DSP C66@750MHz的算力為4.6 G OPS,以TDA2s為例,其算力大小為2×DSP+4×EVE=55.2 G OPS=27.6 G MACS。

表3 TI官網(wǎng)DSP算力表[10]

3.5 賽靈思Ultra Scale ZU系列SOC算力分析

3.5.1 賽靈思(Xilinx)的FPGA在自動(dòng)駕駛應(yīng)用中的優(yōu)勢(shì)

作為GPU在算法加速上的強(qiáng)有力競(jìng)爭(zhēng)者,F(xiàn)PGA在自動(dòng)駕駛方案中越來(lái)越被看好,首先由于FPGA自身低能耗的特點(diǎn),十分適合于傳感器數(shù)據(jù)的(預(yù))處理工作;同時(shí)FPGA具有硬件可升級(jí)、可迭代的優(yōu)勢(shì),能夠滿足感知算法的不斷更新;另外FPGA具有高性能及可編程特性,十分適合感知計(jì)算;最后,F(xiàn)PGA相比GPU價(jià)格便宜,相比于CPU與GPU有明顯的性能與能耗優(yōu)勢(shì)。

3.5.2 FPGA算力計(jì)算分析

FPGA內(nèi)部包括ARM內(nèi)核、DSP Slices等算力資源。其中DSP Slices資源可以在Xilinx官網(wǎng)的選型指導(dǎo)手冊(cè)查到[11],如下表4所示。

表4 賽靈思車規(guī)級(jí)FPGA硬件資源表[11]

DSP Slice的算例計(jì)算公式為:可以按這個(gè)公式來(lái)算GOPS:DSP數(shù)量×最高時(shí)鐘×1.75×2,其中需要說(shuō)明的是1個(gè)DSP平均可以做1.75次INT8運(yùn)算、1個(gè)DSP是算2個(gè)運(yùn)算。

以Xilinx的ZU5EV為例,其DSP Slice數(shù)量為1 248個(gè),最高時(shí)鐘為645 MHz,根據(jù)以上計(jì)算公式可得ZU5EV的算力大小為:DSP數(shù)量×最高時(shí)鐘×2×1.75=1.248 K×645 MHz×2×1.75×G/1000=2817.36 G OPS=1408.68 G MACS=1.4 T MACS。

3.6 英偉達(dá)Tegra Parker SOC算例分析

3.6.1 基于GPU的計(jì)算解決方案

GPU在浮點(diǎn)運(yùn)算、并行計(jì)算等部分的計(jì)算方面,能夠提供數(shù)十倍甚至上百倍的CPU性能。利用GPU運(yùn)行機(jī)器學(xué)習(xí)模型,在云端進(jìn)行分類和檢測(cè),相對(duì)比CPU耗費(fèi)的時(shí)間將大幅度縮短。憑借強(qiáng)大的計(jì)算能力,在機(jī)器學(xué)習(xí)快速發(fā)展的推進(jìn)下,GPU目前在深度學(xué)習(xí)芯片市場(chǎng)非常受歡迎。

憑借具備識(shí)別、標(biāo)記功能的圖像處理器,英偉達(dá)(NVIDIA)在人工智能領(lǐng)域搶占先機(jī)。NVIDIA的PX2平臺(tái)是目前領(lǐng)先的基于GPU的無(wú)人駕駛解決方案,分別為Tesla、百度和算法公司等提供全套的硬件解決方案。在Drive PX2中,Auto Chauffeur是一個(gè)定義面向L3的版本,其運(yùn)算部分的配置是雙Parker SoC(提供256個(gè)CUDA運(yùn)算資源),外加雙MXM3.1接口的Pascal架構(gòu)獨(dú)立運(yùn)算圖形處理單元GP106(GPU,提供1 280個(gè)CUDA運(yùn)算單元)組成,片圖形處理單元都有自己的專屬內(nèi)存以及專用的指令以完成深度神經(jīng)網(wǎng)絡(luò)的硬件加速。借助優(yōu)化的I/O架構(gòu)與深度神經(jīng)網(wǎng)絡(luò)的硬件加速,單臺(tái)PX2 Auto Chauffeur能夠執(zhí)行每秒24兆次深度學(xué)習(xí)計(jì)算。

3.6.2 GPU的算力計(jì)算

GPU的浮點(diǎn)計(jì)算理論峰值能力測(cè)試跟CPU的計(jì)算方式基本一樣:

理論峰值=GPU芯片數(shù)量×GPU Boost主頻×核心數(shù)量×單個(gè)時(shí)鐘周期內(nèi)能處理的浮點(diǎn)計(jì)算次數(shù),

只不過(guò)在GPU里單精度和雙精度的浮點(diǎn)計(jì)算能力需要分開計(jì)算[12]。

雙精度理論峰值=FP64 Cores×GPU Boost Clock×2=xxx T flops

單精度理論峰值=FP32 cores×GPU Boost Clock×2=xxx T flops

以Tegra Parker SOC為例,其內(nèi)部有256個(gè)CUDA Cores,工作主頻是1 275 MHz:其雙精度理論算力峰值為FP64 Cores×GPU Boost Clock×2 = 0.65 T flops。

4 算力概括

通過(guò)以上對(duì)各個(gè)芯片廠家的AI芯片的算力分析,得到的是理論峰值,在方案階段的對(duì)比選型數(shù)據(jù),可以作為重要的參考要素,但是不能忽略有效算力這個(gè)概念,在硬件設(shè)計(jì)中如何協(xié)同合作發(fā)揮出AI芯片的有效算力是各位自動(dòng)駕駛工程師需要共同面對(duì)和解決的重要問題。

本文最后根據(jù)上面所羅列的計(jì)算方法對(duì)各廠家AI芯片的算力進(jìn)行總結(jié)比較,在這里需要聲明的是各廠家對(duì)自動(dòng)駕駛AI芯片的布局均有各自的策略和側(cè)重點(diǎn),對(duì)AI芯片的算力計(jì)算用以方案算力初始冗余量評(píng)估,本文的對(duì)比數(shù)據(jù)并無(wú)對(duì)不同AI芯片的優(yōu)劣好壞的評(píng)比,而是在此建議設(shè)計(jì)師們根據(jù)需求、根據(jù)應(yīng)用進(jìn)行選型,選擇最合適的而不是最貴的、性能最強(qiáng)大的。統(tǒng)計(jì)數(shù)據(jù)如表5所示。

表5 各芯片廠家部分AI芯片算力統(tǒng)計(jì)表

5 結(jié)束語(yǔ)

為促進(jìn)一汽紅旗智能駕駛汽車的發(fā)展,本文從最基礎(chǔ)的AI芯片進(jìn)行了論述,對(duì)AI芯片的計(jì)算處理能力進(jìn)行了闡釋說(shuō)明。希望能夠?qū)ξ磥?lái)的產(chǎn)品開發(fā)和芯片選型等提供參考依據(jù)。

高計(jì)算能力的AI芯片往往帶來(lái)更多的功耗需求,汽車用AI芯片將在高計(jì)算能力和低功耗的平衡中不斷發(fā)展突破,為實(shí)現(xiàn)L5級(jí)的完全自動(dòng)駕駛需求,除算法上面的不斷改進(jìn)外,對(duì)AI芯片算力的需求也將朝著百TOPS級(jí)別發(fā)展。目前,在電動(dòng)車及混動(dòng)車型上更容易滿足自動(dòng)駕駛大功耗的計(jì)算平臺(tái)需求,在提供大功率供電的同時(shí),也可借助電池冷卻液解決高功耗帶來(lái)的散熱難題。

致謝

感謝王強(qiáng)、趙目龍、焦育成等人對(duì)本文的形成給與的巨大支持與細(xì)致的校對(duì),對(duì)本文的形成起了重要作用。他們是一汽從事智能駕駛硬件設(shè)計(jì)人員的先行者與開拓者,在面對(duì)并解決重重困難中,為一汽的自動(dòng)駕駛事業(yè)保駕護(hù)航。

主站蜘蛛池模板: 亚洲无码高清一区二区| 欧洲欧美人成免费全部视频| 欧美日韩成人在线观看| 成人精品亚洲| 亚洲中文字幕在线精品一区| 日本少妇又色又爽又高潮| 日本午夜影院| 九九热免费在线视频| 青青热久免费精品视频6| 欧美性久久久久| 免费国产不卡午夜福在线观看| 91精品情国产情侣高潮对白蜜| 思思热精品在线8| 亚洲精品片911| 久久这里只有精品免费| 国产亚洲精| 中国毛片网| 精品一区二区无码av| 亚洲欧美另类中文字幕| 在线观看亚洲成人| 免费国产黄线在线观看| 国产无码性爱一区二区三区| 无码网站免费观看| 国产精品自在在线午夜| 丁香六月激情综合| 亚洲中文字幕97久久精品少妇| 亚洲区欧美区| 日韩精品一区二区三区免费在线观看| 国产另类乱子伦精品免费女| 成人午夜免费观看| 精品无码一区二区三区在线视频| 亚洲αv毛片| 国产亚洲视频中文字幕视频 | 国产高清毛片| yy6080理论大片一级久久| 99在线视频免费观看| 亚洲成人在线免费| 美女视频黄频a免费高清不卡| 看国产毛片| 日韩毛片基地| 国产乱人乱偷精品视频a人人澡| 精品视频在线观看你懂的一区| 污网站在线观看视频| 国产一区成人| 欧美中文字幕在线视频| 国产午夜无码专区喷水| 亚洲婷婷在线视频| 国产白丝av| 亚洲首页国产精品丝袜| 狂欢视频在线观看不卡| 2021天堂在线亚洲精品专区| 亚洲一级色| 最新精品久久精品| 97视频精品全国在线观看| 97se亚洲综合| 国产精品思思热在线| 天堂亚洲网| 真人高潮娇喘嗯啊在线观看| 国产成人综合在线观看| 欧美人与牲动交a欧美精品| 精品久久久久久成人AV| 日韩性网站| av一区二区人妻无码| 午夜老司机永久免费看片| 91精选国产大片| 亚洲国产天堂久久综合| 欧美色综合网站| 国产综合另类小说色区色噜噜| 好久久免费视频高清| 国产福利一区二区在线观看| 国产精品不卡永久免费| 欧美激情网址| 欧美高清视频一区二区三区| 色男人的天堂久久综合| 欧洲极品无码一区二区三区| 久久精品中文字幕少妇| 国产精品永久不卡免费视频| 国产精品手机在线观看你懂的| 亚洲男人天堂2020| 一区二区欧美日韩高清免费| 国产激情无码一区二区APP | 亚洲中文字幕av无码区|