999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

FPGA在深度學(xué)習(xí)算法中的優(yōu)勢(shì)分析

2022-07-02 14:16:49周瑩
科學(xué)與財(cái)富 2022年9期
關(guān)鍵詞:深度學(xué)習(xí)

摘? 要:近年來(lái),人工智能在各個(gè)領(lǐng)域的應(yīng)用上都取得了突破性的成功,深度學(xué)習(xí)作為人工智能最重要的研究方向,可以解決很多復(fù)雜及抽象的實(shí)際問(wèn)題。當(dāng)前深度學(xué)習(xí)得以流行,是得益于大數(shù)據(jù)和計(jì)算性能的提升,但其仍然遭受計(jì)算能力和數(shù)據(jù)量的瓶頸。針對(duì)數(shù)據(jù)量的需求,可以通過(guò)模型的調(diào)整、變更來(lái)緩解,但計(jì)算力的挑戰(zhàn)沒(méi)有捷徑。FPGA在深度學(xué)習(xí)算法的硬件加速方面有著高速度、低功耗等諸多優(yōu)勢(shì)。本文針對(duì)FPGA的特點(diǎn)在深度學(xué)習(xí)算法中的優(yōu)勢(shì)進(jìn)行分析。

關(guān)鍵詞:FPGA;硬件加速;深度學(xué)習(xí)

人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。對(duì)于人工智能應(yīng)用,特別是基于深度學(xué)習(xí)的應(yīng)用來(lái)說(shuō),很多應(yīng)用場(chǎng)景對(duì)實(shí)時(shí)性有著嚴(yán)格的要求,例如搜索、語(yǔ)音識(shí)別等,這些富文本應(yīng)用和模型對(duì)內(nèi)存帶寬有著更加嚴(yán)苛的需求。隨著新技術(shù)的不斷涌現(xiàn),F(xiàn)PGA的易用性和性能都將得到極大提升。從機(jī)器學(xué)習(xí),高性能計(jì)算,數(shù)據(jù)分析等領(lǐng)域,F(xiàn)PGA在更多樣化的應(yīng)用領(lǐng)域中已經(jīng)嶄露頭角。這些都與FPGA上嵌入了越來(lái)越多可用的on-chip存儲(chǔ)器有關(guān)。面對(duì)人工智能時(shí)代提出的更高要求,F(xiàn)PGA利用其特點(diǎn),在AI時(shí)代發(fā)揮其重要作用。[1]FPGA具有高速度、低功耗、穩(wěn)定、適用于流式的計(jì)算密集型任務(wù)和通信密集型任務(wù)、靈活而且開(kāi)發(fā)周期短等優(yōu)勢(shì),十分適合深度學(xué)習(xí)算法的實(shí)現(xiàn)。主要表現(xiàn)在以下幾點(diǎn):

1、FPGA內(nèi)部含有大量的計(jì)算單元,因此它的計(jì)算能力很強(qiáng),在進(jìn)行神經(jīng)網(wǎng)絡(luò)運(yùn)算的時(shí),F(xiàn)PGA的速度會(huì)比CPU快很多。

2、FPGA的最大特點(diǎn)是它的可編程性,能夠靈活地針對(duì)算法需求而修改電路。

3、在平均性能方面, FPGA可以根據(jù)特定的應(yīng)用去編程硬件,例如如果應(yīng)用里面的加法運(yùn)算非常多就可以把大量的邏輯資源去實(shí)現(xiàn)加法器。

4、使用FPGA對(duì)云計(jì)算的很多網(wǎng)絡(luò)功能進(jìn)行加速,能夠?qū)崿F(xiàn)更快速、穩(wěn)定、安全的云計(jì)算和網(wǎng)絡(luò)服務(wù)。

從整體上看,目前對(duì)于FPGA在深度學(xué)習(xí)中的應(yīng)用,研究方向主要集中在兩個(gè)方面:一個(gè)是和人工智能、機(jī)器學(xué)習(xí)相關(guān)的各個(gè)領(lǐng)域,比如FPGA微架構(gòu)、FPGA編程工具與編程語(yǔ)言,以及FPGA在AI的各種應(yīng)用等。另一個(gè)是FPGA的高層次綜合(High-Level Synthesis,HLS),也就是使用高層語(yǔ)言,如C++/OpenCL/Python等,對(duì)FPGA進(jìn)行有效的編程和使用。從宏觀上看,DNN(深度神經(jīng)網(wǎng)絡(luò))的硬件實(shí)現(xiàn)可以使用諸如CPU、GPU、FPGA或者ASIC等多種方式實(shí)現(xiàn)。CPU有著最高的靈活性,但性能不盡如人意;ASIC方案與之相反。而FPGA能夠在性能和靈活性之間達(dá)到良好的平衡。從微觀上看,F(xiàn)PGA方案本身對(duì)于DNN的實(shí)現(xiàn),既可以使用編寫底層RTL的方式,對(duì)特定的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行針對(duì)性的優(yōu)化;也可以采用高層次綜合(HLS)的方法,通過(guò)高層語(yǔ)言對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行快速描述。[2]但是,前者需要豐富的FPGA硬件設(shè)計(jì)與開(kāi)發(fā)經(jīng)驗(yàn),并伴隨著很長(zhǎng)的開(kāi)發(fā)周期;而后者由于開(kāi)發(fā)工具等限制,最終得到的硬件系統(tǒng)在性能上往往很難滿足設(shè)計(jì)要求。

對(duì)于幾種可實(shí)現(xiàn)深度學(xué)習(xí)算法的硬件分析如下:

(1)使用CPU:對(duì)于CPU來(lái)說(shuō),它所要求的編程量是比較少的并且有可遷移性的好處,但是串行處理的特點(diǎn)變成了它在深度學(xué)習(xí)領(lǐng)域的缺點(diǎn),而這個(gè)缺點(diǎn)是致命的。雖然這十幾年來(lái)CPU的性能得到了極大的提升,然而,這并沒(méi)有讓CPU再次走入深度學(xué)習(xí)研究者的視野。盡管在小數(shù)據(jù)集上CPU能有一定的計(jì)算能力表現(xiàn),多核使得它能夠并行處理,然而這對(duì)深度學(xué)習(xí)來(lái)說(shuō)還是遠(yuǎn)遠(yuǎn)不夠的。

(2)使用GPU:相比于CPU,GPU的核心數(shù)大大提高了,這也讓它有更強(qiáng)大的并行處理能力,它還有更加強(qiáng)大的控制數(shù)據(jù)流和儲(chǔ)存數(shù)據(jù)的能力。有研究表示CPU和GPU在處理目標(biāo)識(shí)別能力上, GPU的處理速度是CPU的3-10倍。

(3)使用ASIC:專用集成電路芯片(ASIC)由于其定制化的特點(diǎn),是一種比GPU更高效的方法。但是其定制化也決定了它的可遷移性低,一旦專用于一個(gè)設(shè)計(jì)好的系統(tǒng)中,要遷移到其它的系統(tǒng)是不可能的。并且,其造價(jià)高昂,生產(chǎn)周期長(zhǎng)。當(dāng)然,其優(yōu)越的性能還是能在一些領(lǐng)域勝任。例如在640×480pixel的圖像中識(shí)別速率能達(dá)到 60幀/秒。

(4)使用FPGA:FPGA在GPU和ASIC中取得了權(quán)衡,很好的兼顧了處理速度和控制能力。一方面,F(xiàn)PGA是可編程重構(gòu)的硬件,因此相比GPU有更強(qiáng)大的可調(diào)控能力;另一方面,與日增長(zhǎng)的門資源和內(nèi)存帶寬使得它有更大的設(shè)計(jì)空間。更方便的是,F(xiàn)PGA還省去了ASIC方案中所需要的流片過(guò)程。FPGA的一個(gè)缺點(diǎn)是其要求使用者能使用硬件描述語(yǔ)言對(duì)其進(jìn)行編程。 [3]

總之, GPU的優(yōu)勢(shì)在于大量數(shù)據(jù)的并行計(jì)算和浮點(diǎn)計(jì)算能力,但GPU功耗很高,是FPGA功耗的幾十倍甚至上百倍,相比之下,F(xiàn)PGA不僅具有數(shù)據(jù)并行的特點(diǎn),還具有流水線并行的特點(diǎn)。對(duì)于流式計(jì)算任務(wù),相比于GPU,F(xiàn)PGA在延遲方面有著天生的優(yōu)勢(shì)。對(duì)于通信密集型任務(wù),F(xiàn)PGA的優(yōu)勢(shì)就更大了,從吞吐量上講,F(xiàn)PGA的數(shù)據(jù)傳輸可以使用40Gbps甚至100Gbps的網(wǎng)線,任意大小的數(shù)據(jù)包都可以被線性處理。雖然GPU也能夠高性能處理數(shù)據(jù)包,但是GPU沒(méi)有網(wǎng)口,因此需要先把數(shù)據(jù)包由網(wǎng)卡收上來(lái),再去處理,這樣就限制了GPU的吞吐量。

深度學(xué)習(xí)算法的FPGA加速研究主要集中在一些局部的優(yōu)化技術(shù)上,如循環(huán)平鋪、轉(zhuǎn)換、數(shù)據(jù)優(yōu)化量化等,并主要對(duì)嵌入式FPGA進(jìn)行預(yù)測(cè)過(guò)程等局部的加速設(shè)計(jì)與實(shí)現(xiàn)。另一方面,隨著FPGA器件和云端部署等技術(shù)的發(fā)展,內(nèi)存帶寬已經(jīng)逐漸不再是DNN的算法瓶頸,取而代之的是單周期可以完成的乘加操作數(shù)量,這都將成為FPGA在人工智能以及深度學(xué)習(xí)領(lǐng)域中的發(fā)展趨勢(shì)。

參考文獻(xiàn):

[1]余凱,賈磊,陳雨強(qiáng),徐偉.深度學(xué)習(xí)的昨天、今天和明天[J].計(jì)算機(jī)研究與發(fā)展,2013,50(09):1799-1804

[2]張蔚敏,蔣阿芳,紀(jì)學(xué)毅.人工智能芯片產(chǎn)業(yè)現(xiàn)狀.《電信網(wǎng)技術(shù)》,2018年2月第2期.

[3]尹寶才,王文通,王立春.深度學(xué)習(xí)研究綜述[J].北京工業(yè)大學(xué)學(xué)報(bào),2015,41(01):48-59.

作者簡(jiǎn)介:周瑩(1987-),女,漢族,甘肅省天水市,碩士學(xué)歷,講師職稱。主要研究方向:FPGA應(yīng)用。

猜你喜歡
深度學(xué)習(xí)
從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
面向大數(shù)據(jù)遠(yuǎn)程開(kāi)放實(shí)驗(yàn)平臺(tái)構(gòu)建研究
基于自動(dòng)智能分類器的圖書館亂架圖書檢測(cè)
搭建深度學(xué)習(xí)的三級(jí)階梯
有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識(shí)別研究
利用網(wǎng)絡(luò)技術(shù)促進(jìn)學(xué)生深度學(xué)習(xí)的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場(chǎng)域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
主站蜘蛛池模板: 美女一级免费毛片| 国产又色又刺激高潮免费看| 国产激情国语对白普通话| 欧美伦理一区| 国产无码在线调教| 精品一區二區久久久久久久網站 | 免费国产好深啊好涨好硬视频| 亚洲欧洲国产成人综合不卡| 亚洲日韩AV无码精品| 国产成人欧美| 日韩高清欧美| 日韩精品成人网页视频在线 | 国产真实乱子伦精品视手机观看| 精品丝袜美腿国产一区| 538国产在线| 日韩区欧美区| 精品久久国产综合精麻豆| 黄色成年视频| 无码 在线 在线| 欧美在线网| 在线播放国产一区| 亚洲日韩在线满18点击进入| 国产精品美女自慰喷水| 免费人欧美成又黄又爽的视频| 18禁黄无遮挡免费动漫网站| 综合色亚洲| 国产h视频免费观看| 中文字幕波多野不卡一区| 亚洲第一中文字幕| 国产91丝袜在线播放动漫| 国产亚洲视频中文字幕视频 | 日本妇乱子伦视频| 全午夜免费一级毛片| 日韩高清在线观看不卡一区二区| 免费一级毛片完整版在线看| yjizz视频最新网站在线| 欧美日韩一区二区在线免费观看 | 永久免费无码成人网站| 在线国产你懂的| 国产三区二区| 高清国产在线| 亚洲国产欧美中日韩成人综合视频| 日本欧美中文字幕精品亚洲| 99久久精品国产精品亚洲| a毛片在线播放| 中文字幕首页系列人妻| 日本国产精品一区久久久| 亚洲欧洲自拍拍偷午夜色| 精品国产www| 日韩中文字幕免费在线观看| 亚洲欧美一区在线| 成人免费午夜视频| 久久这里只精品热免费99| 亚洲色图欧美一区| 亚洲一级毛片在线观| 69免费在线视频| 亚洲高清无码精品| 欧美成人精品高清在线下载| 国产97视频在线| 亚洲人成亚洲精品| 免费a在线观看播放| 草草线在成年免费视频2| 国产av一码二码三码无码| 91视频首页| 精品视频一区二区三区在线播| 欧美午夜性视频| 久久99精品久久久久纯品| 国产电话自拍伊人| 高清亚洲欧美在线看| 一级毛片免费不卡在线视频| 宅男噜噜噜66国产在线观看| av大片在线无码免费| 欧美一级高清片欧美国产欧美| 最新午夜男女福利片视频| 国产欧美日韩在线一区| 天天综合网站| 2020国产精品视频| 中文成人在线视频| 污污网站在线观看| 热这里只有精品国产热门精品| 国产精品私拍在线爆乳| 亚洲aaa视频|