999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

新的人工智能硬件加速器現爆炸式增長

2018-11-09 10:20:14JamesKobielusCharles
計算機世界 2018年32期
關鍵詞:人工智能

James Kobielus Charles

專業硬件平臺是每一等級人工智能、機器學習和深度學習的未來,也是我們今后生活的云到邊緣世界中每一項任務的未來。

人工智能的快速發展促進了機器學習和深度學習等新一類硬件加速器的爆炸式發展。

有人將其稱為“寒武紀爆炸”,恰當地比喻了當前狂熱的創新。寒武紀指的是大約5億年前的一段時期,基本上每一種生物體都首次出現了“身體結構”。從那時起,這些生物——包括我們自己在內,開始四處遷徙,從而徹底改變了地球上的生態。

創新的人工智能硬件加速器架構的范圍在不斷擴展。雖然你可能認為圖形處理單元(GPU)是主要的人工智能硬件架構,但這遠非事實。在過去幾年中,初創公司和成熟的芯片供應商都推出了令人印象深刻的新一代新硬件架構,適用于機器學習、深度學習、自然語言處理和其他人工智能工作負載。

除了新一代GPU之外,在這些新的人工智能優化芯片組架構中,最主要的是神經網絡處理單元(NNPU)、現場可編程門陣列(FPGA)、專用集成電路(ASIC)和各種相關的方法,這些方法都被統稱為神經突觸體系結構。正如一些業界專家所指出的,今天的人工智能市場并沒有像英特爾的X86 CPU(曾經主宰了桌面計算領域)那樣只存在一種硬件架構。這是因為這些新的人工智能加速器芯片架構適應了迅速發展的云到邊緣生態系統(如計算機視覺)中的各類特殊用途。

人工智能加速器芯片的發展

要想了解人工智能加速器芯片的快速發展,最好是關注一下本文介紹的市場機遇和挑戰。

人工智能等級

要了解人工智能加速器是怎樣發展的,看一看邊緣,在那里,新的硬件平臺正在被優化,以便讓移動、嵌入式和物聯網(IoT)設備具有更大的自主性。除了智能手機嵌入式人工智能處理器的快速發展之外,在這方面最值得注意的是人工智能機器人創新,涉及到從自動駕駛汽車到無人機、智能設備和工業物聯網的方方面面。

在這方面最值得注意的進展之一是英偉達(Nvidia)進一步增強了其Jetson Xavier AI系列芯片的人工智能片上系統(SOC)。英偉達已經發布了Isaac軟件開發工具包,以幫助構建運行在其專用機器人硬件中的機器人算法。

反映了智能機器人的復雜性,Jetson Xavier芯片由6個處理器單元組成,包括一個512核的Nvidia Volta張量內核GPU、一個8核的Carmel Arm64 CPU、一個雙核的Nvidia深度學習加速器,以及圖像、視覺和視頻處理器。這些使其能夠處理幾十種算法來幫助機器人自主的感知環境,有效地進行響應,并與人類工程師一起安全地工作。

人工智能任務

人工智能加速器開始滲透到分布式云到邊緣、高性能計算、超融合服務器和云存儲架構的每一等級中。一股新的硬件創新浪潮正源源不斷地涌向所有這些領域,以支持更快速、高效和準確的人工智能處理。

人工智能硬件創新正在走向市場,以加速這些不同應用環境中具體的數據驅動任務。市場上無數的人工智能芯片組架構反映了機器學習、深度學習、自然語言處理和其他人工智能工作負載的多樣性——從需要大量存儲的訓練,到計算密集型推斷,而且涉及不同程度的設備自主性和人在環路交互性。

為能夠讓人工智能芯片組適用于如此眾多的工作負載,供應商在其系列產品中甚至在特定的嵌入式人工智能部署中混合了各種各樣的技術,例如驅動智能機器人和移動應用的SOC。

作為一個例子,英特爾的Xeon Phi CPU架構已被用來加速人工智能任務。但英特爾認識到,如果沒有專門的人工智能加速器芯片,它將無法與Nvidia Volta(在GPU中)以及大量生產NNPU和其他人工智能芯片的廠商相競爭。因此,英特爾現在有一個產品部門正在開發一款新GPU,并將在未來兩年發布該產品。

同時,它繼續看好人工智能優化芯片組的幾類架構:神經網絡處理器(Nervana)、FPGA(Altera)、計算機視覺ASIC(Movidius)和自動駕駛汽車ASIC(MobilEye)。它還計劃為解決下一代人工智能挑戰構建自學習神經形態和量子計算芯片。

人工智能的市場承受能力

每一人工智能加速硬件創新必須是可生存的,必須能夠滿足相關運行和經濟承受能力指標。

在運行指標中,每一人工智能芯片組必須在外形封裝、能效、散熱和電磁輻射以及堅固性方面符合相關標準。

在經濟指標中,它必須在性能和總體擁有成本方面具有競爭力,以滿足其設計部署的等級和任務要求。比較行業基本標準將成為決定人工智能加速器技術是否具有在激烈競爭的市場中生存下去的性價比指標的關鍵因素。

在一個正在朝著工作負載優化人工智能架構發展的行業中,用戶將在每一等級中采用最快、最具可擴展性、最具功效和成本最低的硬件、軟件和云平臺來運行自己的人工智能任務,包括開發、訓練、運行和推斷等。

人工智能加速器ASIC的多樣性

人工智能加速器硬件架構并非單一化。它們是如此的多樣化,發展的如此之快,以至于人們很難跟上這一市場不斷創新的步伐。

除了Nvidia和Intel-ASIC等核心人工智能芯片組制造商之外,平臺專用人工智能工作負載比比皆是。我們可以在最近的一些新聞中看到這種趨勢:

● 微軟正在為其HoloLens增強現實頭盔準備一款人工智能芯片。

● 谷歌有一款特殊的NNPU——張量處理單元,可用于谷歌云平臺上的人工智能應用程序。

● 據報道,亞馬遜正在為其Alexa家庭助手設計一款人工智能芯片。

● 蘋果公司正在開發一款人工智能處理器,用于Siri和FaceID。

● 特斯拉正在為其自動駕駛電動汽車開發一款人工智能處理器。

人工智能加速器基準框架開始出現

人工智能加速器市場中的跨供應商合作伙伴關系變得越來越復雜和重疊。例如,可以看看中國科技巨頭百度是怎樣分別與英特爾和英偉達合作的。除了推出自己的NNPU芯片進行自然語言處理、圖像識別和自主駕駛之外,百度還與英特爾合作,在其公共云中實現FPGA支持的人工智能工作負載加速,還有用于Xeon CPU的人工智能框架,配有人工智能的自動駕駛汽車平臺,具有計算機視覺功能的零售相機,并采用了英特爾的nGraph硬件無關深度神經網絡編譯器。這些發布緊隨英偉達類似的公告,例如,將Volta GPU引入到百度云計劃中,對百度Volta的PaddlePaddle AI開發框架進行調整,以及向中國消費市場推出英偉達支持的人工智能等。

面對如此令人眼花繚亂的人工智能加速器硬件選擇和組合——無論是云還是在專門的SoC中,人們很難對其進行梳理。如果沒有靈活的基準測試框架,要想針對任何任務找出人工智能加速器硬件對總體性能的貢獻是非常棘手的。

幸運的是,人工智能行業正在開發開放的、透明的、與供應商無關的框架,以便在不同的工作負載中評估不同硬件/軟件堆棧的相對性能。

MLPerf

例如,MLPerf開源基準測試部門正在開發一個標準套件,用于對機器學習軟件框架、硬件加速器和云平臺的性能進行基準測試。MLPerf可以在GitHub上使用,目前是測試版,為當今人工智能部署中占主導地位的一些人工智能任務提供了參考實現。它涉及到對具體算法(例如,Resnet-50 v1)采用具體數據集(例如ImageNet)執行具體的人工智能任務(例如圖像分類)進行基準測試。核心基準測試集中于特定的硬件/軟件部署,比如在Ubuntu 16.04、Nvidia Docker和CPython 2上運行的圖像分類訓練工作,這些平臺由16個CPU芯片、一個Nvidia P100 Volta GPU和600G的本地硬盤組成。

MLPerf框架非常靈活,因此可以想象基于GPU的圖像分類訓練能夠針對在不同硬件加速器(例如最近宣布的百度昆侖FPGA)上運行的相同任務進行基準測試——但是要在基本相同的軟件/硬件堆棧中進行。

其他人工智能行業基準測試方案還允許在可替代的人工智能加速器芯片上進行比較性能評估,以及采用其他硬件和軟件組件在部署中使用相同的模型對相同的訓練或者運行數據來處理相同的任務。這些其他基準測試方案包括DawnBench、ReQuest、會話處理性能委員會的人工智能工作組和CEAN2D2。它們都足夠靈活,可以應用于任何部署等級中運行的任何人工智能負載任務,并且經濟上可行。

EEMBC機器學習基準測試套件

反映了人工智能工作負載向邊緣的移動,一些人工智能基準測試方案完全集中于測量部署到這一等級的硬件/軟件堆棧的性能。例如,行業聯盟EEMBC最近開始了一項新工作,定義一個用于機器學習的基準測試套件,這些機器學習運行在功率受限的邊緣設備的優化芯片組中。由英特爾主持,EEMBC的機器學習基準測試套件部門將使用來自虛擬助手、智能手機、物聯網設備、智能揚聲器、物聯網網關和其他嵌入式/邊緣系統的實際機器學習工作負載,以便確定用于加速機器學習推斷工作的處理器內核的性能和功效。

EMEBC機器學習基準測試將測量低、中、高復雜度的推斷任務的推斷性能、神經網絡加速時間,以及功效。它與機器學習前端框架、后端運行時環境和硬件加速器目標無關。該部門正在進行概念驗證,并計劃在2019年6月之前發布其第一版基準測試套件,以滿足一系列神經網絡架構以及基于邊緣的推斷應用情形需求。

EEMBC Adasmark基準測試框架

針對邊緣層和任務較窄范圍的應用,EEMBC的Adasmark基準測試框架重點是支持采用了人工智能的智能車輛。與其機器學習基準測試工作不同,EEMBC正在為高級輔助駕駛系統中嵌入的人工智能芯片開發一種單獨的性能測量框架。

該套件有助于測量在多設備、多芯片、多應用智能車輛平臺中執行的人工智能推斷任務的性能。它對與高度并行的智能汽車應用相關的實際推斷工作負載進行基準測試,例如,計算機視覺、自動駕駛、汽車環視、圖像識別和移動增強現實等。它測量復雜智能汽車邊緣架構的推斷性能,通常包括多個專用CPU、GPU和其他硬件加速器芯片組,它們在共同的底盤上執行不同的任務。

新興的人工智能應用場景將需要更多的專業芯片

幾乎可以肯定的是,會出現其他的專業人工智能邊緣應用場景,它們需要自己的專用芯片、SoC、硬件平臺和基準測試方法。人工智能芯片組的下一巨大增長領域可能是在用于加密貨幣挖礦的加速邊緣節點上,這種應用場景與人工智能和游戲一樣,需要大量的Nvidia GPU。

一個專門從事這一小眾市場的供應商是DeepBrain Chain,該公司最近宣布了一個可以在分布式配置中部署的計算平臺,幫助實現人工智能工作負載的高性能處理,以及挖掘加密貨幣令牌。挖礦站有兩個、四個和八個GPU配置,還有獨立工作站和128個GPU定制的人工智能高性能計算集群。

不久之后,我們幾乎肯定能夠看到專門用于分布式加密貨幣挖礦的新一代人工智能ASIC。

專業硬件平臺是每一等級人工智能的未來,也是我們今后生活的云到邊緣世界中每一項任務的未來。

猜你喜歡
人工智能
我校新增“人工智能”本科專業
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
基于人工智能的電力系統自動化控制
人工智能,來了
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
學與玩(2017年12期)2017-02-16 06:51:12
主站蜘蛛池模板: 99久久国产自偷自偷免费一区| 91在线中文| 亚洲娇小与黑人巨大交| 成人av专区精品无码国产| 欧美国产在线一区| 女人av社区男人的天堂| 丰满人妻中出白浆| 欧美啪啪视频免码| 久久久久青草线综合超碰| 天天综合色网| 欧美一区二区福利视频| 久久婷婷色综合老司机| 99re热精品视频国产免费| 一级毛片无毒不卡直接观看| 国产91小视频| 国产精品成人AⅤ在线一二三四| 午夜天堂视频| 亚洲高清资源| 国产在线观看一区精品| 亚洲区一区| 国产哺乳奶水91在线播放| 日韩高清欧美| 九九免费观看全部免费视频| 欧洲在线免费视频| 国产91丝袜在线播放动漫 | a级毛片免费网站| 人妻无码中文字幕第一区| 啪啪啪亚洲无码| 老司国产精品视频91| 久久久久免费精品国产| 美女被操91视频| 久久激情影院| 无码日韩人妻精品久久蜜桃| 最新痴汉在线无码AV| 99re免费视频| 亚洲国产欧洲精品路线久久| 97精品国产高清久久久久蜜芽| 亚洲人成亚洲精品| 精品人妻一区二区三区蜜桃AⅤ| 中文字幕日韩久久综合影院| 欧洲亚洲欧美国产日本高清| 欧美在线视频a| 欧美自拍另类欧美综合图区| 欧美a√在线| 99热这里只有精品在线观看| 亚洲国产精品日韩欧美一区| 日本www色视频| 国产91成人| 国产特级毛片| 国产草草影院18成年视频| 国产成+人+综合+亚洲欧美| 亚洲人成影院在线观看| 国产亚洲精品无码专| 国产91精品最新在线播放| 亚洲AV无码久久天堂| 国产99精品久久| 国产三级a| a毛片免费观看| 欧美人与动牲交a欧美精品| 色播五月婷婷| 国产交换配偶在线视频| 无码中文字幕精品推荐| 国产毛片片精品天天看视频| 亚洲性色永久网址| 亚洲精品在线影院| 国产欧美精品午夜在线播放| 99久视频| 一区二区理伦视频| 又爽又大又黄a级毛片在线视频| 99青青青精品视频在线| 国产亚洲精久久久久久久91| 一个色综合久久| 亚洲an第二区国产精品| 久久窝窝国产精品午夜看片| 狠狠亚洲五月天| 日本尹人综合香蕉在线观看 | 黄色网址免费在线| 久草青青在线视频| 免费观看国产小粉嫩喷水| 夜夜高潮夜夜爽国产伦精品| 国产精品黑色丝袜的老师| 五月天婷婷网亚洲综合在线|