999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

生成式AI,給邊端埋下大彩蛋

2023-07-17 09:30:30張慧娟
計算機應用文摘 2023年13期
關鍵詞:設備模型

張慧娟

導語

隨著ChatGPT 的風靡,生成式AI 不斷刷新熱度,隨之而來的是進一步的探索和落地嘗試。其中一個趨勢是,云端的機遇正傳導至邊緣和端側,給這些市場埋下一顆大彩蛋。

混合AI 的機遇

高通高級副總裁Alex Katouzian 最近表示,高通正在從通信公司轉型為“智能邊緣計算”公司。他指出,“隨著連接設備和數據流量的加速增長,疊加數據中心成本攀升,(我們)不可能將所有內容都發送到云端。”

高通看到的機遇,其實也反映了AI 當下的兩大趨勢。

首先,不止云端,邊緣AI 也將成為必然趨勢。邊緣計算具有低時延、降低帶寬依賴、降低成本、數據可控、高可靠性等核心優勢,可與云端計算互補協同,是解決推理加速“最后一公里”的關鍵所在。

其次,“連接+計算”的能力越來越關鍵。

在云端市場中,英偉達正在實現從計算到連接能力的突破,隨著模型參數的急劇膨脹、GPU 要處理和傳輸的數據量飆升,英偉達通過升級NVLink 系統,賦予以太網AI 能力,使網絡連接技術邁上了新臺階。

在邊緣市場中,高通正在做類似的事情,不過與英偉達相反,它是從通信連接能力向算力進發。與英偉達在云端的計算能力相對應,高通在無線通信基帶、手機計算芯片市場,都占據領先地位。隨著“算力”成為AI 時代的寶貴資源,高通已經不滿足于通信市場,而是希望集“連接+計算能力”于一身,從邊緣側進攻AI 大市場。

那么,高通在邊緣AI 市場主打什么戰略? 目前看來,主要是云邊一體的混合AI 路徑。從高通已有的模型落地案例來看,其邊緣大模型相當于云端大模型的“感知器官”,從而實現AI 功能在終端設備的實現。

2023 年2 月,高通就利用AI 軟件棧執行了全棧的AI 優化,首次在Android 智能手機上部署了StableDiffusion。在這個場景中,用戶對著手機說話,自動語音識別AI 模型(如Whisper)可以在手機設備上將語音轉換為文本,然后發送到云端,再由云端運行大模型,回發文本答案。

根據高通最近發布的混合AI 白皮書,上述場景就是一個典型的混合AI 場景。并且,在未來的進階版本中,設備端AI 可以承擔更多處理任務,通過與調度程序協作,可以基于上下文提供更個性化的提示給云端。例如,用戶要求通過手機預約最愛的餐廳和朋友吃飯,對簡單查詢、較小的模型可在設備上運行而無需云交互;如果用戶需要復雜信息,則本地將需求轉化為提示發給云端大模型并返回詳細答案。

高通認為,混合AI 主要有以下優點。

(1)經濟性:降低云端推理成本、高效利用邊緣算力、降低AI 應用開發門檻。

(2)能耗低:邊緣設備可以通過較低能耗運行大模型,若考慮處理和數據傳輸等因素,能耗節約更加顯著。

(3)可靠性:邊緣AI 不受網絡狀況影響,運行更加穩定。

(4)隱私性:數據完全在本地推理,大幅降低泄密風險。

( 5)個性化:邊緣設備可以通過用戶真實生活中的行為、價值觀、痛點、需求、關注問題等信息,形成個人畫像,提供更為個性化服務。

預計到2023 年,邊緣AI 將覆蓋10 億參數以下的各類模型。

為什么要在邊、端部署生成式AI?

目前,端、邊的市場需求已經足夠豐富,小到錄音筆、手機,大到ADAS 輔助駕駛、自動駕駛……各類應用都在響應AI 趨勢進行升級。那么,生成式AI 的落地現實嗎? 有必要嗎? 在與一些業內人士的交流中,他們已經看到了足夠的理由和空間。

比如,將Transformer 大模型應用在視覺領域,它將具有一定的畫面語意理解能力,有望解決以往的一些痛點。AI 數據和模型的部署流程通常是:采集數據—標注—訓練,那么,一旦出現沒見過的場景,或是某場景下的數據沒有標注過,就會導致應用效果大打折扣或無法落地。

以河道垃圾監測的視覺應用為例:當河道上出現了一種新垃圾,是之前數據標注/ 訓練沒有的。如果是以往的AI 系統就會無法識別,必須重新采集。但采用無監督訓練的大模型之后,無論出現什么樣新類型的垃圾,系統都能自主推理和判斷,大幅提高了效率和應用效果。

基于類似上述提升做出判斷,愛芯元智聯合創始人、副總裁劉建偉認為,一直以來,AI 落地標準化場景效果較好,而在一些通用場景,除非增加針對性的投入,才能進一步提升應用效果,但這同時意味著更高的成本,這成為AI 加速應用落地的主要困難。

從大模型帶來的改變來看,它能夠降低邊際場景的AI 成本,因為它不需要對長尾場景做專門的、從頭到尾的適配,通過部署預訓練的大模型就能達到比較好的效果,這將使AI 在端側和邊緣側的應用再上一個臺階。

安謀科技產品總監楊磊認為,ChatGPT 等應用催生了對算力需求指數級的提升,而云端的需求早晚會傳導到端側,屆時,端側原有的CPU 能力是不足以負擔的。此外,應用的需求也會越來越豐富,包括成本、性能、功能特性等核心指標。“很難通過一種方案或一種架構去滿足所有,還是需要各類處理器的創新聯動,以更高的異構水平來滿足市場的訴求”,楊磊指出了異構加速平臺的發展機遇。

近年來,AI 已經廣泛應用于物聯網的各個垂直領域,包括零售、安全、能源和公共事業、供應鏈和資產管理等。而通過生成式AI 的發展,各類AIoT 應用在醞釀新一輪創新。

未來,智能終端接入大模型的方式將主要有:直接調用、大模型小型化后再調用,以及接入行業專屬大模型等。這些方式都將帶動邊緣和端側計算的成長,帶來使用體驗的提升,或將加速相關設備的更新迭代。以手機為例,當前正面臨消費者換機動力不足、總銷量下滑明顯的局面,而AI 大語言模型的小型化、輕量化,可望在終端應用中內嵌部署,帶來終端推理計算能力的提升,從而推動智能終端再升級。

低功耗設備積極擁抱大模型

如何在低功耗環境下,讓AI 更高效地運行———這是業界近幾年一直在探索的方向。不過,生成式AI展現的巨大潛力,正在加劇端側AI 市場的步伐,特別是已有成熟生態的動向值得關注。

幾周前,Google I/ O 大會重點強調將把生成式AI引入Android 生態系統,微軟Build 開發者大會也在談論將其引入Windows 11 操作系統。

Arm 最近發布2023 全面計算解決方案(TCS23)時,Arm 高級副總裁兼終端事業部總經理Chris Bergey談到,未來將是一個“混合(Hybrid)的環境”,即大型語言模型在云端運行,但考慮到智能手機或其他計算設備在本地運行AI 的隱私和能源效率等問題,用戶更愿意在設備上運行較小的模型。這意味著,大語言模型將塑造計算的未來,現有計算平臺需要進一步提升AI 方面的工作負載適配。Chris Bergey 認為,生成式AI 將給未來的智能手機生態系統帶來深遠影響。

這一趨勢已在Arm TCS23 中有所體現,主要包括:為滿足高性能、高能效、多線程用例的CPU 集群設計,針對大數據流量的三級緩存和電源設計等,這些重大升級也將助推生成式AI 在端側的部署。

不止高通、谷歌、Arm 對云端之外的市場表示重視,英特爾最近也分享了生成式AI 方面的動向和觀點。與之前“讓AI 無所不在”的方向一致,英特爾也強調了“讓生成式AI 無所不在”的觀點。

在搭載第12 代酷睿處理器的筆記本電腦上,英特爾展示了運行Stable Diffusion 的效果,不需要任何獨立顯卡,直接利用集成顯卡就可以在二三十秒內生成一張圖片。也就是說,不需要任何特殊設備,不需要訪問云端,就可以將任意模型和算法直接部署到本地筆記本電腦上。當然,如果用戶有Arc 獨立顯卡,那么速度可以更快,只要三四秒就可以生成一張圖片。

這個場景的獨特之處是:一方面在于基于異構計算來跑生成式AI;另一方面展示了低功耗PC 設備跑Stable Diffusion 大模型、實現文生圖等生成式AI 的潛力。

在生成式AI 的普及方面,英特爾強調了端到端的計算能力。英特爾院士、大數據技術全球首席技術官戴金權認為,“為了實現AI 無所不在,計算也要無所不在。在通用的、無所不在的,甚至是消費級的計算上提供AI 能力,就真的可以做到AI、包括生成式AI 的無所不在。”

生成式AI 對軟硬件架構的影響?

邊緣AI 已經成為業界共識,而生成式AI 正在給邊緣帶來更大機會,業界對邊緣的理解也將進一步拓展。

不同于由超大型數據中心、智算中心等形式部署的云端算力,邊緣算力的部署方式隨著智能設備、邊緣數據中心的出現變得多樣化。邊緣計算可以是離模型推理發生處最近的算力,也可以是幫助云端算力進行預推理的算力。

生成式AI 對邊緣、端側軟硬件架構有哪些影響? 戴金權認為,未來,一個很可能的場景就是生成式AI 被大量使用以提高工作效率,未來的工作流程進入自動化,這對軟硬件架構都帶來影響。

大模型當前基本以Transformer 架構作為基礎構件,它對內存的需求,包括內存帶寬、內存容量以及相應的計算需求,業界還在進行大量的研究,以便更好地進行加速。此外,對訓練、推理芯片的架構設計,以及對不同算法級別、不同場景的適配等,都會對AI 芯片甚至所有計算芯片帶來深遠影響。

未來,Transformer 等大模型可能會產生更大的尺寸,可能是今天的幾倍、幾十倍甚至更高,再結合多模態融合等需求,將會對軟件算法的設計,如低精度、低比特、壓縮、稀疏化,包括注意力機制設計等產生不同需求。未來,軟件算法設計的多樣化,是有助于滿足生成式AI 和大語言模型算力需求的重要組成部分。

寫在最后

從發展的眼光看,生成式AI 仍處于非常早期的階段, 在邊緣、端側的研究和落地探索也在初期。

除了邊緣、端側市場的主動擁抱,一些趨勢也在推動云邊端一體的生成式AI 布局。比如,AI 模型推理Token 費用較高,如果需要成熟商用,邊緣預處理將是必選項。用戶的多樣化需求進行本地預處理后,簡單需求就可以直接利用本地模型和算力推理,復雜需求通過邊緣算力預處理后,可以精簡成最少的Token 發送至云端,從而能夠以最低成本實現應用功能, 加速商業化。再如, 文中提到的Android,Windows,Arm 等已有成熟生態的積極部署,也將加快生成式AI 向邊緣和端側市場的滲透速度。未來,它們都將成為生成式AI 體系中的重要部分,成為AI 連接萬物的毛細血管。

猜你喜歡
設備模型
一半模型
諧響應分析在設備減振中的應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
基于VB6.0+Access2010開發的設備管理信息系統
基于MPU6050簡單控制設備
電子制作(2018年11期)2018-08-04 03:26:08
3D打印中的模型分割與打包
500kV輸變電設備運行維護探討
工業設計(2016年12期)2016-04-16 02:52:00
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
如何在設備采購中節省成本
主站蜘蛛池模板: 亚洲大尺码专区影院| 国产精品综合色区在线观看| 免费激情网站| 国产精品林美惠子在线播放| 国产日韩欧美精品区性色| 欧美有码在线观看| 青青青视频免费一区二区| 国产亚洲第一页| 亚洲欧美日韩成人高清在线一区| 欧美色伊人| 狠狠色丁香婷婷| 欧美一区福利| 丰满的熟女一区二区三区l| 日本影院一区| 在线观看免费AV网| 亚洲h视频在线| 天堂网亚洲系列亚洲系列| AV老司机AV天堂| 国产丝袜无码精品| 国产高清无码麻豆精品| 亚洲欧洲自拍拍偷午夜色无码| 看你懂的巨臀中文字幕一区二区 | 国产成人一区在线播放| 亚欧成人无码AV在线播放| 亚洲免费黄色网| 国产成人一区二区| 国产精品一线天| 国产精品美人久久久久久AV| 国产免费久久精品44| 91 九色视频丝袜| 人妻一区二区三区无码精品一区| 欧美亚洲一区二区三区导航 | 欧美国产日韩在线播放| 国产精品久久久久鬼色| 激情视频综合网| 亚洲综合极品香蕉久久网| 国产色婷婷| 2021国产精品自产拍在线观看| 日韩欧美网址| 成人福利一区二区视频在线| 日本午夜在线视频| 在线永久免费观看的毛片| 国产AV无码专区亚洲精品网站| 欧美成人一级| 狠狠做深爱婷婷久久一区| 国产69精品久久久久孕妇大杂乱 | 免费国产福利| 五月婷婷综合在线视频| 亚洲男人的天堂在线| 日韩精品久久久久久久电影蜜臀| 国产精品一区二区无码免费看片| 欧美日韩成人在线观看| 国产精品久久精品| 狂欢视频在线观看不卡| 国产精品一区不卡| 亚洲精品在线观看91| 精品国产一二三区| 亚洲精品综合一二三区在线| 色精品视频| 亚洲无码37.| 国产麻豆福利av在线播放| 国产精品男人的天堂| 毛片三级在线观看| 999精品在线视频| 97狠狠操| 亚洲男人的天堂久久精品| 2020国产免费久久精品99| 欧美日一级片| 国产亚洲精品自在久久不卡| 日韩一区精品视频一区二区| 99伊人精品| 91精品啪在线观看国产| 好吊妞欧美视频免费| 激情视频综合网| 亚洲精品无码不卡在线播放| 国产福利一区视频| 亚洲永久视频| 亚洲天堂网在线视频| 午夜少妇精品视频小电影| 国产成人高清亚洲一区久久| 青青操视频免费观看| 最近最新中文字幕在线第一页 |