丁海驁
如果有一天,上門送貨的不再是快遞小哥,而是一臺能夠識別人臉的機器人,你將作何感受?甚至又或者,送貨的是一臺航速每小時100公里的無人機,將重達200公斤的貨物放在你的天臺,你是否會覺得震撼?
這些應用場景有些已經成為現實,有些即將成為現實。
這是在9月底舉辦的GTC 全球巡回北京站,NVIDIA創始人兼首席執行官黃仁勛演講當中談到的一個正在開展的合作項目:NVIDIA與京東創新實驗室京東X合作的JDrone無人機和JDrover機器人——同樣利用NVIDIA Jetson 超級計算機模塊驅動的智能機器——號稱正在將人工智能引入物流與配送領域。
AI火到什么程度?有人開玩笑說:如果哪家公司的產品跟AI無關,那這個公司一定沒有前途,產品將很快被淘汰。
“AI 是就是計算的未來,可以讓我們重新思考各種服務、軟件、計算機和設備。在未來,我們可以制造各種各樣新的產品,而且我們會重新思考全世界現在已有的產品未來變成什么樣子。”黃仁勛在演講中強調,AI技術是繼互聯網和云計算以后,又一個最有可能改變人類現狀的IT技術應用。
NVIDIA的AI技術思路
作為AI從技術到應用的最主要技術推手,曾經是一家專業的圖形處理芯片公司的NVIDIA在最近幾年全面轉型主攻AI,在很短的時間內,成為對AI應用最具話語權的技術公司和最基礎技術的提供者。“NVIDIA致力于構建一個架構,用這個架構創造軟件平臺,而后全世界都可以在軟件平臺上去做創新。這一平臺適用于各種場景:大到超級計算機中心,小到PC、機器人等。”黃仁勛提到的NVIDIA架構實際上已經成為眾多AI應用的開發平臺。
GPU是NVIDIA整個AI基礎框架和平臺的基礎。
GPU這一概念是NVIDIA在1999年發布GeForce 256繪圖處理芯片時首先提出的概念—— graphics processing unit(圖形處理器)——在此之前,電腦中處理圖形圖像輸出的顯示芯片,通常很少被視為是一個獨立的運算單元。而GPU的提出,不僅使得計算機對圖形圖像的計算,減少了對CPU的依賴,而且還分擔了部分原本是由CPU所承擔的計算工作。這也使得GPU從一開始,就與CPU保持了一種既互相配合又常常被拿來做比較的微妙關系。

正是基于GPU和CPU的這種關系,2007年,NVIDIA正式推出了CUDA(Compute Unified Device Architecture,統一計算架構)的框架策略來完整定義GPU發展的基礎邏輯。
“什么是CUDA?其實就是CPU+GPU。”黃仁勛面對這樣的問題總是會首先強調,GPU不會替代CPU,而是攜手與CPU共同工作:GPU專注于執行高度線程化的并行處理任務(大規模計算任務),而更具通用屬性的CPU,則負責邏輯性強的事物處理和串行計算。用黃仁勛的話說:“CPU是通用型的,什么場景都可以適用;GPU的性能要比CPU超過10倍,50倍甚至百倍,所以通常用在解決一些專門的問題。”
事實上,CUDA也全面奠定了NVIDIA向AI應用的框架基礎。因為從概念上,NVIDIA所定義CUDA為GPU自身的發展規劃提供了更多空間:作為整合技術,CUDA是一個建立在GPU基礎之上的通用計算開發平臺,利用這種軟硬件結合的架構技術,程序開發者可以可以利用GPU作為C-編譯器的開發環境,直接對所進行的計算進行分配和管理,從而使GPU更能發揮作用的架構基礎。
基于CUDA,2013年,NVIDIA在GPU技術大會上發布了GPU新的架構Volta。“NVIDIAVolta的GPU,我用了三年的時間,研發經費達到了30億美元。”在此次GTC中國站的會議上,黃仁勛再次向中國聽眾展示了剛剛不久前剛剛在GTC 2017發布的NVIDIA Tesla V100——這款據稱是史上規模最龐大的GPU,核心面積達到了創紀錄的815平方毫米,內置了5120個CUDA單元,擁有超過210億個晶體管,是上代NVIDIA Pascal架構P100 GPU的1.37倍,性能是P100 GPU提升了 5 倍,同時可提供相當于 100 個 CPU 的深度學習性能。
在此次中國站的GTC上,黃仁勛在 GPU 技術大會上發表演講時宣布,阿里云、百度和騰訊正在將NVIDIA V100 GPU運用到其數據中心和云服務基礎架構中。“人工智能是當前時代最為重要的技術發展,具有造福社會的巨大潛力。隨著全球領先的云服務提供商相繼采用Volta GPU和NVIDIA的軟件來部署全球最佳的人工智能平臺,我們將看到來自醫藥、自動化交通、精密制造、乃至更多領域的驚人突破。”或許這正是NVIDIA對推動人工智能普及應用的價值所在。
AI,重要的是應用場景
如果說基于Volta GPU為NVIDIA的AI應用提供了足夠的硬件基礎,那么圍繞AI應用所開發的軟件系統,則進一步定義了NVIDIA在AI應用領域的應用場景——在更容易的范疇率先發揮AI的作用和價值,對整個技術領域是一種莫大的支持。
在中國站的GTC上,黃仁勛發布了TensorRT3 AI 推理軟件。
“一個GPU的架構是非常復雜的,它的能力非常強大。但是還是需要一些比較特殊的編譯器。”他尤其強調的一點是,NVIDIA TensorRT是全球首款可編程推理加速器,借助NVIDIA Tesla GPU加速器的可編程性能夠所有的框架、為諸如圖像和語音識別、自然語言處理、視覺搜索和個性化建議等人工智能服務提供超快速且高效的推理,速度可達到CPU 的40倍,而相較于基于CPU 的解決方案,成本僅為其十分之一。“搭配Tesla V100 GPU 加速器的TensorRT每秒能夠識別多達 5,700 張圖片,而如今所用的CPU則每秒僅能識別 140 張圖片。”
而這是人工智能走向應用的最基礎、最普遍和最規范化的應用模塊,是所有深入應用AI的最基礎功能。據NVIDIA公布的數據顯示,目前采用其推理平臺的用戶,包括亞馬遜、微軟、Facebook和谷歌、以及阿里巴巴、百度、科大訊飛、京東、騰訊等超過 1,200 家來自各行各業的公司。
不僅如此,為了向更深入推進AI的應用,此次除了最新的TensorRT 3,黃仁勛還發布了能夠實現 AI 加速的其他軟件:包括能夠大規模提供實時、低延遲視頻分析的 DeepStream SDK、以及能夠加快 HPC 和深度學習應用速度的加速計算軟件平臺 CUDA 的最新版本:CUDA 9。
具體到實際應用場景,智慧城市、自動駕駛、無人機器等都是NVIDIA目前和未來投資最多,也是最為關注的領域——這不是計劃,而是切切實實的投入。
黃仁勛宣布了幾個最近在中國的AI應用投入。
首先,基于NVIDIA人工智能智慧城市的Metropolis平臺,NVIDIA在中國新增了兩個重量級用戶:阿里巴巴與華為。“我們不要總是認為國外的公司更領先,實際上到了現在的階段,我認為中國的公司更具有創新能力和實踐的動力。”作為5月份首次發布的Metropolis,是一個包含各種工具和技術從終端到云端的視頻分析平臺,以構建覆蓋交通與停車管理、執法、城市服務等各個方面更智能、更快速的AI賦能應用。這次發布的新版本,增加了NVIDIA DeepStream SDK (軟件開發套件)——開發者可以使用DeepStream來實時處理、理解并歸類視頻幀,以滿足最嚴苛的吞吐與延遲的需求。因此對于華為和阿里巴巴來說,他們針對深圳警用的視頻監控和阿里云杭州“城市大腦”,都具有了近一步實踐的更大空間。
其次,本文最初提到的與京東的合作,則將關注的焦點放在人工智能物流和配送領域:利用基于NVIDIA Jetson 超級計算機模塊驅動的智能機器人,可以通過識別人臉,行人,交通燈,標志等來輕松地穿過擁擠的街道,將包裹配送給從京東網上商城購買書籍、零食和電子產品等商品的顧客。隨著更多的數據收集和算法優化,京東X預計將在中國更復雜的場景中部署無人車。
第三,是無人汽車領域。不久前,NVIDIA GPU Ventures參投了由中國風險投資公司啟明創投領投的中國初創公司景馳科技投資項目。該項目總計投資5200萬美元。而景馳科技正是使用NVIDIA GPU和NVIDIA DRIVE PX 2來開發自動駕駛汽車。“交通行業是全世界最大的一個行業之一,它在全世界城市的設計、醫院、保險、生命的價值等都會有影響。NVIDIA DRIVE自動駕駛平臺會為交通行業帶來革命性改變,我們創造NVIDIA DRIVE平臺,并開放這個平臺,那么全世界的公司——不管是大的車企、是出租車公司,還是汽車共享平臺、快遞公司,或者145家初創企業,都可以用NVIDIA DRIVE平臺展開創新。”事實上,在過去一年里,NVIDIA已經在全球5個國家投資了10家公司,足見NVIDIA對這一領域的看好。
寫在最后
事實上人工智能到底能在多大程度上真正影響未來,一方面取決于相關的技術(包含硬件架構和軟件系統)發展的進度,另外一方面,很大程度上取決于首先從哪些行業入手,并獲得更直觀的效益——這方面NVIDIA不僅具有技術的話語權,而且也由于其掌握足夠的主動權,因此也對具體行業應用AI具有相當的推動作用。這也許就使得AI與NVIDIA之間存在相對比較特殊、彼此推動的微妙關系。這一點,從GTC會場火爆的場面可以有所感受,也能夠從此次黃仁勛幾個重要的發布當中體會出。
AI,絕對是所有人都想到達的地方,無論軌跡如何曲折,都必須實踐。