□本刊記者 黃耀鵬
AR世界的召喚
□本刊記者 黃耀鵬

AR技術兩大元素——延伸和交互,決定了它未來在汽車應用中能走多遠。但現在,AR還需要繼續坐冷板凳,直到新的計算平臺的誕生。
大多數新上市的車都配備了倒車影像和雷達。當你掛上倒擋的時候,艙內屏幕上顯示出車后影像。同時,影像也用黃色虛線標示出預測的輪軌跡。這兩條虛線就是AR(Augmented Reality增強現實)技術。視頻拼接的“全景影像”也算AR技術,但仍顯粗糙。車載裝備中的AR不但少得可憐,還很初級。貌似毫無進展的狀況已經持續了幾年時間,導致業界對AR在汽車上的應用缺乏信心。
過去兩年,AR在和VR(Virtual Reality虛擬現實)技術的爭斗中一直處于下風。谷歌眼鏡的“探索者”項目被取消后,AR技術一直缺乏重量級的產品。谷歌眼鏡不但沒有解決技術問題(電池續航、感官體驗糟糕、應用匱乏),還惹上一堆倫理麻煩(“眼鏡混蛋”的綽號打擊太大了)。谷歌不是第一次砍項目,他們對“止損”體會深刻,但這不是AR的錯。

雖然AR和VR都致力于用計算機產生某種虛擬影像,借助特定設備讓用戶感知,但是它們之間存在著嚴肅的區別。
VR的核心價值在于“沉浸”。在完全虛擬的空間中創造虛擬場景,追求逼真的視覺效果和互動性。而AR的核心在于“混合”。在真實的場景中構建虛擬元素,目的是讓人類獲得現實擴展能力,“看到”原本看不到的東西。
到目前為止,VR的核心技術是CG動畫和“追蹤”。后者包括三自由度的方向矢量和六自由度的位置參數(3維角運動、3維線運動)。而AR的核心技術則是計算機視覺和物體識別(特別重要的是生物識別)、區域識別。
語音識別和手勢識別技術,處于AR和VR交疊的模糊地帶。有意思的是,主機廠和零部件供應商,都對后兩者青睞有加。最新的量產車和幾乎所有的概念車型,都加上了這兩種技術。計算機對語音的識別度已經上升到90%以上,而漢語普通話的識別率則高達95%以上,在大語種中獨占鰲頭。手勢識別則發展得磕磕絆絆,主機廠商只好嚴格限制手勢的種類和使用空間范圍。
只要識別錯誤率沒有壓低到萬分之一以下,制造商都不敢讓用戶通過這兩種技術觸及車輛安全有關的指令。這導致了語音識別和手勢識別只能完成在車里打打醬油、播放段音樂、接個電話等小任務。
現階段,精明的制造商們普遍回避在汽車上安裝真正的AR設備。他們在概念車上的嘗試,遲遲沒有回報。顯然,AR技術的發展尚不支持大規模商業應用。
AR和VR兩者對計算機的挑戰不盡相同。VR的構造過程,頗像設計一款游戲。事實上,VR技術正是借助游戲推廣而風生水起。VR概念在半個世紀前就提出來,當然那時除了在電影和小說里演繹一番,并無真正實現手段。
自上世紀90年代以降,全視角的虛擬畫面就不再是難題,3D游戲引擎輕松實現。畫面的精美和顆粒度才是游戲公司追求的。戴著VR頭盔比早期端坐在屏幕前,看上去更有“科技感”,但兩者皆屬VR。
和幾乎所有的民用科技一樣,它脫胎于軍事發明?!疤摂M現實之父” 托馬斯·弗內斯三世(Thomas A.Furness III),從1966年為美國空軍飛行員開發了駕駛模擬設備。誕生于1986年的訓練頭盔“The SuperCockpit”達到當時的技術巔峰:3D地圖、紅外和雷達圖像、頭部位置跟蹤、手勢控制和語音控制、眼動追蹤技術。VR時代開始了。
而歷史短得多的AR則面臨更嚴肅的任務:采用虛擬現實對現實進行擴展,則需要研發新型的計算平臺。
AR的計算量是個技術巨坑。虛擬要素與現實世界的疊加,比完全的虛擬環境更具挑戰性。
簡而言之,就是要在對的位置顯示對的內容。依靠計算機視覺算法、深度傳感器、GPS等,計算機看懂了你所看到的環境,并提取關鍵像素點,將三維圖像轉化為二維數字點陣,但必須符合人類的視覺——透視原理。
谷歌眼鏡基于光學反射,混合了投影和反射式望遠鏡原理,實現了“3米外”的小畫面,但疊加算法經常出錯失焦,導致用戶頭暈。
微軟正在探討光柵衍射技術(分割畫面后多次反射),而英偉達(nvidia)則試圖實現“光場技術”——就是計算得到不同景深圖像,用投射方式,使虛擬畫面與真實環境在視覺上看起來一致。這和昆蟲的復眼成像原理近似。但該技術目前只具備“演示”能力。誠如所見,AR需要變態的計算量。
計算機重建場景、識別場景信息,并在合適的位置表達出預先設定的虛擬元素。如果還要支持交互,那么對運算量和運算結果還有更高的要求。如果AR要達到完全沉浸的效果,其運算量更加龐大。
而隨身AR設備的尺寸和電池容量又要求輕薄。我們需要低功耗、計算能力更強的新平臺。當前無論ARM架構,還是Inter M架構,都很難勝任。
如果硬要上馬怎么辦?將渲染的視場角度控制得很小,減少計算量。所以現階段只能減少支持的場景大小——這也是諸如戴著谷歌眼鏡可憐的家伙們,需要盯著斜上方一個模糊光點的原因。微軟HoloLens設備的視場角也好不到哪里去。
和谷歌眼鏡一樣,微軟大肆吹噓的HoloLens,同樣容易引起頭暈惡心的問題。客戶視覺系統和身體感知存在巨大矛盾的時候,就能體會到類似暈船暈車的感覺。
雖然谷歌投資的Magic Leap公司高管,曾嘲笑VR是“過時的技術”,但AR尚無像樣的產品,豈不更糟糕。
谷歌眼鏡項目尚未終結的時候,美國多個州立法將其在駕駛中禁用。至少有些立法者認為,現階段的AR技術在幫助駕駛者,尚不及引誘其分心的負面作用。
當你在操縱重達1.5噸的金屬盒子、每秒移動20米,你卻被“3米外”跳出的即時消息所吸引,或者需要盯著某物體拍照。谷歌有關“AR眼鏡有助于駕駛”的言論被大多數試戴者否定。
不過,寶馬聯合高通開發過一款AR眼鏡,供MINI駕駛使用。HUD的平視顯示功能,被遷移到眼鏡上。附送離車導航和送人上車功能,聊勝于無,此后沒有下文。

而影視作品當然秒得現實連渣都不剩?!兜姓?》中寶馬i8的智慧前風擋,就是典型的AR顯示器。像在《少數派報告》里一樣,演員用非接觸式的手勢,就可以操縱。前方路面即將出現的行人和障礙物,并對危險進行預判,對威脅大小排序。這可能代表了AR的未來,盡管我們暫時做不到。
AR不但需要延伸人的感官,還要延伸人的大腦。交互式汽車玻璃已經被發明,它實際上是一塊透明觸摸屏。不但可以記錄一路上的風景,還可以定位你想定位的目的地。不過,顯然駕駛員不可能直接操作。
以前曾有過透明A柱、透明C柱的概念,以電子影像覆蓋通常的駕駛著盲區,并將所有相鄰車道的狀況集中投射在面前(駕駛者需要區分景物的真實坐標)。而這種想法發展到極致,就是“透明汽車”。
用全息攝像頭將車外景象投射到特定位置,司機看向后方(不是真的朝后看)位置,感官上,汽車后座和后備廂等遮擋視線的實體都變成透明。人們好像浮空駕駛一樣。當前的傳感器技術已經能支撐這一構想,但計算單元仍然無法低成本地可靠運轉。
AR技術兩大元素——延伸和交互,決定了它未來在汽車應用中能走多遠。即便無人駕駛平臺,乘客們也不想被小小的窗口限制視野。但現在,AR還需要繼續坐冷板凳,直到新的計算平臺的誕生。