
自動駕駛公司Waabi日前宣布,它正在使用一種生成式人工智能模型來幫助預測車輛的運動軌跡。
這項名為Copilot4D的新系統使用激光雷達傳感器的大量數據進行訓練,這種傳感器利用光來感知與物體之間的距離。
如果你(以提示的方式)向模型輸入一種情況, 比如一個司機魯莽地駛入高速,它會預測周圍的車輛將如何運動,然后生成未來5~10秒的激光雷達示意圖,以及展示潛在的追尾事故。
目前公布的是Copilot4D的初始版本,但Waabi的首席執行官拉奎爾·烏爾塔孫表示,該公司在美國得克薩斯州的自動駕駛卡車測試車隊中部署了一個更先進、更可解釋的版本,幫助駕駛軟件做出決策。

雖然自動駕駛長期以來一直依賴機器學習來規劃路線和檢測物體,但一些公司和研究人員現在十分看好生成式人工智能,這種模型可以接收周圍環境數據并生成預測,或將有助于將自動駕駛帶到下一階段。
Waabi的競爭對手Wayve在2023年發布了一款類似的模型,該模型是根據其車輛收集的視頻進行訓練的。
Waabi的模型與DALL-E和Sora等圖像或視頻生成器的工作方式相似。它獲取激光雷達數據的點云,將汽車周圍環境的3D地圖可視化,并將其分解為塊,類似于圖像生成器將照片分解為像素的方式。
根據其訓練數據,Copilot4D會預測激光雷達的數據點將如何移動。不斷連續地這樣做,就可以讓它生成未來5~10秒的預測。
少數幾家自動駕駛公司將其策略描述為“人工智能優先”。對烏爾塔孫來說,這意味著設計一個從數據中學習的系統,而不是一個學習在特定情況下如何做出反應的系統。
這些公司相信,它們的方法可能需要更少的路測時間。2023年10月,在美國舊金山一輛巡航中的無人駕駛汽車發生拖拽行人的事故后,道路測試成為了一個熱門話題。
Waabi不同于其競爭對手,它為激光雷達而不是相機構建了一個生成式模型。
烏爾塔孫說:“如果你想實現4級自動駕駛,激光雷達是必須的。”她所說的4級自動駕駛是,汽車幾乎不需要人類介入就能安全行駛。
她說攝像頭能很好地顯示汽車所看到的東西,但它們不太擅長測量距離或了解汽車周圍的幾何(狀況)。
盡管Waabi的模型可以生成視頻,顯示汽車通過激光雷達傳感器看到的情況,但這些視頻不會在該公司用于構建和測試駕駛模型的駕駛模擬器中作為訓練數據。這是為了確保Copilot4D產生的任何幻覺不會被模擬器吸收并傳授。
美國斯坦福大學的博士生伯納德· 亞當· 蘭格建立并研究了類似的模型。他指出,底層技術并不新鮮,但這是他第一次看到生成式激光雷達模型脫離了實驗室的限制, 并擴大規模用于商業用途。
他說, 像這樣的模型通常有助于使任何自動駕駛汽車的“ 大腦” 能夠更快、更準確地推理。
他說:“規模化才是真正具有變革性的東西,希望這些模型可以用于下游任務。”例如,檢測物體和預測人或物下一步可能移動的位置。
Copilot4D只能預測短期的變化,而運動預測模型的性能會隨著預測時長的增加而變弱。該模型只需要想象5到10秒會發生什么,同時Waabi的基準測試是基于3秒的預測。
美國斯坦福大學汽車研究中心聯合主任克里斯·戈德斯表示,這一指標將是決定該模型在決策中有多大用途的關鍵。
他說: “ 如果5秒的預測是可靠的, 但10秒的預測幾乎不可用,那么它在許多真實路況下是不夠用的。”
新模型呼應了一個生成式人工智能世界熱議的問題: 是否將模型開源。開源Copilot4D將使難以訪問大型數據集的學術研究人員能夠深入地了解其制作過程,獨立評估其安全性,并有可能推動該領域的發展。
但Waabi的競爭對手也將因此獲益。目前,該公司已經發表了一篇論文,詳細介紹了模型的創建過程,但尚未發布代碼。烏爾塔孫也不確定他們是否會發布。
“我們希望學術界對自動駕駛的未來也有發言權。”她說,開源模型更值得信任。“但我們在開發技術時也需要小心一點,以免向競爭對手透露一切。” (綜合整理報道)(策劃/小文)