李莉
“我相信未來世界的生產力和自由將來自大數據和智能。而深度學習的無人駕駛技術本身是一個較為年輕的領域,更新換代的速度非常快,對自己技術的實踐應用是一個機會,這也是我選擇無人駕駛方向的原因。”Momenta創始人兼CEO曹旭東說道。
Momenta是一家剛成立不久的專注做無人車大腦的公司,核心技術是基于深度學習的環境感知、高精地圖、駕駛決策算法,產品包括不同級別的自動駕駛方案,以及衍生出的大數據服務。
放棄學業、放棄高薪,一心只為AI
曹旭東2008年畢業于清華大學,本科專業是工程力學,但對統計學有著濃厚的興趣。
本科畢業后,他順利成為清華大學的直博生。在博一期間,他對人工智能尤為感興趣。“當時我一心扎入人工智能計算機相關的課程,哪怕要自己上課、看書、查文獻都樂在其中。”曹旭東回憶說。
對于人工智能,曹旭東可以用癡迷來形容,博一過后為在這一領域出國深造申請了退學,即使導師三次挽留也沒能改變他的主意。
離開清華后,曹旭東來到微軟亞洲研究院,因微軟的技術和學術氛圍留在了那里,如愿做了與人工智能相關的研究,他所研發的視覺識別技術被用在了Xbox、Bing、How-Old等知名產品中。
2014年底,深度學習還似煉丹術,其中的原理人們無法講清楚。在理論研究上,曹旭東已經有了自己的一套研究方法并發表了很多學術文章,但終不能令他滿意,他認為理論需要解決實際問。
為讓自己的研究成果能在實踐中得到驗證,曹旭東曾參加National Data Science Bowl(全美數據科學碗)比賽,與1000多支來自世界各地團隊的選手角逐,并拿到了全球第二的好成績。
2015年,曹旭東將創業目標鎖定在了無人駕駛領域。之后,基于對“個人和環境的交互能激發智能”的執著追求,曹旭東開始了對無人駕駛的技術路徑和商業路徑的探索,并創辦Momenta,專注做無人車的“大腦”。
如何解決無人駕駛最重要的安全問題?
據統計,全球人類司機駕駛1億公里可能發生致命事故一至三起。無人駕駛需要做到更安全,安全意味著低事故率。一個系統要實現低事故率,通常要做到兩點:一是發現問題,二是解決問題。
而解決這些問題則需要對無人車進行大規模數據收集和測試,這一方面需要海量的測試車輛,另一方面也意味著高昂的單車成本。
Momenta的做法是用兩種互補的解決方案降低無人駕駛的事故率:無人駕駛模擬,以及眾包數據收集和測試。
具體來講,無人駕駛模擬可以通過算法生成感知和決策數據,減少數據收集和測試車輛數量,降低研發成本。
但曹旭東坦言,無人駕駛模擬也存在不足。
第一,模擬生成的感知數據和真實的數據存在差異,實際中還是以真實數據為主,生成數據為輔。
第二,模擬的規則是人制定的,而很多失敗的場景恰恰是人思考的盲點,單純通過模擬并不能發現。
曹旭東告訴創業邦(微信搜索:ichuangyebang):“雖然模擬可以降低數據收集和測試車輛的數量,但是我們仍然需要收集真實數據,用大量的車做真實測試。”
在單車成本方面,其主要由三部分構成:設備成本,造車成本,運營成本。后兩者已經優化了上百年,很難再降低,但在設備成本方面,Momenta發揮算法優勢,可以通過多攝像頭等廉價設備實現無人駕駛。
“攝像頭是所有感知設備中信息(獲取)量最大的,需要人腦水平的強人工智能才能從間接視頻數據中提取出無人駕駛所需要的直接數據。”曹旭東稱。
要降低造車成本和運營成本,目前最好的辦法是通過眾包模式讓其他人承擔這部分成本。這種模式,其實代表性的公司已經有特斯拉這些大佬在嘗試,但遺憾的是他們需要造車、讀取和控制車輛行為,這需要很大的時間成本,顯著慢于算法的研究節奏。
“我們的想法是直接利用已有的運營車輛,避開造車、改車、控制車等過程,通過眾包獲得海量環境和行為數據,并構建高精度地圖,再通過數據驅動的方式學習無人駕駛決策。”曹旭東這樣告訴創業邦(微信搜索:ichuangyebang)。
高精度地圖方面,Momenta根據多張圖像存在的視差,利用點的對應關系將圖像中的2D點恢復到真實世界中的3D點。從基本原理出發,建立高精地圖,Momenta用不一樣的方式嘗試解決三個難題:
一、 圖像部分:檢測識別語義點。
不同于傳統的SLAM或者SFM算法所用的SIFT、ORB等人工設計的特征點,Momenta的方法是定義道路標線、標牌等地標上的點為語義點,通過深度學習和數據驅動的監督訓練得到模型,從而準確檢測和識別語義點,解決檢測不到、匹配錯誤的問題。
二、 幾何部分:通過眾包間接實現海量攝像頭測量效果。
不同車輛,不同時間,經過同一地標,即使光照視角不同,通過語義點模型把所有車輛拍攝到的同一語義點關聯起來,這相當于間接實現了多攝像頭測量的效果。
眾所周知,視覺測量中,攝像頭越多、視差覆蓋越全,測量精度就越高。Momenta經實驗驗證,隨著眾包車次的增加,真實3D點位置估計的準確性有量級上的提升。
三、 GPS部分:給每個語義點精確的GPS坐標。
Momenta的考量是:
1.讓高精地圖通用。GPS坐標是地圖的通用語言,給每個語義點賦予GPS坐標可方便他人使用。
2.消除累積誤差。單純使用幾何方法構建局部地圖會有累積誤差,結合GPS可以解決這個問題。
3.消除局部地圖歧義性。當局部地圖有重合或者語義點缺失的時候,確定局部地圖坐標系很麻煩,但全局GPS坐標系沒有這個問題。
任重而道遠
無人駕駛技術是一個非常龐大的知識體系,定位、感知、決策、控制是其亟待解決的四大問題,且在這四個方向上都有很多子問題。
對于初期的Momenta而言,團隊成員來自清華大學、麻省理工學院、微軟亞洲研究院等,有深厚的技術積累和很強的技術原創力,這將是其布局駕駛的技術和團隊優勢。
但創業邦(微信搜索:ichuangyebang)認為,如何緊跟時代潮流,盡快將不同級別的無人駕駛技術落地,以及對行業大數據的快速積累,將是Momenta的當務之急。而在瞬息萬變的人工智能領域,面對競爭對手和行業巨頭們,Momenta任重而道遠。