文/王剛
“大事化小,小事化了”,自動(dòng)駕駛也一樣。遵循“No Free Lunch”理論,實(shí)際應(yīng)用中的復(fù)雜場景可以通過分解為數(shù)個(gè)小場景,逐個(gè)分析、研究算法得到解決,結(jié)果往往比研究一種通用算法要好。
自動(dòng)駕駛是能給汽車、交通、物流乃至整個(gè)出行行業(yè)帶來巨大變革的變量,這項(xiàng)技術(shù)包含挑戰(zhàn),也包含機(jī)遇。今天,作為一個(gè)自動(dòng)駕駛的研發(fā)人員,借助文章同大家分享阿里巴巴達(dá)摩院自動(dòng)駕駛實(shí)驗(yàn)室對自動(dòng)駕駛技術(shù)研發(fā)的思路和思考。
關(guān)于自動(dòng)駕駛,大家討論的更多是載人自動(dòng)駕駛,阿里巴巴從第一天起就在關(guān)注物流自動(dòng)駕駛。

王剛 阿里巴巴達(dá)摩院自動(dòng)駕駛實(shí)驗(yàn)室負(fù)責(zé)人
關(guān)于物流的自動(dòng)駕駛,阿里巴巴專注于兩個(gè)場景,第一個(gè)場景是最后1-3公里的無人配送,也稱末端無人配送。這個(gè)場景有非常大的需求,快遞或者外賣員進(jìn)行最后1-3公里配送的時(shí)候效率非常低,因?yàn)闊o法實(shí)現(xiàn)集約化,就需要挨家挨戶去寄送,導(dǎo)致效率極大降低。
自動(dòng)駕駛是一個(gè)投入大,周期長的行業(yè),單純是由技術(shù)驅(qū)動(dòng)以及投資來驅(qū)動(dòng),存在很大風(fēng)險(xiǎn),所以阿里認(rèn)為必須在早期就要和商業(yè)進(jìn)行結(jié)合,和業(yè)務(wù)進(jìn)行結(jié)合,產(chǎn)生商業(yè)的結(jié)果,從而能夠驅(qū)動(dòng)自動(dòng)駕駛的良性發(fā)展。
幸運(yùn)的是,阿里巴巴擁有全世界最豐富的商業(yè)場景,其中也包括物流場景。阿里內(nèi)部有一條16字方針,即:需求牽引、技術(shù)驅(qū)動(dòng)、結(jié)合業(yè)務(wù)、小步快跑。讓商業(yè)和技術(shù)能夠形成良好的互動(dòng)。
雖然自動(dòng)駕駛有很多機(jī)會(huì),前景值得看好,但不可否認(rèn)的是,自動(dòng)駕駛現(xiàn)在還面臨著全方位的挑戰(zhàn)。我列了一個(gè)表,包括算法、計(jì)算硬件、傳感器、基礎(chǔ)設(shè)施。算法中除了控制是比較穩(wěn)定的,感知、定位、決策三個(gè)模塊都存在一些不足。在計(jì)算硬件上面,還沒有高性能、低成本,以及能夠滿足車規(guī)要求的計(jì)算芯片。傳感器也存在挑戰(zhàn),整體上挑戰(zhàn)非常多。
作為一名軟件開發(fā)人員,主要還是從軟件角度來講對自動(dòng)駕駛的思考。自動(dòng)駕駛是一個(gè)軟硬一體的系統(tǒng),同時(shí),我認(rèn)為它也是一個(gè)軟件決定硬件的系統(tǒng),那么很多硬件設(shè)備,包括芯片就必須為軟件定制,否則是很大的浪費(fèi)。
為什么現(xiàn)在還沒有一種非常好的算法,能夠?qū)崿F(xiàn)感知和決策?有人認(rèn)為整個(gè)自動(dòng)駕駛的算法要處理的問題太難了,而且當(dāng)今社會(huì)道路場景繁多、復(fù)雜,很難找到一個(gè)通用的算法處理所有的場景,就會(huì)導(dǎo)致車輛存在碰撞風(fēng)險(xiǎn)。
那么在開發(fā)過程中如何處理這個(gè)難題?在人工智能領(lǐng)域有一個(gè)經(jīng)典理論叫“No Free Lunch”理論。這個(gè)理論表達(dá)了一個(gè)觀點(diǎn):用通用算法處理所有問題,很難在所有的問題上都取得非常好的結(jié)果,相反的,開發(fā)者若是針對每個(gè)具體問題進(jìn)行算法的開發(fā)、優(yōu)化,就會(huì)在每個(gè)問題上得到比通用算法更好的結(jié)果。同理,在自動(dòng)駕駛領(lǐng)域,我們可以把復(fù)雜場景分解,變成多個(gè)小問題,去進(jìn)行針對性的算法研發(fā)。
為了使用“No Free Lunch”理論,第一步需要把交通場景進(jìn)行分類、細(xì)化、分解,把大問題分解為可以解決的小問題。場景分類的任務(wù)并不簡單,一個(gè)好的場景分類至少要滿足兩個(gè)條件,第一,場景必須是精細(xì)化的,一個(gè)非常粗密度的場景分類起不到降低問題難度的作用,基本上是無效的。第二,場景分類必須為算法服務(wù),和算法是進(jìn)行融合的,不是為了測試服務(wù),也不是為了管理服務(wù),是為了測試研發(fā)能夠有的放矢、各個(gè)擊破。
以變道切入的場景為例,阿里將其細(xì)分為25個(gè)場景,進(jìn)行針對性解決后,效果提高了20%,并帶來更高的研發(fā)效率以及更低的反應(yīng)延遲。

圖1 自動(dòng)駕駛技術(shù)的全方位挑戰(zhàn)

圖2 怎么樣處理多樣化場景?——No Free Lunch理論
計(jì)算換智能是一個(gè)非常美好的方向,為什么前面沒有做?原因有兩個(gè),第一個(gè)是設(shè)計(jì)理念上還沒有想到,第二個(gè)是AutoDrive平臺(tái)需要一個(gè)堅(jiān)實(shí)的工程支撐,如果想實(shí)現(xiàn)AutoDrive,必須完成從輸入信號(hào)到輸出結(jié)果的完整閉環(huán),才能夠讓機(jī)器自動(dòng)學(xué)習(xí)。
借助阿里巴巴的能力,我們做了三個(gè)事情:第一件事,將所有的路測數(shù)據(jù),全部放到阿里云上,只有云平臺(tái)才有足夠大的存儲(chǔ)能力和計(jì)算能力。第二件事,我們建立了從數(shù)據(jù)的上傳、標(biāo)注、模型訓(xùn)練、仿真以及評(píng)價(jià)整個(gè)數(shù)據(jù)的閉環(huán),從而從信號(hào)輸入到結(jié)果輸出都能夠在計(jì)算環(huán)境里去實(shí)現(xiàn)。第三件事,依托于阿里巴巴的資源,我們建立了強(qiáng)大的模型訓(xùn)練和仿真回歸的平臺(tái),能夠高效地對數(shù)據(jù)進(jìn)行處理。這三個(gè)方面的工程能力是AutoDrive平臺(tái)能夠使用的必要條件。
受到美軍作戰(zhàn)思路的啟發(fā),阿里巴巴做了一個(gè)叫自動(dòng)駕駛數(shù)據(jù)中臺(tái)的平臺(tái)。類似于為美軍作戰(zhàn)提供火力支援的飛機(jī)部隊(duì)和導(dǎo)彈部隊(duì)。中臺(tái)就像每個(gè)作戰(zhàn)團(tuán)隊(duì)后面強(qiáng)大的戰(zhàn)略資源。自動(dòng)駕駛數(shù)據(jù)中臺(tái)應(yīng)符合兩個(gè)條件:第一,實(shí)現(xiàn)資源的共享,所有的團(tuán)隊(duì),所有的開發(fā)人員,都能夠獲得相應(yīng)的資源。第二,資源必須非常強(qiáng)大,非常全面,是能夠解決問題的資源。
阿里巴巴的數(shù)據(jù)中臺(tái)能夠?qū)崿F(xiàn)場景庫的共享、所有數(shù)據(jù)的共享、系統(tǒng)工具的共享以及技術(shù)的共享。所以每個(gè)開發(fā)人員能夠很方便獲得已有的信息,并且平臺(tái)里也包括各種工具,包括訓(xùn)練工具,包括Bug的追溯工具等等,能夠讓工程師以更高的效率開發(fā)算法。
筆者認(rèn)為,要產(chǎn)生自動(dòng)駕駛研發(fā)的化學(xué)反應(yīng),必須有三個(gè)要素:第一個(gè)要素是場景,根據(jù)“No Free Lunch”理論,我們需要對這個(gè)場景進(jìn)行精細(xì)化的分類,把一個(gè)復(fù)雜交通場景的問題分解為數(shù)個(gè),或者是幾百個(gè)、幾千個(gè)更容易解的小問題。第二個(gè)是算法,當(dāng)我們有了這樣的分解之后,對算法可以進(jìn)行針對性的開發(fā),去各個(gè)擊破,去處理每個(gè)場景。第三個(gè)是云平臺(tái),這樣的算法開發(fā)在現(xiàn)有的模式下,對人工的要求非常高,所以我們提出要用計(jì)算換智能,找到自動(dòng)化的方式,提升研發(fā)效率和質(zhì)量。
最后還有一個(gè)問題,是計(jì)算能力,也就是芯片。最近幾年,人工智能芯片是一個(gè)關(guān)注度非常高的領(lǐng)域,但人們關(guān)注的更多是端上怎么進(jìn)行快速推理的芯片,對于訓(xùn)練芯片以及訓(xùn)練集群的關(guān)注有點(diǎn)少??赡芤恍┚W(wǎng)絡(luò)結(jié)構(gòu)的搜索需要五千個(gè)GPU,但現(xiàn)在的芯片能力很難達(dá)到這種程度。
從某種程度上說,計(jì)算芯片、訓(xùn)練芯片限制了我們對更高效訓(xùn)練方式的研發(fā),甚至說被發(fā)明,人們可能有很多更好的主意去訓(xùn)練算法,但因?yàn)橛?xùn)練芯片的限制,沒有辦法付諸于現(xiàn)實(shí),所以這方面應(yīng)該引起關(guān)注。