王姍姍
波士頓動力的四足機器人Sport和兩足機器人Atlas
2013年,Google一口氣收購了8家機器人創業公司,后面幾年中命途多舛的波士頓動力(Boston Dynamics)是其中之一。同年,亞馬遜也在用名為Kiva的倉庫機器人搬運包裹。
2014年年初,《經濟學人》把人類與機器人和諧共處的圖景搬上了封面:一個市郊公園里,機器狗在草地上玩耍;一臺履帶式機器人蹲在老人輪椅前喂飯;還有一位和成年人身高差不多的機器人,任由它的“食指”被一位兩歲左右的孩子牽著散步;天空中的無人機則忙著四處送貨。《經濟學人》判斷,芯片、數字傳感器和寬帶通訊能力將幫助機器人實現“質的突破”。
波士頓動力的四足機器人Sport和兩足機器人Atlas
看看波士頓動力隨后幾年的命運,我們知道,上述判斷下得過早—更強的計算能力、更豐富的數據維度、更快的傳輸速度,當然有助于機器人算得更快,但要實現“質的突破”,機器人還需要一場算法革命:工程師決定機器人如何行動,讓位于機器人自主決策。
2019年,位于瑞士蘇黎世的機器人公司ANYbotics推出一臺機器人,名為ANYmal,發音與animal(動物)相同,寓意它是一臺更接近動物的自主機器人,而非完全聽命于程序的提線木偶。
與之前所有機器人的研發理念(包括曾經名聲大噪的波士頓動力)不同,ANYmal幾乎不依賴工程師灌輸的“知識”。剛被制造出來時,它不會站立,也不會走路,和剛出生的小狗沒什么不同。但依靠內置的深度強化學習算法(deep r einforcement learning,簡稱DR L,將強化學習與深度神經網絡結合),經過摔倒后就嘗試站起來的試錯訓練,1500代之后,這只機器狗就可以從摔倒時的側臥狀態翻身站起來。
為加快ANYmal的學習速度,ANYbotics同時在電腦上構建了模擬器,讓2000多只二維的機器狗一起學習走路、應對各種刁難,將這些二維機器狗學習到的運動策略轉交給ANYmal,它也能迅速應用到現實世界中。
聽起來和人工智能很像?ANYmal就是人工智能—準確說是深度學習(通過建構深度神經網絡實現的學習)機器,只不過被賦予了物理身體。二者的結合革新了機器人行業。
《經濟學人》2014年年初刊登封面文章《機器人崛起》(Rise of the Robots》。
2020年10月,這只名為ANYmal的機器狗登上了《Science》雜志子刊—《Science Robotics》的封面,再次激發人們對于機器人的興趣,以及對機器人新范式—將深度學習與傳統機器人結合—的討 論。
而在差不多時間,波士頓動力的命運就沒那么好了,它離開前東家Google已有3年,在新主人軟銀手中的狀態則是又一次待價而沽。2021年7月,它被再次轉手,成為現代汽車的子公司。
從外在表現看,波士頓動力在2020年推出的首款零售四足機器人Spot并不遜色于ANYmal,這只黃色的機器狗能夠慢走、小跑、跳躍、飛奔。波士頓動力另一款兩足機器人Atlas更是多次驚艷大眾。2017年10月,Atlas就成功表演了空翻技能;2018年5月,它學會了室外奔跑;今年8月,在一則長達9 0秒的視頻中,Atlas成功跑完了復雜的障礙賽。
然而無論Spot和Atlas的運動能力多么出眾,它們都難以像ANYmal那樣稱得上“智能”。波士頓動力的機器人的動作多數是人類手動編寫的,如果它要決定下一步如何行走,首先得查詢一個步態行為庫。
以Altas執行的跑酷行為來舉例,波士頓動力的研發團隊為機器人提供了一張地圖,其中包括研發人員希望它到達的地方、路上存在的障礙以及沿途面對障礙它應該做出的動作。Atlas事先“知道”要去尋找需要跳的障礙盒子,如果盒子向側面移動0.5米,Atlas能通過實時感知數據重新規劃跳躍動作的執行時間。但如果盒子被移動得太遠,Atlas就會因為找不到它而停下來。
今年8月特斯拉AI日上發布的人形機器人Tesla Bot。
自主學習機器人ANYmal。
換句話說,At las在跑酷中所做的每個動作,都是一個事先編輯好的行為庫,它擁有一定的可選擇性,但不能窮盡所有變化。
波士頓動力代表了機器人行業在ANYmal誕生之前的經典范式。不必驚訝,那些有著“工業機器人”之稱、在工廠流水線上擰螺絲的機械手臂,以及在電商倉庫中來來回回揀貨的物流機器人,還有家里的掃地機器人……這些所謂“機器人”實現智能的方式都是如此,它們并不需要多聰明,更不需要自作主張,就能完成封閉空間內從A點到B點的移動。
波士頓動力也許代表著人類運用控制論操控機器實現自動化的巔峰,但它并不通向未來。
控制?還是自主學習?兩種完全不同的技術路徑,將機器人行業在時間軸上劃為新舊兩個時代,也掀起了新一輪的機器人投資熱潮。
2020年,國內機器人企業融資數為115起,這個數字很快就會被超越。僅2021年前4個月,同類投資項目已經達到67起,其中單筆融資金額達到億元的項目超過30個。從分類上看,熱門領域雖然仍屬于工業、物流、醫療、家用等傳統市場,但相較于上一輪投資熱潮,新一輪投資開始關注自主學習的技術路線,并更多流入物流和家用等與移動相關的機器人。騰訊、美團、字節跳動等互聯網公司押注的主要都是這類產品。
今年以來,騰訊Robotics X實驗室推出自稱越障能力更強的輪腿式機器人Ollie;小米和小鵬汽車兩家公司炮制出了家庭陪伴場景下的機器狗產品,它們都與波士頓動力的Spot相似,在技術路徑上并不先進,但這只是開端。
作為都擁有造車業務的公司,小米和小鵬的最終對標對象都是特斯拉。在今年8月的特斯拉A I日之后,馬斯克已經將特斯拉定位為“全球最大的機器人公司”。
馬斯克對于機器人的構想正在被更多人接受,那就是—未來所有的機器,都將是機器人。
如果此時你還在糾結人工智能、自動駕駛、機器人之間的差別,甚至聊天機器人算不算機器人的問題,那你不必糾結了,它們都為實現機器智能而分頭尋找過出路,但正在融合。馬斯克已經示范了如何從制造傳統機器入手,最終制造出自主決策機器的路徑。如外界所知,他從輔助自動駕駛開始,一開始僅將汽車的視覺問題即感知層面的問題交給深度學習接管;在決策層,由于深度學習的決策缺乏可解釋性,在訓練初期更缺乏安全性,所以特斯拉在駕駛決策中仍然采用傳統的規劃法,通過手動輸入一些規則并創建一個有限狀態機—與波士頓動力差不多,讓汽車在封閉道路上實現相對可控的自動駕駛。
機器人簡史
資料來源:根據公開資料整理
但馬斯克并沒有放棄完全自動駕駛,相反,他通過讓系統跟人類駕駛員學習從而不斷逼近自動駕駛。如今跑在全球道路上的數萬輛特斯拉都是這樣的學習機器,哪怕司機不打開自動駕駛功能,特斯拉也會有一個影子模式在時刻對比自動駕駛和人類駕駛員的操作,并上報兩者的不一致。用這些被標注的數據訓練,最終既可以教會機器開車,也能避免通過試錯才能學習的可怕后果。
更進一步,8月20日,馬斯克在特斯拉A I日上又發布了一款人形機器人Tesla Bot,搭載與汽車相同的智能相機Autopilot C ameras和自動駕駛系統FullSelf-Driving(FSD),兩者都是特斯拉汽車的核心,前者解決感知問題,后者解決決策問題。Tesla Bot和特斯拉汽車產生的數據都會上傳到名為Dojo的超級計算機,在此訓練的Autopilot也將成為二者的共同大腦。這一點很容易就讓人想到人工智能領域熱衷談論的終極目標—通用人工智能。
一個會開車的人形機器人會比其他同類聰明多少還很難說,但假如特斯拉讓這款人形機器人做傳統汽車的司機,它就能使傳統汽車也變成自動駕駛汽車—這款機器人身高173厘米、體重56.7公斤,與普通成年人差不多。
正如通用的機械手臂并未完全取代工廠里的專用機一樣,具備自主學習能力的機器人也不一定比自動化的機器更有未來。但只要創業者愿意,他們也可以像ABB、庫卡、特斯拉一樣,吃掉傳統流水線和汽車廠商的可觀市場。而且,只要他們愿意,還可以效仿馬斯克,控制論和自主學習兩條技術路線并行,最終創造出真正的機器人公司,前提是先在生產線上把機器成批制造出來。
不管你有沒有準備好,各種各樣的機器人已經出現在我們的生活環境中:餐廳、酒店、住院病房、購物中心甚至家里的臥室。當機器人長得越來越像人,人類又該如何自處和與之相處?機器人進入具體應用場景后所帶來的倫理問題和挑戰,比單純討論AI技術要復雜得多。大多數這類主題的科幻小說,故事情節所反映出的看法都不怎么樂觀。
挑戰之一來自人如何從心理上接納機器人。1970年,日本機器人學家森昌弘提出過一個“恐怖谷”假說,意思是當人發現機器人與人類在外表、動作上相似,會對機器人產生正面情感;但當相似達到特定程度,接近人可與之共情的同類,此時機器人如果偶爾表現出與人的差異,人類對機器人的反應就會突然變得負面,認為它“僵硬恐怖、猶如行尸走肉”,出現情感的波谷;只有當機器人與人的相似度繼續上升,達到與人無異的水平,人類對機器人的情感才會再度回到正面,從而發生移情。中間的心理跳躍過程如同一個V字形的峽谷。
2019年,工業機器人安裝量排名前5位的市場
資料來源:國際機器人聯合會(IFR)
這種心理過山車的出現并不遙遠。8月20日的特斯拉AI日上,馬斯克已經宣布其人形機器人Tesla Bot的第一個實體版本明年就會面世。
就在幾天前,搜狗創始人王小川還在社交媒體上評論一則視頻新聞說,“不要虐待機器人”。在那條視頻里,一位酒店客人將一臺試圖進入電梯的機器人踹倒在地。那臺機器人的長相距離人類還很遙遠—只是一個圓柱體的送貨機—就已引發兩派意見。一種是像王小川這樣,認為機器人應該被友好對待,就像人應當相互友好對待一樣;另一種態度則是,機器人不能和人搭同一臺電梯,因為它終歸是機器,有電池,有系統,它有可能爆炸,還有可能失控。
等著看吧,畢竟經過上百年發展,寵物在人類社會中的地位變得越來越高,在很多場所都可以與人平起平坐的時候,仍有很多社會在為能不能吃狗肉吵得不可開交,我們有足夠的理由相信機器人的入世之途不會更順遂。
機器人產業發展的3種模式
資料來源:波士頓咨詢
當然,新一代機器人帶來的更大挑戰還在于深度強化學習本身。這項技術使得機器人不僅長得像人,決策也容易出人意料,甚至帶來不可預知的后果。
簡單解釋一下這項技術背后的原理,你就會明白我們在擔憂什么。相較于之前的人工智能技術—無論是被稱作“專家系統”的控制論式智能,還是需要打過標簽、有正確答案才能學習的有監督學習—深度強化學習更為智能,它不怎么需要人類專家的知識,也不需要標簽樣本,就能通過數字神經網絡和獎勵函數一點一點實現目標,相當于是通過不斷試錯學會東西的。
你可以從AlphaGo的表現上看出使用了強化學習算法的深度神經網絡的強大力量。2017年,《麻省理工科技評論》將這種技術評為當年“十大突破性技術”之一。然而由于其決策的不可解釋性,這項革命性的技術也被稱為“黑盒”。不管人們認為人工智能有多愚蠢,并因此在智力上藐視它,都回避不了愚蠢的代價需要人來承擔的事實。
2030年,專業服務機器人的市場規模將大大超過工業機器人和協作機器人
資料來源:波士頓咨詢
迄今為止,各大公司仍然只敢將這項技術用于解決感知層面的問題,比如識別各種圖片和聲音,至多將其擴大應用至商品、廣告、短視頻、新聞等消費信息的推薦上,即便推薦得不合消費者心意,也不會危及生命。但汽車就不同了,所以如今跑在路上的所謂自動駕駛汽車都沒有將決策真正交給AI(前面已經講述了馬斯克是如何巧妙解決這個問題 的)。
機器人司機自主決策的后果,會和自動駕駛汽車差不多,你準備好了嗎?