
人形機器人即將能夠從事體力勞動?近日,一則消息讓人“浮想聯翩”。
5月31日,車企東風柳汽與優必選科技(以下簡稱:優必選)簽署應用戰略合作協議。優必選工業版人形機器人Walker S將進入東風工廠,在更為復雜的檢測、裝配、物流現場提供解決方案,把人從重復、價值低的工作中解放出來。
機器人進工廠不是件新鮮事,罕見的是,進工廠的Walker S有著類人的雙足形態。它的身高1米7,身上有41個關節。在過去,因技術和落地難度過高,類似Walker S的人形機器人,被稱為“機器人皇冠上的明珠”。
這顆“明珠”正因為2023年AI大模型熱,進入迅猛發展的積極周期。有數據統計,2023年我國人形機器人相關投融資事件達12起,金額占過去十年行業總投資的1/4。
而Walker S背后的公司—優必選成立于2012年,是國內最資深的人形機器人公司,有人形機器人領域全球第一的有效技術專利。2023年12月,優必選在港交所上市,成為我國“人形機器人”第一股,備受市場關注。
另一面是,優必選招股書和財報揭露,2020年至2023年,優必選的營收分別為7.40億元、8.17億元、10.08億元和10.55億元,每年平均研發投入超過年營收50%。經調整后的凈虧損分別為6.43億元、7.61億元、7.82億元和5.15億元。“燒錢”的前沿科技,亟需商業化的拐點。
6月,南風窗記者與優必選副總裁、研究院副院長龐建新見面,聊了聊人形機器人的進展與挑戰。他保持著創業者的樂觀,認為AI大模型讓機器人擁有了“大腦”,資金與人才因此接連涌入,“現在是一個重要拐點”。
但在落地角度方面,這位技術派的副總裁始終十分冷靜。機器人需要面臨遠比數字世界復雜繁多的問題:穩定性、安全性、性價比……這也是當下的AI暫時無法取代體力勞動,而是率先威脅白領部分工作的原因。
而龐建新相信,“經過2—3年技術沉淀”,人形機器人領域落地的產品,也將真正影響千家萬戶。全面電動化、智能化的人形機器人,或將成為第四次工業革命載體。
機器人之夢,馬上要實現了?
過去兩年,龐建新經常感到興奮。新進展層出不窮,他比過往更關注機器人學術界的發現,花了很多時間在閱讀論文上。
他的公司坐落在深圳南山區的山地之間,馬路對面是南方科技大學,再遠些是北京大學深圳研究院、哈爾濱工業大學深圳校區等高校。知情人士透露,在人形機器人行業,全國的公司基本集聚在三地,分別是:北京,上海、杭州等長三角城市,深圳等珠三角城市。
如此的分布反映了人形機器人行業特點:門檻極高。一位人形機器人創業者曾告訴南風窗,人形雙足的機器人難度最高,首先是因為其擁有比一般機器人更多的關節與硬件,“一個人形機器人光是零部件就有7000多個”。再加上入局者少,上下游供應鏈不成熟,還處在“非標準化生產”的階段,成本也高。
更令投身這一賽道的創新者苦惱的是,這是一個過去不被多數人看好的“冷門賽道”。
龐建新2015年從中國科學院深圳先進技術研究院離職,加入優必選,便是被創始人周劍發展“人形機器人”的夢想打動。但他對南風窗坦言,過去多年,國內只有寥寥幾家做人形機器人的公司,“很多人都質疑我們,會不會太早了?會不會技術還沒發展到這個地步?”
這些質疑聲,隨著ChatGPT在2022年引發的AI大模型熱,一并退卻了。馬斯克也在這起到帶動作用,他在特斯拉AI Day 2022給了眾人驚喜—特斯拉首款人形機器人“擎天柱”(Optimus)正式登場。馬斯克還宣布,特斯拉的這類機器人,今后售價將低于2萬美元。
從此,人形機器人賽道仿佛被按了加速鍵,成為市場的“香餑餑”。公開資料顯示,2023年12月底,優必選在港股上市,發行價為90港元。僅三個多月后,優必選股價已較發行價漲逾一倍,市值最高一度達到千億港元。
龐建新說,許多機器人或人工智能從業者都因為AI大模型的出現,轉變了發展思路,投入人形機器人研發的大潮。這是因為,將大模型融入機器人,會使人形機器人具備更多的智能,泛化性有了很大提高。
更具體而言,人形機器人分為感知、決策、執行三個系統,分別對應人類的感官、大腦、小腦。大模型出現前,每個系統都是獨立存在的。
他舉例,在過去,人形機器人會通過視覺感知、激光雷達等部件感知外界,每種維度信號再分別給出一個結論,交給決策系統,“各個部分相對獨立”。如此一來,“(人形機器人)會丟失很多有價值的內容,例如信息的完整性,信息上下文相關性”。
也就是說,以前的人形機器人很難準確認知環境,而且魯棒性(即適配性)差。
有了AI大模型后,機器人的大腦會變得“聰明”。龐建新解釋,在過去,研發人員一直在找尋各種辦法,讓人形機器人理解人類物理世界的常識。這些常識由人類在生活中自然習得,對人類而言非常簡單,但機器人理解它們常常十分困難。
比如,人們夏天需要喝冰水、冬天愛喝熱水,小孩需要喝更溫點的水……人類世界太多的“理所當然”,要想機器人知悉,需要提前用專家數據庫設定。而這容易導致一個“死結”:如果機器人周邊環境發生變化或者換個任務,就有可能因為缺乏數據“宕機”。
而有了大模型以后,人形機器人可以在擁有海量的知識時接入更多常識。于是,當它遇到沒見過的場景或者任務時,不再像過去一樣傻愣著,而是擁有自行推理、重新決策的能力。
“大模型給我們帶來太多想象空間,”龐建新感慨,“我們第一次看到,通過多模態大模型,人形機器人能表現出對物理世界強大的理解和推理能力,這是我們以前從沒有看到過的。”
人形機器人風光無限時,不少人都在急切呼喚著人形機器人的落地與應用。在人們的想象里,人形機器人應該像奧斯卡獲獎電影《機器人之夢》演的一樣,成為人類伙伴,幫助人們處理家務、陪伴養老。
AI大模型毫無疑問讓“夢想”的實現加速了。龐建新透露,此前行業內部判斷,人形機器人離落地需要5—10年時間,而現在時間被大大縮短。“我一直在跟公司內部講,這兩三年是技術更迭的兩三年,我們這些企業要大力投入,一定會有新的技術出現。”
2024年4月,優必選官宣與百度文心大模型合作。接入百度文心大模型后,優必選的人形機器人進行了任務調度應用開發,提升了任務理解與規劃的能力。在官方透露的視頻里,接入文心大模型的Walker S能聽懂人的指令,幫人疊衣服,并能與人類實時語言互動,完成分揀等復雜的任務。
龐建新坦言,制造出人形機器人demo(小樣)對企業的難度并不算高,難的是在后續的落地中,保持性能穩定、質量可靠、減少出錯率。這是目前困擾各家人形機器人企業的問題。
相較于讓與人類進行交互的人形機器人落地,優必選有一條走得更快的路線—讓人形機器人進工廠。兩年前,優必選創始人周劍就開始讓團隊探索這一應用場景。這也是馬斯克率先押注的應用場景。

6月15日,馬斯克還在年度股東大會上宣布,位于加州的特斯拉工廠已經有兩個擎天柱機器人在使用,“從明年開始將有超過1000個,甚至可能有幾千個擎天柱在工作”。他預計,未來人形機器人和人類的比例可能是2比1或者1比1,光這一項就能給特斯拉帶來20萬億美元的市值。
龐建新告訴南風窗,工廠的場景較能符合現在人形機器人的技術發展程度,即在結構化或半結構化場景下,完成特定的有限任務。
“只要能解決幾個工位,對于一個產業來講都是極其巨大的市場。這個市場的確太大了。”他說。據透露,目前有多家新能源汽車、3C行業客戶正在與優必選洽談合作,需求樂觀。
今年年初,Walker S進入蔚來第二先進制造基地總裝車間實地“培訓”,成為全球首例進廠與人類協作完成汽車裝配及質量檢查作業的人形機器人。在4月的業績會上,優必選透露,2024年通過在工廠端進行大量的實測,為2025年或2026年人形機器人在工廠端的放量做好準備。
龐建新解釋,人形機器人進工廠背后實際有非常復雜的問題。首先,每家工廠都有自己一套生產流程,“我們首先要解決的事情是機器人到底能干什么,解決哪類問題?需要(為它)新增工位還是保持原有工位?”哪怕是同一類工廠,不同公司需求差異也很大。
接著,團隊要根據實際需求,在實驗室搭建類似場景,對機器人進行訓練和迭代,接著才能進工廠實訓。
實訓得到真實數據后,“再反饋、再訓練、再迭代”。最后,“讓人形機器人正式進入工廠的系統,與工廠工作流進行配合,完成落地”。
龐建新告訴南風窗,Walker S進蔚來工廠的任務主要是門鎖質檢、車燈蓋板檢測、安全帶檢測、貼車標等,完成部分產業工人的工作。
“如果只是代替單一工種,這與過去只完成垂直任務的機器人有什么區別?”南風窗記者問他。
“人形機器人從來不能只干一件活,它要解決的是通用任務—一種機器人能完成多個任務。例如,在工業制造場景里,有大量不同工作同時存在,我不能為了每個工作都去設計一個專用機器人……”
而這,便是人形機器人的“魅力”所在—通用性為王。
技術路線已經初見名目。
龐建新告訴南風窗,當下,實現人形機器人的路徑和邏輯基本清晰,目前亟待解決的是工程化的問題。
“工業場景對人形機器人提出三方面要求,包括數據安全性、操作穩定性、底層控制可靠性等。還有售后、日常支持和維護,一大堆的(工程)問題需要解決。”他表示。
優必選副總裁、研究院執行院長焦繼超也在近日告訴媒體,量產人形機器人是區別于產品研發的另一個重要階段。
“如果是產品研發,實驗室有一兩臺人形機器人搭建成功就可以對外發布,而如果是量產,則對人形機器人的穩定性、可靠性,以及人形機器人的生產制造工藝有著很高的要求,即便是1%的誤差,都會造成很大影響。”
一位人形機器人的投資人曾告訴南風窗,她在選擇投資的公司時,會著重看公司對細節的交付能力。因為硬件類的AI容錯率很低,對安全性要求很高,“這大概就是硬件AI與軟件AI最大的區別”。
而技術出身的龐建新也始終十分冷靜。他認為,當下,大模型雖然給機器人注入了“大腦”,讓機器人有了更多智能,但這并非一勞永逸的解法。業界仍在探索大腦與小腦、肢體之間的銜接。
也就是說,現在讓機器人看懂、理解一句話并不難,難的是機器人如何在聽懂人類語言,或看到人的動作后,主動來驅動自己的全身,做出接下來的動作。
龐建新舉例:“即使是端水這個簡單任務,目前大多數人形機器人要成功完成還相當困難。這個任務雖然聽起來簡單,但其實質涉及從感知到決策,再到控制,一旦環境變化,就是一個非常復雜的挑戰。”
一位人形機器人行業人士告訴南風窗,人形機器人近年非常火熱,吸納大量的資金和人才。但太熱的賽道有時會帶來過高的期待,“公眾可能以為人形機器人什么都能做,實際上技術還沒完全到這一階段”。
阻礙技術落地的另一座“大山”在于,這是一個研發周期長、投入巨大的“燒錢”賽道。
華福證券曾在研報中提到,人形機器人目前對標電動汽車發展初期,降本成為行業的首要問題。
而從1960年代早稻田大學推出的WABOT人形機器人開始,到千禧年代的本田ASIMO機器人、波士頓動力ATLAS機器人,數代人形機器人的發展都困于高成本和居高不下的售價。
優必選的方案是,“兩條腿”走路。
2017年以來,優必選在多個場景進行了商業化落地。招股書顯示,人工智能教育機器人及解決方案是優必選的營收主力,2020—2022年分別實現營業收入6.12億元、4.62億元、5.17億元,占比為82.7%、56.5%、51.2%。2023年,智慧物流機器人及解決方案成為優必選主營業務,實現營收3.897億元人民幣,同比提升47%。
與此同時,優必選2012年開始研發小型人形機器人Alpha,從2015年開始研發大型人形機器人Walker。這帶來了大量的研發支出,數據顯示,2023年,優必選研發投入達4.9億元。
但毫無疑問,AI大模型的火熱讓這群創新者更加堅信,這條入局已久的賽道,即將迎來改變千家萬戶的拐點。
龐建新告訴南風窗,目前許多工廠都對人形機器人有需求,原因是中國人口老齡化帶來了勞動力短缺的問題。而且,許多年輕人都不愿意進工廠從事簡單、枯燥、重復的工作。
其次,隨著中國企業的出海,海外擴張的企業在當地很難招到員工,培育和管理人的成本很高,亟需機器人。
他也相信,盡管目前成本仍較高,但中國人形機器人已具備較強實力。只要堅持技術投入,中國相比美國具有智能制造的供應鏈優勢,今后會在制造成本上體現出競爭力。
優必選董事會主席、執行董事兼行政總裁周劍則判斷,現在全球頂尖科技公司對人形機器人的投入非常大。當前,國內科技企業和機構開始重視人形機器人賽道,但還需要耐心的資本長期持續地投入。
“現在人形機器人行業談盈利還為時尚早,我們要保持投入,探索商業化路徑,迎接產業蓬勃發展時刻的到來。”周劍說。