
今年春晚,宇樹科技的人形機器人H1驚艷亮相,給大家“轉了個手絹”。緊接著,我國牽頭制定的養老機器人國際標準(IEC 63310)正式發布,為行業發展提供了規范,或許人形機器人能夠在養老領域發揮自己的功能。在全球科技浪潮的推動下,人形機器人正以驚人的速度從實驗室走向現實,成為重塑人類生活方式的革命性力量。
對人形機器人,人們有太多期待。從誕生之初,它就被設計為人的得力助手和貼心伙伴,進入“尋常百姓家”更是最終的目標。為什么人類總執著于把機器人造成“人”的樣子?這真的是最好的選擇嗎?人形機器人又面臨著哪些挑戰?
人形機器人一直是科幻作品中的常客,但真正走進現實,還是近幾十年的事。1973年,日本早稻田大學研發的W A B O T-1成為世界上第一臺真正的人形機器人。它有雙足、雙臂,但看著非常簡陋,功能很少,走路都很困難。此后幾十年,科學家和工程師們不斷努力,讓人形機器人學會了更穩當地行走、抓握物品,甚至能簡單對話。不過,它們依然昂貴、復雜,普通人很難接觸到。
與此同時,專用機器人卻發展迅猛——工廠里的機械臂、家里的掃地機器人、餐廳的送餐機器人……它們不追求“像人”,而是專注于特定任務,很快被市場接受。既然如此,為什么還一定要執著于造出像人這樣雙足、雙臂的機器人呢?
雖然對于某些專業場景,人形機器人的效率不如專用機器人,但要是想建造一個能適應人類生活各種場景的機器人,人形機器人或許是最好的選擇。人類社會中的各種工具、空間場景都是以人類為中心設計的,人形機器人可以適用人的各種環境,比如樓梯的高度、扶手的位置、門把手的位置、廚房操作臺的高度等;可以使用各種專為人類設計的工具,比如剪刀、扳手、鍵盤等,這就意味著,它可以幫人類做更多我們不想做的事情。
再者,擬人化的外形,也更容易在情感上被我們接納。要機器人代替我們干活,就需要與機器人朝夕相處,頻繁下達工作指令。相比和一個冷冰冰的鐵塊相處,我們更愿意與看起來像人類的機器人交流。因此,設計成人形的機器人,可以使人們與其互動時感覺更自在。
此外,人形機器人學習人類更高效。機器人如果想要自主地解決問題,模仿人類是最快的途徑。因為人形機器人的關節結構、運動方式都與人類類似,所以它們只須跟在人類身邊,就擁有大量現成的動作樣本,可以快速學習。正因如此,人形機器人一直被認為是機器人行業“皇冠上的明珠”。

人形機器人需要解決的難題有很多。人形這個特殊的形態,讓它們在站立和行走上要面對更多挑戰。就拿“站穩”這件事來說,四足機器人的重心更容易保持在支撐面內,而人形機器人屬于雙足機器人,支撐面積更小,重心一旦超出支撐面,很容易摔倒。
因此對于能夠運動的機器人來說,雙足行走的人形機器人也不是最佳選擇。在人形機器人還在“蹣跚學步”的時候,四個輪子的自動駕駛汽車(也可以算是機器人)已經在開放路面上進行測試了,而四足機器人(機器狗)也已經能夠在崎嶇的山地上搬運物資,甚至高速越野了。
即便目前的人形機器人“下肢”已經足夠發達,可以行走、跳躍、空翻等,但許多技術瓶頸在現階段仍無法得到解決。最核心的問題是機器人通用性。簡單來說,不是像機械臂僅完成固定的單一任務,機器人只有同時完成多項任務,才能代表其智能性的跨越。
近年來,隨著A I大模型的爆火,機器人行業傾向于使用A I大模型驅動的方式,讓機器人實現通用性。這便是具身智能概念的由來。業內的一個典型標桿,是特斯拉造的人形機器人Optimus。“馬斯克們”相信,采用端到端的技術,通過給機器人喂大量的數據,結合其自研A I大模型,可訓練出能完成多種任務的通用型機器人。
但無論在學術圈還是產業界,對A I驅動的方式能否給機器人帶來通用性,仍無法給出1 0 0 %的肯定答案。一個公認的難題是數據。以DeepSeek、ChatGPT為代表的AI大模型,是通過投喂大量公開論文以及互聯網信息等數據訓練出有通用性的A I應用,但對于擁有實體的機器人而言,要把物理世界的狀況都以數據方式投喂給它,難度很大,成本也十分高昂。
對于人類而言, 認識現實世界是從小通過各類感官習得、自然而然的事情。但對機器人來說,在現實世界需要量化和建構的要素太多了。如果讓機器人洗碗,怎么讓它知道洗潔精有沒有沖干凈?如果讓機器人倒水,人類聽聲音、憑借經驗就能知道水滿了,但你要怎么告訴機器人水滿了?
高質量、多模態數據的缺乏,正成為人形機器人發展的主要障礙。受制于現實數據的缺乏以及算法的局限,與操作、控制有關的“上肢”,發展仍十分不足。
除了技術桎梏,成本壁壘也制約著人形機器人的發展。盡管宇樹H1機器人成本已經降到了9.9萬元,特斯拉Optimus預計為2萬美元,比之前的阿西莫、阿特拉斯等人形機器人降低了太多,但在消費領域還是用處不大且太貴。
此外,相比于其他類型的機器人,人形機器人的外形也是爭議的焦點之一。反對者認為,隨著人形機器越來越像人,卻又做不到完全逼真的時候,就可能會引起“恐怖谷效應”??植拦刃@個概念是日本機器人專家森政弘在1970年提出的,它的意思是,人們對一個物體的好感度會隨著它們越來越像人而提高,但是當它和人類比較像,但又不那么逼真的時候,人們對它們的好感度會急轉直下。而到了和人類一樣(或者就是真人)的時候,好感度又會提升。
作為人形機器人,很大的一個應用場景是陪伴。比如,開頭提到的養老行業,就可以用它們做智能管家。此外,它們同樣可以作為孩子的成長陪伴機器人。如何讓一個機器人既像人又不嚇人,是人形機器人公司需要努力解決的難題。

產業的爆發總伴隨著泡沫的產生,清醒的業內人士都表示,這個行業的發展目前仍處于早期,不同人士對未來趨勢的判斷也有不同觀點。有的技術專家給出了7~10年機器人就可以實現通用能力的判斷,有的則認為需要更長的時間。
如果能夠實現所謂的通用能力,人形機器人將與人類歷史上的蒸汽機、汽車、計算機、手機等所有的單一技術或工具都不一樣,它會以具身方式進入人類的生產與生活場景,與我們直接進行物理的、乃至精神的接觸,甚至在很多場景下接替人類的決策者身份。這將直接沖擊人類的主體性地位,我們的道德經驗、倫理規范和法律準則,可能都需要重新調整。
復旦大學科技倫理與人類未來研究院教授楊慶峰認為搭載人工智能的人形機器人具有隱私泄露的風險。試想一下,一個可以提供家庭服務的人形機器人,對大量個人信息和隱私數據的處理是實現其提供個性化、智能化服務的必要前提。但反過來,由于“耳聰目明”,人形機器人可能成為移動的“竊聽器”和“監視器”。
當人形機器人在外形上更逼真,內核上更智能后,可能帶來的傷害也會更大。“首先,由于硬件缺陷或軟件漏洞導致人形機器人出現故障,從而引發安全事件。由于它具有高交互性,與人的身體接觸更為密切,一旦出現功能失靈,可能會對人類造成無意識的傷害?!睏顟c峰解釋道,“其次,根據約書亞的觀點,智能體一個很重要的特征就是目標追求,會不會由于極度追求目標實現而會出現超級智能體;在進化的過程中會不會由于被關機恐懼而產生自我保存,繼而因為怨恨產生自主性的傷害行為。這些都會引發相關的風險問題。”
更深層次的是,隨著人機交互體驗的提升,人們在面對一個知我懂我,從情緒價值到物理體驗都可以和真人相媲美的機器人時,人類如何來看待與人形機器人的關系定位——人們可能對機器人產生情感依賴,影響人際關系的健康發展;也可能引發家庭中的角色替代,造成情感困惑和倫理沖突;更危險的是,人形機器人可能對人類進行有意誤導,在價值偏差下“操縱”人類做出某些決策。2024年10月,媒體就曾報道過一起“A I聊天機器人被指控誘導美國少年自殺身亡”的案件。
此外,還有很現實的生存上的問題,一部分人會擔心某些工作被替代。再往遠一點看,假如具身機器人真正擁有了意識,人類還可能會對自我存在的價值產生擔憂。
人形機器人就像一面鏡子,既映照出人類科技的輝煌成就,也折射出我們對自身的深刻思考。在擁抱技術的同時,我們更需要審慎規劃,確保科技發展真正服務于人類福祉。