
人形機器人是AI最有前景的落地方向之一,在工業、商業、家庭、外太空探索等領域具有廣闊應用場景。目前,國內外重量級玩家不斷增多,特斯拉、小鵬、小米等公司均已入局。預計這一產業迭代成熟之后,所對應的年度市場規模達到數萬億元,其產業鏈值得深入研究。
機器人采用人形設計,是出于多種因素考量。一是環境適應性,現實中許多場景(如樓梯、工具等)均是根據人體工學設計的,人形機器人能夠直接適用。二是任務通用性,人體具備較高靈活度,模仿人類的關節、感官系統,讓人形機器人更加靈活,可執行多樣化任務。三是社會接受度,類人外觀可以降低人機交互的心理隔閡。四是數據可得性,深度仿生意味著可以從人身動作中獲取大量的運動數據,能夠明顯降低深度強化學習等訓練方法的難度和訓練時間。
特斯拉人形機器人擎天柱(Optimus)即堅持仿人結構:一是外形堅持仿人設計;二是結構上,關節通過非線性結構來實現對不同形態下壓力、扭矩的控制,進而實現流暢動作,在執行器連接中使用模仿肌腱的彈簧設計,手部形態上模仿人類手掌,從而實現高靈敏度,以抓取重物和輕薄物體。
人形機器人研究,起步于對人類雙足行走的模仿。1969年,日本早稻田大學加藤一郎教授率先解決了人形機器人的雙足行走問題,揭開了人形機器人研究的序幕。
行走機構的設計以及相應控制方法的解決,推動著人形機器人邁向自主式完成任務。1973年,加藤一郎等人在其研發的代號為WL-5的雙足機器人基礎上,配置了機械手以及人工視覺、聽力裝置,組成了自主式機器人WAROT-1,人形機器人的研究也逐漸擴展到人工智能方面。
1990年以來,機器人的行走能力、智能化和功能越來越強大,本田公司的仿人機器人ASIMO是行業的典范。
2010年以來,互聯網的發展推動人形機器人受到更多大眾關注,技術也愈發成熟。2015年,Pepper的市售是人形機器人走入大眾市場的重大嘗試。2021年,波士頓動力發布旗下人形機器人Atlas的跑酷視頻,即刻收獲百萬點贊。電動車巨頭特斯拉也于2021年宣布,將推出人形機器人產品Optimus,至此,人形機器人批量生產的商業化時代拉開序幕。
2025年1月9日,特斯拉CEO馬斯克在國際消費類電子產品展覽會(CES2025)的連線采訪中提到,未來,人形機器人的數量可能是人類的幾倍;2025年,特斯拉將生產數千臺Optimus人形機器人用于內部工廠測試,如果測試順利,那么2026年產量會提升10倍。

國內重量級玩家也不斷增多,小鵬、小米等公司均已入局人形機器人領域。
2016年,優必選原型機誕生,其腿部擁有12個自由度,可實現多種場景下的行走。2021年,其研發的機器人WalkerX發布,優必選對其視覺定位導航和手眼協調操作技術進行了全面升級,使之可以更生動地與人交互,還學會了下象棋。
2022年8月,小米首款全尺寸人形仿生機器人CyberOne(鐵大)正式亮相。
2023年10月,小鵬推出了自研的人形態雙足機器人PX5。2024年11月6日,其自主研發的AI人形機器人Iron亮相。
此外,華為等公司也在積極布局這一領域。2023年6月19日,東莞極目機器有限公司成立,該公司由華為技術有限公司全資持股,注冊資本為8.7億元。
AI時代,人形機器人有望加快實現商業化落地,但其研發中仍存在不少難點。
當前,智能機器人的本體仍然存在幾大發展痛點,主要體現在“大腦”泛化能力、垂類數據、結構設計、供應鏈成本等多個方面。
一是“大腦”泛化能力有限,導致當前智能機器人的應用場景受限。“大腦”能力影響機器人能力的上限,在機器人產業鏈中具有重要地位。為此,各個廠商都為自己的具身智能發展配備了優越的大模型,如美國初創機器人公司Figure和挪威人形機器人公司1XTechnologies均曾采用OpenAI的大模型進行任務處理。目前,具身大模型快速迭代,但從效果來看,其在泛化能力等方面的發展仍有較長的路要走。人形機器人在單一任務的泛化能力方面已取得較好進展,但是,多任務、跨任務的泛化能力仍然相對較弱,影響其落地應用。
二是在具身大模型還沒有足夠泛化、成熟之前,結構化場景的垂類模型可以與具身大模型相向而行,加速具身智能的落地。現階段,部分企業嘗試將應用場景做封閉,即把作業場景分為若干約束條件,形成一個封閉的作業域,在其中實現泛化,這樣,其數據規模要求將顯著下降。這一方式和世界模型的發展是相向而行的路線,隨著具身大模型泛化能力逐步提升,場景的切割也可以更寬泛。
三是數據重要性凸顯,垂類數據采集方興未艾。數據是具身智能的“認知基石”,具身智能要實現“感知-思考-行動”的閉環,數據是其中的核心輸入。一方面,具身智能體通過多種傳感器采集實時數據,可以構建動態環境的三維表征;另一方面,智能體在與物理世界的交互中產生的軌跡數據等可以轉化為行為經驗,用于優化后續決策邏輯。同時,數據是具身智能算法迭代的核心驅動力,大規模的數據用于模型訓練等可以提升智能體的泛化能力,有助于實現其在未知場景中的自適應調整行為。
目前,通用機器人大模型所需數據量極為龐大、獲取難度高,導致短期內難以采集足夠數量的真機數據用于大模型訓練;同時,常規的視覺語言動作模型(VLA)架構也難以利用大規模人類以及跨本體的操作視頻數據,目前,業界主要采用仿真數據和互聯網的圖文數據來訓練機器人。
四是機器人結構設計仍需優化,零部件可靠性、電池續航等問題亟待解決。2025年4月,2025北京亦莊人機共跑半程馬拉松在北京南海子公園開跑。半馬是對機器人關節結構設計、熱管理、電池續航、控制算法、通信干擾、軟硬件耦合等方面的綜合性考驗。比賽途中,多數選手出現運動失衡、摔倒等現象,穩定性較差,同時暴露出散熱問題,需不斷噴灑冷卻液進行降溫。此外,人形機器人目前續航能力有限,大多數集中在2―5小時,難以滿足家庭服務、工業協作等場景的持續作業需求。
以散熱和續航為例,機器人的高功率電機、密集的電子元件在持續工作時均會產生大量熱量,尤其是在高速持續運動或重載工況下,熱量積累速度很快。而由于人形機器人設計為仿人結構,其內部空間緊湊,熱量難以快速散發,此類問題仍待解決。
五是供應鏈成本較高,硬件價格仍需進一步下降。由于人形機器人量產的規模有限,相關的零部件需求暫未完全釋放,而部分零部件此前由于應用場景有限,價格較為昂貴,如精密傳感器、行星滾柱絲杠等,未來,有賴于供應鏈環節的進一步降本。
諸多痛點的解決,有助于推動人形機器人產業規模進一步擴大。
當前,人形機器人賽道玩家眾多,其發展各有側重,推動產品快速迭代、性能持續提升,而不同產品的各項性能參數、商業化進度也存在差異,一些廠商在部分方向進步顯著。
一是運動控制。目前,人形機器人已具備一定的復雜運動能力,如宇樹科技G1機器人可以實現流暢的側空翻動作,并且在拳擊比賽中被打擊后迅速恢復平衡,展現出了較好的運動性能。但是從整個行業的角度來看,運動控制仍有發展空間,機器人在運動速度、姿態穩定度上仍需進步。
二是環境感知。通過激光雷達、視覺傳感器和慣性測量單元(IMU)的多模態融合,機器人能夠實時識別地形等外部環境變化,并動態調整其步幅與重心,實現運動穩定性。以推出能跑半馬的人形機器人的松延動力為例,其研發的N2機器人依賴多模態傳感器融合,通過仿生足底傳感器、激光雷達和視覺SLAM實現復雜地形導航,并且,其動態抗干擾算法也可以應對外部突發干擾。
以特斯拉的人形機器人為例,在特斯拉的2021年AI日活動上,其展示的機器人TeslaBot外形設計接近人類平均身材,全身采用輕量化材料,面部有一個重要信息顯示屏。它的四肢依靠40個機電執行器進行操作,其中手臂12個、頸部2個、軀干部2個、手部12個、腿部12個。此外,它具有人類級仿生手,腳部為2軸平衡設計,有力反饋感應,可以實現平衡和敏捷的動作。
2023年12月,特斯拉發布第二代通用人形機器人OptimusGen2,其機械結構進一步優化,整機重量減輕10公斤,并能夠實現更靈活的肢體運動。在運動性能方面,其行走速度提升30%,新增深蹲等復雜動作能力;平衡系統優化,具備動態環境適應能力。OptimusGen2的單手自由度仍然是11個,但是響應速度和執行速度更快,其中,手指部分使用了全手指觸覺傳感器,幫助人形機器人實現精細化操作。根據特斯拉的展示視頻,OptimusGen2手部活動更加連貫擬人,靈巧手能夠執行精細操作,精準抓握細小易碎物品,如搬運雞蛋、二指拿雞蛋等。
目前,特斯拉尚未正式發布OptimusGen3,但從此前會議信息預計,其靈巧手將顯著升級,預計有22個自由度。
國產人形機器人方面,我們以星動紀元推出的星動STAR1為例。該公司產品經過多次迭代升級,于2024年8月推出了首款產品級高性能人形機器人星動STAR1。星動STAR1全身共有55個自由度,具有業界先進的動態性能。其最高關節扭矩達400Nm,最高轉速達25rad/s,室外真實場景奔跑速度達3.6m/s,配合腰部的3個自由度,可以輕松完成自然步態下的穩定行走、奔跑、跳躍等復雜運動。
星動STAR1上肢為公司自主研發,具有7個自由度的高精度仿生機械臂,其高性能靈巧手星動XHAND1具有12個全主動、全自驅的自由度。其在精細操作任務領域具有業界先進的執行機構,能適應多種場景應用需求。
星動STAR1集成了英特爾高性能處理器和英偉達系統級芯片Orin的計算資源,為人形機器人在強化學習、模仿學習和端到端大模型研究中提供算力支持。此外,該機器人還配備了指尖陣列式觸覺傳感器、深度視覺相機、麥克風陣列和面部交互屏幕等多種外設。
產品的進步,體現到了應用端。目前,人形機器人主要應用于科研教育、智慧引導、數據采集等場景,以及焊接、分揀、搬運等工業場景,同時,康養護理、家庭服務等消費端場景也是其積極拓展的重要方向。目前,行業正在陸續釋放批量訂單,如智元機器人、宇樹科技中標中移(杭州)信息技術有限公司2025年至2027年人形雙足機器人代工服務采購項目,總標包1.24億元,分別為智元7800萬元(含稅)、宇樹4605萬元(含稅)。批量訂單預示著,人形機器人在終端商業場景的探索逐步進入落地階段。
人形機器人包含人機交互、環境感知、運動控制三大核心能力,使得它們像人一樣具有感知、學習和與環境動態交互的能力。其中,執行系統是運動控制的核心組成部分,其發展又涉及不同的核心零部件。
執行系統
人形機器人的執行系統主要指其軀干的關節模組和靈巧手,前者主要包括旋轉關節和線性關節。關于驅動和傳動方案設計,旋轉關節常采用“電機+減速器”,線性關節多采用“電機+絲杠”。目前,特斯拉、小鵬等廠商采用“旋轉+線性關節”方案,而Figure、智元、宇樹等廠商的部分機器人則采用全旋轉方案。
以特斯拉產品為例,根據特斯拉在2022年AI日展示的細節,Optimus擁有40個機電執行器,其中,軀干8個、腿部12個、手臂8個、手部12個。其“軀干+腿部+手臂”的28個執行器,包括14個旋轉執行器、14個線性執行器。
Optimus的14個旋轉執行器,按照扭矩不同分為20Nm、110Nm、180Nm三類。從結構來看,旋轉執行器包括無框力矩電機、諧波減速器、機械離合器、無接觸力矩傳感器、輸入及輸出位置傳感器、交叉滾子軸承、角接觸球軸承等。從工作原理來看,旋轉執行環節主要包括三個:第一,電機是動力輸入源,其中永磁體(轉子)發生旋轉運動;第二,電機產生的動力經過諧波減速機轉換,實現了降低轉速、增大扭矩的目的,可滿足驅動負載的要求;第三,諧波減速器輸出端通過交叉滾子軸承連接至輸出軸,以實現部分關節的旋轉運動。在此過程中,無接觸力矩傳感器測量輸出扭矩,輸入、輸出位置傳感器用于測量位置和速度,并實現及時的反饋,便于進行精確的控制;機械離合器主要實現傳動通斷狀態的切換。此外,也有諸多廠商的旋轉執行器采用行星減速器方案,主要用于機器人下肢。
Optimus的14個線性執行器,牽引力分別為500、3900、8000N,主要在受力要求較大的部位,包括腕部、踝部的俯仰(pitch)、偏航(yaw)角,髖部、肘部、膝部的俯仰(pitch)角。從結構來看,包括無框力矩電機、行星滾柱絲杠、力傳感器、四點接觸軸承、球軸承、位置傳感器。從工作原理來看,以膝蓋處為例,行星滾柱絲杠處于人形機器人的“大腿”位置,當腿需要伸直時,絲杠收縮,拉動A點,通過其他連桿,小腿即可伸直。力傳感器和位置傳感器負責采集、反饋、矯正,使控制更精準。
目前,市場上靈巧手的驅動方案、傳動方案等存在多種選擇。
以特斯拉靈巧手為例,2024年10月11日,特斯拉在WeRobot會議結束后展示了第三代Gen3靈巧手模型。根據展示視頻,該靈巧手共有22個自由度,其食指、中指、無名指分別具有4個自由度,拇指以及小指分別具有5個自由度。具體來看,每根手指有三個關節,分別是遠端關節(DIP)、中間關節(PIP)、近端關節(MCP),其中,DIP和PIP具有一個自由度,可以彎曲和伸展,MCP具有兩個自由度,可以彎曲伸展以及內收和外展。
OptimusGen3靈巧手的靈活度較前一代提升明顯。其在每個手指環節增加了遠端關節和中間關節自由度,近端關節增加了外展和內收自由度。此外,在小指處,增加了一個轉軸,使得該靈巧手具備2個對掌關節(Opposition)。目前,行業中大部分靈巧手都是使用一個對掌關節(即拇指的對掌關節),雙對掌關節的設計使得Optimus新一代靈巧手小指擁有更高的靈活度,有利于自適應抓取和手內操作潛力的進一步發掘。
OptimusGen3靈巧手運動系統預計主要包括線性執行器模塊和腱繩模塊。根據特斯拉展示視頻和腱驅動相關學術研究,我們判斷,其驅動系統包括線性執行器模塊及腱繩模塊,其中,線性執行器模塊預計為“電機系統+絲杠”或者“電機系統+減速器+絲杠”的方案,腱繩模塊預計包括腱繩導管、腱繩、腱張力傳感器、腱端連接器等部件。
近年,國產靈巧手也密集發布,產業加速發展。2024年下半年以來,已有因時機器人、兆威機電、帕西尼、雷賽智能、永創智能、速騰聚創、江蘇雷利等多家企業發布靈巧手新產品,整體價格段更加靈活,面向場景更加豐富(附表)。

電機:為人形機器人提供驅動力
人形機器人的運動,離不開電動機。根據功能與用途差異,電動機可分為驅動電機與控制電機兩大類。伺服電機、步進電機便是典型的控制電機,前者控制精度相對更高。
人形機器人電機需要滿足高效率、高動態和高功率密度的要求。高效率方面,機器人通常由電池供電,需要經受得起苛刻的運行條件,可進行十分頻繁的正反向和加減速運行,并能在短時間內承受過載,因此,低能耗和低摩擦損失很重要。高動態方面,整個驅動器的慣性應盡可能低,電動機從獲得指令信號到完成指令所要求的工作狀態的時間應短。高功率密度方面,機器人應用需要高速、高扭矩電機,電機還需要小巧、緊湊、輕巧。根據這些應用要求,我們判斷人形機器人電機應以控制電機為主,尤其是對于運動控制更加精確的伺服電機有望得到更多應用。
OptimusGen2主要應用兩類特殊的伺服電機,即無框力矩電機和空心杯電機。無框力矩電機具有高緊湊度、高效率及轉速、低噪音、高穩定性及低維護四大特點。其由獨立的轉子和定子部件組成,可以和安全制動器、編碼器構成一個無框力矩電機模組。空心杯電機是一種特殊結構的直流電機,具有效率高、靈敏度高、運行穩定、控制性強等特點。
編碼器:實現電機位置與速度反饋,助力精準運動控制
編碼器主要用來測量磁極位置和電機轉角及轉速,其分辨率對電機系統的控制精度具有重要影響。編碼器在電機系統中成本占比并不高,以伺服系統為例,編碼器占其成本比例約為11%,但其對電機的定位精度、速度穩定性、功率損耗和安全性都有重要影響。
減速器:實現動力傳動的重要部件
減速機是工業動力傳動不可缺少的重要基礎部件之一,可能應用于人形機器人領域的減速器,主要包括諧波減速器、精密行星減速器、RV減速器等。
軸承:支撐旋轉體,助力精準傳動
軸承可分為滾動軸承和滑動軸承兩類。
精密滾動軸承為機器人執行系統的關鍵零部件,對機器人減速器的承載能力、回轉精度、運轉平穩性、重復定位精度等性能起到重要作用。機器人軸承普遍安裝在有限的空間,必須體積小、重量輕,也就是輕量化。同時,機器人的高載荷、高回轉精度、高運轉平穩性、高定位速度、高重復定位精度、長壽命、高可靠性的性能,要求配套的軸承必須具備高承載能力、高精度、高剛度、低摩擦力矩、長壽命、高可靠性的性能。
特斯拉人形機器人執行系統中應用多個軸承,比如,其旋轉執行器中使用了角接觸球軸承、交叉滾子軸承,線性執行器使用了球軸承和四點接觸軸承。
絲杠:線性執行器重要部件,模擬人體肌肉功能
絲杠是一種將電機端旋轉運動轉化為直線運動的機械部件,“滾珠/柱絲杠+旋轉電機”的組合應用廣泛。
工業母機多采用滾珠絲杠,承載沖擊更強的滾柱絲杠在人形機器人領域有望得到大規模應用,尤其是螺紋滾柱環繞主絲杠形成行星式布局的行星滾柱絲杠。人形機器人需要具備高承載、耐沖擊等性能,所以,行星滾柱絲杠需要有更大的接觸面積、更大的直線速度、更小的振動和噪音。
人形機器人線性執行器主要采用“電機+行星滾柱絲杠+軸承+傳感器”架構實現,反向行星滾柱絲杠是核心部件之一。
根據《2024人形機器人產業鏈白皮書》,當前,人形機器人的成本結構中,三大執行器(線性執行器、旋轉執行器、靈巧手)占主要零部件價值量的73%,主要由絲杠、無框力矩電機、減速器、力傳感器、空心杯電機及軸承構成。首先是絲杠,為其中的核心零部件之一,約占人形機器人價值量的19%,往后依次為無框力矩電機(16%)、減速器(13%)、傳感器(11%)、空心杯電機(8%)(圖1)。

我們以特斯拉人形機器人為藍本,結合產業中的主流產品及主流方案,測算得出:當前,人形機器人傳感器單體價值量為2.3萬元左右,且觸覺、視覺等領域要求在不斷提高,價值量呈現增加態勢。
視覺、六維力傳感器、觸覺為兼具高價值和高壁壘的方向。從價值量來看,視覺傳感器占到31%,六維力矩傳感器占26%,觸覺傳感器占到13%。
供應鏈降本是行業發展的必然趨勢,按照特斯拉遠期對人形機器人的定價目標,以及近期國產人形機器人的定價,我們認為,未來人形機器人整機成本可能在8萬元左右,甚至更低。這意味著,隨著量產階段的不斷推進,供應鏈各類參與者的報價都將持續下降。未來,人形機器人行業的供應鏈將像汽車一樣,參與者能否低價批量供貨,將成為其核心競爭力。
我們將人形機器人量產分為三個階段:階段一是量產前,產業鏈還不完善,各零部件報價主要參考市場價格;階段二是開始量化,產業鏈還沒有完全成熟,但是各零部件生產工藝改進優化,報價較過往大幅降低;階段三是大批量化生產,產業鏈已經成熟,各零部件按照規模生產行業合理利潤率進行報價。我們預計,零部件未來單價普遍在千元之內甚至更低,但是市場空間將得到幾何級放大。
具體來看,從關節方案選型來看,是選擇線性執行器還是旋轉執行器,負載、成本、精度等為重要考量因素。兩類執行器各具優劣勢,需根據機器人產品定位、綜合成本、工作場景等因素選擇。我們認為,二者的優劣勢仍在變化當中,如絲杠的降本速度有望加快,或新型材料出現會增強減速器的扭矩密度,以及新工藝路線的出現(如磁驅等),這些都會影響本體廠商的選擇。但整體來看,我們認為,線性關節具有精度高、承載力大、傳動效率高等優勢,伴隨著國內絲杠廠商快速降本,未來,其在人形機器人關節模組中的占比將相對提升。
靈巧手、傳感器應用場景不拘泥于人形,有望加速放量。一方面,靈巧手是人形機器人與外界交互的重要執行器,隨著特斯拉發布人形機器人量產展望,靈巧手有望放量,微型絲杠、腱繩模塊和傳感器需求有望大幅增加。另一方面,靈巧手可以不依附人形機器人獨立存在,能夠有效替代電動夾爪等末端執行器,遠期市場容量有望進一步擴大,越來越多的零部件供應商將切入靈巧手領域。
傳感器是具身智能包括人形機器人與物理世界交互的關鍵,是使得具身智能體更智能化、通用化的重要載體。從價值量拆分來看,視覺傳感器、六維力矩傳感器、觸覺傳感器為價格及壁壘俱高的方向。
其中,視覺傳感器具備技術參數要求高、價值量大、競爭格局相對穩定等特點,為確定性較高的方向。
六維力矩傳感器從航天、醫療等行業發展而來,當前正經歷快速降本階段,我們認為,在關注技術積淀的同時,應重視各大企業降本途徑,包括貼片、標定設備的自動化程度,以及規模化生產能力。
觸覺傳感器使用面積有望逐步增大,產品精度要求亦將不斷提升,是具身智能包括人形機器人智能化的重要媒介。當前,壓阻式、電容式、電磁式等技術路徑呈現百花齊放的特征,技術路線尚未收斂,成本、精度、工藝為后續重要觀察方向(圖2)。
