走路、翻跟斗、跳舞……機器人的“絕活”越來越多,所到之處總有人圍觀。
4月13日,全球首場人形機器人半程馬拉松比賽在北京舉辦,人形機器人再度成為社會焦點。
人形機器人火“出圈”,也引發(fā)了社會各界對具身智能的探討。這一前沿科技的發(fā)展,將對千行百業(yè)及人們的生活產(chǎn)生深遠(yuǎn)影響。
在2025中關(guān)村論壇年會上,一個名叫“俞文峰”的書法表演機器人吸引了很多人的注意:蘸墨、提筆,在宣紙上寫下“中關(guān)村”3個字。
北京清飛科技仿生研究院院長俞科有時會站在書法機器人旁幫忙,他告訴記者,“俞文峰”是自己的曾用名,書法機器人是以他為原型設(shè)計的,“我用孿生機器人實現(xiàn)了小時候沒有完成的夢想”。
“人形機器人是具身智能的一個典型案例,具有智能的感知、執(zhí)行器和靈巧的手。”中國工程院院士、湖南大學(xué)教授、機器人視覺感知與控制技術(shù)國家工程研究中心主任王耀南說。
與傳統(tǒng)AI依賴“堆算力、堆數(shù)據(jù)”不同,具身智能更注重“感知—行動—反饋”的閉環(huán)。正如人類通過實踐積累經(jīng)驗,具身智能體需在真實或虛擬環(huán)境中不斷與環(huán)境互動,逐步提升理解與決策能力。
“漢字智由知與日構(gòu)成,寓意知識與時間經(jīng)驗的結(jié)合,這正是具身智能的核心。”中國科學(xué)院院士、南京大學(xué)黨委書記譚鐵牛從漢字溯源切入,闡釋具身智能的內(nèi)涵。
清華大學(xué)計算機科學(xué)與技術(shù)系教授、中國人工智能學(xué)會副理事長孫富春認(rèn)為,具身智能體需要有環(huán)境交互和任務(wù)生成能力,要具有跨場景、跨任務(wù)、多種操作的能力,還需要有物理的感知、行為能力。
他以“攤煎餅”這個任務(wù)為例,具身智能體不只是能攤餅,還要觀察、判斷餅有沒有攤好,攤好之后再完成其他事情,比如從冰箱里取出牛奶。
近年來,大模型技術(shù)的爆發(fā)式發(fā)展讓具身智能加速與物理實體結(jié)合。王耀南表示:“大模型為人形機器人注入了語言理解、視覺推理和常識認(rèn)知能力,使其從單一任務(wù)邁向相對通用。”
今年,“具身智能”首次被寫入《政府工作報告》。中國工程院院士、清華大學(xué)教授、中國人工智能學(xué)會理事長戴瓊海認(rèn)為,這標(biāo)志著人工智能與實體經(jīng)濟融合進入了嶄新階段,具身智能已成為我國培育未來產(chǎn)業(yè)的重要方向以及全球科技競爭的關(guān)鍵領(lǐng)域。
“具身智能使智能體能夠在真實環(huán)境中感知、理解和行動,為解決復(fù)雜的現(xiàn)實問題提供了全新的思路和方法。”戴瓊海說。
在他看來,具身智能具有廣泛的應(yīng)用前景。比如,在工業(yè)領(lǐng)域,具身智能機器人可以實現(xiàn)更靈活和高效的生產(chǎn)操作,提高生產(chǎn)效率和質(zhì)量。在醫(yī)療領(lǐng)域,具身智能設(shè)備可以輔助醫(yī)生進行手術(shù)、康復(fù)治療等工作。尤其是在老齡化社會,具身智能的發(fā)展將為老年人提供重要幫助。在教育領(lǐng)域,具身智能機器人可以為學(xué)生提供互動的學(xué)習(xí)和體會。
“隨著人工智能技術(shù)的不斷發(fā)展和創(chuàng)新,具身智能的應(yīng)用場景將不斷拓展,為各行各業(yè)帶來前所未有的變革和機遇。”戴瓊海說。
但是,具身智能機器人并不一定是人形的。“它可以根據(jù)工作任務(wù)和工作環(huán)境決定形態(tài)。比如,在水里最好是魚的結(jié)構(gòu),在空中最好是鳥的結(jié)構(gòu)。”孫富春說。
北京大學(xué)計算機學(xué)院教授、多媒體信息處理全國重點實驗室主任黃鐵軍說,人形機器人的發(fā)展是一件長遠(yuǎn)的事情,我們要發(fā)揮創(chuàng)造力,運用人工智能做成各種形態(tài)的產(chǎn)品,解決企業(yè)生產(chǎn)和我們生活中各種問題,或者滿足我們未來的需要。
具身智能的產(chǎn)業(yè)化布局正在加速。
北京市今年發(fā)布了《北京具身智能科技創(chuàng)新與產(chǎn)業(yè)培育行動計劃(2025—2027年)》,提出力爭到2027年打造具有國際影響力具身智能產(chǎn)業(yè)生態(tài)。
今年2月份,中關(guān)村(海淀)具身智能創(chuàng)新產(chǎn)業(yè)園正式授牌,已經(jīng)吸引了一批具身智能企業(yè)入駐。具身智能產(chǎn)業(yè)鏈上游的傳感器、芯片企業(yè),中游的機器人本體制造商,以及下游的場景應(yīng)用開發(fā)商正加速協(xié)同。
具身智能的發(fā)展當(dāng)前備受關(guān)注,前景廣闊,但也面臨一些挑戰(zhàn)。北京市科委、中關(guān)村管委會信息科技處處長韓健分析,具身智能還處在一個混沌初開的時期,技術(shù)路線尚未統(tǒng)一。能用、好用的高質(zhì)量具身智能數(shù)據(jù)集成是核心的發(fā)展瓶頸,具身智能應(yīng)用場景的挖掘和商業(yè)模式的確立仍需時間探索。此外,具身智能機器人攻關(guān)是一個生態(tài)工程,但目前機制尚未完善,各環(huán)節(jié)的協(xié)作還不夠。
“發(fā)展具身智能一定要建立跨部門、跨地域、跨行業(yè)協(xié)作機制,要統(tǒng)籌各類規(guī)劃計劃的實施,做到關(guān)聯(lián)有序,實實在在落地。”譚鐵牛強調(diào)。
他建議,推動學(xué)科融合和前沿布局,創(chuàng)機會、搭平臺支持多學(xué)科交叉,同時加強基礎(chǔ)設(shè)施建設(shè),包括數(shù)據(jù)平臺、算力建設(shè)等。
“具身智能是發(fā)展新質(zhì)生產(chǎn)力的重要引擎。”譚鐵牛表示,具身智能既是學(xué)科交叉的新前沿,也是推動人工智能賦能千行百業(yè)的新靶點,應(yīng)理性務(wù)實推動其創(chuàng)新發(fā)展。