3月30日,2025中關村論壇年會平行論壇之一—中國具身智能大會開幕。會上宣布,北京市將以打造具有全球影響力的具身智能創新策源地和產業發展增長極為主線,到2027年,原始創新能力顯著提升,基礎設施建設逐步完善,場景規模不斷擴大,產業生態持續優化。與此同時,具身智能產業園已搭建,北京具身智能協同創新矩陣正式激活。
商業化落地前期的關鍵階段
什么是具身智能?業界普遍且形象地將其比喻為“大腦”,不僅指揮身體行動,還通過身體與環境的交互感知和學習,動態適應外界變化。
在清華大學教授、CAAI副理事長孫富春看來,具身智能的智能體需要具備環境交互與任務生成的能力;智能體具備跨場景、跨任務、多種操作的能力;最核心在于,智能體的感知與行為需要具備認知與發育的能力。
“具身智能使智能體能夠在真實環境中感知、理解和行動,為解決復雜的現實問題提供了全新的思路和方法。這種新的研究視角,不僅為人工智能的發展帶來新的思路和方法,也為解決許多實際問題提供新途徑。”國務院參事、中國工程院院士、清華大學信息科學技術學院院長、CAAI理事長戴瓊海表示。
在人工智能技術持續突破的浪潮中,具身智能正從單點突破邁向產業協同,開啟生態化發展新階段。回顧過去,從語言處理到智能對話,從圖像識別到視頻創作,從自動駕駛到智能機器人,人工智能技術正在深刻改變著人們的生活和工作方式。而具身智能作為人工智能的前沿方向,更是展現出巨大的應用前景。如今,其主要落地方向包括醫療、教育、制造等眾多領域。
不過需要認識到,具身智能目前整體仍處于發展的初期階段。北京市科委、中關村管委會信息科技處處長韓健表示,從技術發展看,具身智能還處在混沌初開、百家爭鳴的時期,技術路線尚未統一;從數據資源看,“能用”“好用”的高質量具身智能數據集成為核心發展瓶頸;從落地場景看,具身智能應用場景的挖掘和商業模式的確立仍需時間探索;從產業生態看,具身機器人攻關是一個生態工程,目前協同機制尚未完善,各環節協作不足。
北京打造具身智能產業高地
在今年全國“兩會”中,“具身智能”首次被寫入政府工作報告,正式上升為國家戰略。“建立未來產業投入增長機制,培育生物制造、量子科技、具身智能、6G等未來產業。”這標志著人工智能與實體經濟深度融合進入新階段,具身智能已成為我國培育未來產業的重要方向以及全球科技競合的關鍵領域。
值得注意的是,目前北京市已成為引領全國人工智能高質量發展的“領頭羊”,并已在具身智能領域儲備了良好的發展基礎。2024年,北京市人工智能核心產業規模近3500億元,相關企業超過2400家,占全國近一半。
結合產業發展趨勢及本市資源優勢,北京市于今年2月在全國率先發布《北京具身智能科技創新與產業培育行動計劃》,到2027年,北京有望成為全球具身智能產業高地,原始創新能力顯著提升,基礎設施建設逐步完善,場景規模不斷擴大,產業生態持續優化。
為加速具身智能領域技術創新和產業賦能,去年底,北京市科委、中關村管委會系統布局5家具身智能領域市重點實驗室,以中科院、清華、北航、北工大、北交為創新基座,國家電網、京能集團等為行業應用賦能平臺,構建集技術創新—場景落地—產業培育為一體的多維協作創新網絡。
作為北京國際科技創新中心核心區,海淀區發展人工智能當仁不讓。據北京市海淀區委副書記楊仁全介紹,海淀區于2024年4月率先發布全國首個具身智能三年行動方案,今年2月落地全國首個具身智能創新產業園。
在2025中國具身智能大會上,“北京具身智能協同創新矩陣”正式激活,并以矩陣為創新原點,加速構建具身智能產學研協同創新生態格局。
關于未來的不同聲音
“具身智能預計在15年左右,可以代替70%的人類行為。”對于行業的未來,孫富春這樣預測。
對于處在初級階段、朝著大規模商業化邁進的具身智能的下一步,業界有著許多不同聲音。上海交通大學特聘教授、人工智能研究院副院長馬利莊在接受采訪時表示,人形機器人或是“終極目標”;上海交通大學教授、穹徹智能聯合創始人盧策吾則認為,不能用目前的眼光去衡量具身智能的快速迭代過程,當某個關鍵技術點實現突破,相應的即會迎來一批新的落地場景。
中國人工智能學會具身智能專委會從技術角度總結了“具身智能十五大重點方向”:分別為多模態具身感知、具身自主學習、具身大模型、具身世界模型構建、具身操作、具身導航與路徑規劃、具身人機協同、群體具身智能等。
為推動具身智能的健康發展,戴瓊海建議,一方面,注重多學科交叉,包括計算機科學、控制科學、認知科學、機器人學等。只有加強多學科之間的交流與合作、整合各學科的優勢資源,才能推動具身智能的創新發展。鼓勵不同學科的科研人員相互學習、相互借鑒,共同攻克具身智能領域的關鍵科學問題和技術難題。
王海峰
大模型帶來通用人工智能曙光
近幾年大模型出現,尤其是現在大模型的通用性越來越好,一個大模型可以適用于很多不同的領域,最多針對領域數據做一點微調或者做一點檢索增強等,就可以把一個領域問題解決得很好。從人工到自動,從算法通用性越來越好到模型通用性越來越好,也讓我們逐漸看到了通用人工智能的曙光。
怎么看通用人工智能?技術的通用性和能力的全面性很重要。
技術的通用性,可以理解為不管是不同的任務、不同的語言、不同的模態,還是不同的應用場景,通用性都已經越來越好了。能力的全面性,模型的能力不只有生成,不斷分析人工智能各方面的能力后,我們發現其中有四項能力非常重要、非常基礎,就是理解、生成、邏輯和記憶。
李開復
大模型迭代進入“AI教AI”時代
Scaling"Law(規模定律)正從預訓練階段轉向推理階段,也就是慢思考模式。過往預訓練階段的Scaling"Law是指:有更多的GPU(圖形處理器)、更多的數據,模型就可以變得更聰明,但目前看其增長趨勢放緩了。新的慢思考Scaling"Law是指:模型思考的時間更長,就會得出更優質的結果。目前看來,慢思考Scaling"Law下,模型性能的成長速度非常快,而且還有很大的增長空間。
值得關注的是,現在進入了“AI教AI”的時代,模型迭代的速度從兩年縮短到3個月。一個重要的原因就是現在很大程度上已經不再單單依靠人來發明新算法、發明模型架構,而是AI借由慢思考具備了反思的能力,能夠自我迭代、自我進步,也就是“AI教AI”,AI進入到自我演進范式。
王仲遠
具身智能成機器人2.0時代重要特征
大語言模型從實驗室走向產業界,有可能推動人工智能向通用人工智能的時代發展。因為大語言模型和多模態大模型的發展,進一步推動機器人從1.0時代向2.0時代發展。人工智能與機器人有了交匯點。機器人2.0時代,具身智能就是最重要的特征。
當前具身智能的發展遇到很多瓶頸,首先硬件依然不夠成熟,成本比較高,具身數據比較缺乏,導致模型的能力偏弱。在應用上,模型能力不足,又導致落地困難,形成了具身智能發展的循環悖論。要破解這些挑戰,需要每個環節都去突破。比如本體公司需要不斷降低硬件成本;數據方面需要多方共建,構建開放共享的數據生態;應用方面需要本體公司、模型公司和產業各方一起尋找最合適的具身智能應用場景。