中國科學院沈陽自動化研究所與英國愛丁堡機器人中心合作研究取得新進展,提出了一種在動態、非結構環境下基于深度強化學習的移動機械臂自主作業方法,將最新的人工智能學習理論成功應用于真實的復雜移動機械臂控制。科研團隊聯合利用神經網絡構建了一種機器人整體強化學習控制模型,采用深度學習方法對機器人相機獲得的環境與目標信息進行處理,然后將感知信息與機器人當前狀態作為系統輸入,對機器人的整體行為進行自主控制。通過仿真與實際環境中的交互學習與訓練,最終實現了在真實環境下的移動機械臂自主作業,為深度強化學習應用于更為復雜的水下浮游基座機器人系統開展自主作業研究奠定了基礎。(中科院網站)