摘要:從仿人機器人任務實現過程出發,提出了一種基于任務的分層混合式仿人機器人體系結構。在該體系結構下,多個agent分別被用來模擬人的各主要器官的功能,并模仿人類的行為方式實現了任務實現過程中的三個主要部分:人機交互、導航和對象操作。該體系結構對于高智能水平的仿人機器人的研究和開發具有重要意義。
關鍵詞:仿人機器人; 體系結構; 人機交互; 導航
中圖分類號:TP24文獻標志碼:A
文章編號:1001-3695(2008)05-1400-02
機器人體系結構是定義一個機器人系統的功能模塊及模塊之間邏輯關系的結構框架,是實現整個機器人系統的基礎。體系結構既是機器人本體的物理框架,又是機器人智能的邏輯載體[1]。因此體系結構設計是機器人研究首先要考慮的問題,體系結構設計得合理與否直接決定了機器人系統的整體性能。
作為未來人類生活和工作中的伙伴和助手,仿人機器人不僅要在多變的環境下完成各種復雜的任務,而且仿人機器人的外形和行為方式都應該盡可能地接近人的外形和行為方式。因此,仿人機器人的體系結構要比普通機器人復雜和精巧得多,而如何設計一個合理的體系結構就成為仿人機器人研究人員要解決的一個關鍵問題。
1移動機器人體系結構研究
經典的移動機器人體系結構主要有三種:慎思式體系結構、反應式體系結構和混合式體系結構。
慎思式體系結構由感知、規劃和執行三個串聯的模塊構成,具有很好的規劃推理能力,問題求解方式與人類思考問題的方式相似。基于慎思式體系結構的移動機器人可以具有很高的智能水平。第一個移動機器人Shakey就是基于慎思式體系結構的[2]。由于傳感器的誤差、環境的不確定性等因素的影響,使得慎思式體系結構的移動機器人在反應靈敏性、可靠性和魯棒性方面比較差。
反應式體系結構下,移動機器人行為基于感知與執行之間的映射關系,無須構建全局環境模型,在局部行動上可顯示出很靈活的反應能力[3]。缺點是反應式體系結構缺乏全局環境信息,對于長遠的全局性目標跟蹤顯得缺少主動性,目的性較差。
隨著對智能移動機器人研究的不斷深入,要求機器人能夠在更加復雜的環境下來完成各種任務,對移動機器人智能水平提出了更高的要求。單純的基于知識的分層結構或基于行為的反應結構已無法實現更加智能化的移動機器人,而結合兩者優點的混合式體系結構就成為了智能移動機器人體系結構研究的熱點[4]。
近年來,基于多agent的分布式體系結構成為移動機器人體系結構研究中的熱點。Agent的自主性、自治性、主動性以及通信能力與移動機器人系統中的功能模塊性質相似,將多agent理論引入移動機器人的體系結構設計,用多個agent來實現機器人各系統模塊的功能,從而實現了基于多agent的移動機器人體系結構[5,6]。
2基于任務的分層混合式仿人機器人體系結構
2.1仿人機器人功能分析
作為未來人類生活和工作環境中的伙伴和助手,仿人機器人不僅需要模仿人的外形,如頭部、雙手、雙腳和軀干等,更重要的是能夠模擬人的大腦、眼睛、耳朵和嘴等器官的功能。圖1為基于多agent的仿人機器人系統結構圖[7]。圖中ABrain、AEye、AEar、AMouth、AHand、ALeg分別是模擬人的腦、眼、耳、嘴、手和腳等功能的agent。
圖1中,模擬人腦功能的ABrain是仿人機器人的核心功能模塊,由四個子功能模塊構成,如圖2所示。
感覺中樞(perception center,PC)是模擬人類丘腦功能的感覺中樞模型。PC接收來自各種感受器,如AEye、AEar及其他傳感器的數據,是各種感知數據的信息處理中心,負責對不同模態的數據進行信息融合。
思維中樞(thinking center,TC)是模擬人類大腦功能的思維中樞模型。TC由左腦和右腦兩部分組成。其中左腦負責根據感覺中樞提供的知識進行分析、推理、規劃、決策,并對感覺中樞和行為中樞進行協調控制;右腦負責知識的存儲,由一個常理知識庫和一個全局環境模型數據庫組成。左腦處理后的新知識可以存儲到右腦中,從而實現學習功能;右腦負責對左腦提高先驗知識。左腦和右腦協同工作。
行為中樞(behavior center,BC)是模擬人類小腦功能的行為中樞模型。BC的主要功能是協調雙手和雙腿的運動和行為,保持運動的穩定和平衡,對整體的運動和姿態進行協調控制。
以上各功能模塊均模仿了人的某一功能器官的作用。因而,具有以上功能模塊的仿人機器人有可能具有接近人類的智能水平,從而有可能幫助人來完成各種繁瑣、復雜的日常任務。
2.2基于任務的仿人機器人分層體系結構
能否自然、高效地完成人類生活或工作中的各種日常任務是衡量仿人機器人智能水平和有效性的重要標準。仿人機器人的任務實現過程可分為人機交互、導航和對象操作三個階段。這三個階段之間具有明顯不同的特征:人機交互階段是仿人機器人與人之間的交互過程,目的是確定任務屬性、當前位姿及目標位姿;導航階段是仿人機器人與所處環境之間的交互過程,任務是快速、安全地從當前位姿運動到目標位姿;對象操作階段是仿人機器人與目標物體之間的交互過程,目標是安全可靠地操作目標對象,完成任務。三個階段具有不同的工作方式,且具有時間上的先后順序。因此,本文提出了一種基于任務的分層混合式仿人機器人體系結構,總體框圖如圖3所示。
人機交互、導航和對象操作功能均可以利用圖1所示的agent來實現,以下是各層功能的具體實現。
1)人機交互層人機交互過程通常是仿人機器人任務實現過程的第一步。在日常生活中,人主要通過對話或手
勢向仿人機器人指派任務。如果是對話信息,仿人機器人通過AEar將數據送到PC進行語音識別處理,PC處理后的語音信息通過TC的自然語音識別系統理解用戶任務要求,然后仿人機器人通過行為中樞BC中的語音合成模塊對用戶進行應答;對于手勢信息,仿人機器人通過AEye將數據送到PC進行手勢識別,TC根據PC處理后的信息計算出應答手勢,并通過BC控制AHand對用戶手勢進行應答。圖4是人機交互層結構框圖。
2)導航層人機交互后,仿人機器人理解了用戶的任務需求以及目標物體位置,接下來的任務是如何安全快速地到達目標位置。在導航階段,仿人機器人首先根據任務要求和TC中的全局環境模型進行任務規劃,將復雜任務分解為容易實現的子任務的序列,并對每個子任務計算出靜態情況下的最優路徑。在運動過程中,傳感器獲取的環境數據經PC處理后送到TC,如果TC計算出運動方向一定距離內存在動態障礙物,則TC直接下指令到BC,采取避障行為。傳感器信息的主要作用是機器人定位,TC根據定位信息以及靜態路徑規劃路線參數計算下一時刻的運動速度和方向,并將參數送到BC。BC協調ALeg及全身的運動,從而實現到目標的運動規劃。導航層結構框圖如圖5所示。
3)對象操作層能夠端茶倒水、遞送文件是辦公型仿人機器人的基本任務要求,這些任務要求機器人具有良好的對象操作能力。在對象操作過程中,PC將AEye檢測到的圖像信息處理后送到TC,TC通過BC來控制AHand對目標物體的操作過程。圖6是仿人機器人的對象操作層結構框圖。
3結束語
本文提出了一種基于任務的分層混合式仿人機器人體系結構。該體系結構不僅用多agent模擬了人的主要器官的功能,而且模仿人類的行為方式實現了任務實現過程中的三個主要內容:人機交互、導航和對象操作。該體系結構對于高智能水平的仿人機器人的研究與開發具有重要意義。
參考文獻:
[1]劉海波,顧國昌,張國印. 智能機器人體系結構分類研究[J]. 哈爾濱工程大學學報,2003,24(6):664-668.
[2]NILSSON N J. Shakey the robot[R]. Menlo Park: SRI Internatio-nal, 1984.
[3]BROOKS R A. A robust layered control system for a mobile robot[J].IEEE Journal of Robotics and Automation, 1986,2(1):14-23.
[4]GAT E. On three-layer architectures[C]//KORTENKAMP D, BONNASSO R P, MURRPHY R. Artificial Intelligence and Mobile Robots.[S.l.]: MIT/AAAI Press, 1998:195-210.
[5]王海,田彥濤. 基于行為的分布式多智能體系統[J]. 吉林大學學報:工學版, 2002,32(1):93-97.
[6]李智軍,羅青,呂恬生,等.基于混合結構的機器人agent控制結構研究[J]. 計算機工程與應用, 2003,39(21):90-93.
[7]TU Xu-yan. AI, AL and robotics[C]//Proc of FIRA Robot World Congress. Seoul:[s.n.], 2002:1-5.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”