摘要:從仿人機器人任務(wù)實現(xiàn)過程出發(fā),提出了一種基于任務(wù)的分層混合式仿人機器人體系結(jié)構(gòu)。在該體系結(jié)構(gòu)下,多個agent分別被用來模擬人的各主要器官的功能,并模仿人類的行為方式實現(xiàn)了任務(wù)實現(xiàn)過程中的三個主要部分:人機交互、導(dǎo)航和對象操作。該體系結(jié)構(gòu)對于高智能水平的仿人機器人的研究和開發(fā)具有重要意義。
關(guān)鍵詞:仿人機器人; 體系結(jié)構(gòu); 人機交互; 導(dǎo)航
中圖分類號:TP24文獻標(biāo)志碼:A
文章編號:1001-3695(2008)05-1400-02
機器人體系結(jié)構(gòu)是定義一個機器人系統(tǒng)的功能模塊及模塊之間邏輯關(guān)系的結(jié)構(gòu)框架,是實現(xiàn)整個機器人系統(tǒng)的基礎(chǔ)。體系結(jié)構(gòu)既是機器人本體的物理框架,又是機器人智能的邏輯載體[1]。因此體系結(jié)構(gòu)設(shè)計是機器人研究首先要考慮的問題,體系結(jié)構(gòu)設(shè)計得合理與否直接決定了機器人系統(tǒng)的整體性能。
作為未來人類生活和工作中的伙伴和助手,仿人機器人不僅要在多變的環(huán)境下完成各種復(fù)雜的任務(wù),而且仿人機器人的外形和行為方式都應(yīng)該盡可能地接近人的外形和行為方式。因此,仿人機器人的體系結(jié)構(gòu)要比普通機器人復(fù)雜和精巧得多,而如何設(shè)計一個合理的體系結(jié)構(gòu)就成為仿人機器人研究人員要解決的一個關(guān)鍵問題。
1移動機器人體系結(jié)構(gòu)研究
經(jīng)典的移動機器人體系結(jié)構(gòu)主要有三種:慎思式體系結(jié)構(gòu)、反應(yīng)式體系結(jié)構(gòu)和混合式體系結(jié)構(gòu)。
慎思式體系結(jié)構(gòu)由感知、規(guī)劃和執(zhí)行三個串聯(lián)的模塊構(gòu)成,具有很好的規(guī)劃推理能力,問題求解方式與人類思考問題的方式相似。基于慎思式體系結(jié)構(gòu)的移動機器人可以具有很高的智能水平。第一個移動機器人Shakey就是基于慎思式體系結(jié)構(gòu)的[2]。由于傳感器的誤差、環(huán)境的不確定性等因素的影響,使得慎思式體系結(jié)構(gòu)的移動機器人在反應(yīng)靈敏性、可靠性和魯棒性方面比較差。
反應(yīng)式體系結(jié)構(gòu)下,移動機器人行為基于感知與執(zhí)行之間的映射關(guān)系,無須構(gòu)建全局環(huán)境模型,在局部行動上可顯示出很靈活的反應(yīng)能力[3]。缺點是反應(yīng)式體系結(jié)構(gòu)缺乏全局環(huán)境信息,對于長遠的全局性目標(biāo)跟蹤顯得缺少主動性,目的性較差。
隨著對智能移動機器人研究的不斷深入,要求機器人能夠在更加復(fù)雜的環(huán)境下來完成各種任務(wù),對移動機器人智能水平提出了更高的要求。單純的基于知識的分層結(jié)構(gòu)或基于行為的反應(yīng)結(jié)構(gòu)已無法實現(xiàn)更加智能化的移動機器人,而結(jié)合兩者優(yōu)點的混合式體系結(jié)構(gòu)就成為了智能移動機器人體系結(jié)構(gòu)研究的熱點[4]。
近年來,基于多agent的分布式體系結(jié)構(gòu)成為移動機器人體系結(jié)構(gòu)研究中的熱點。Agent的自主性、自治性、主動性以及通信能力與移動機器人系統(tǒng)中的功能模塊性質(zhì)相似,將多agent理論引入移動機器人的體系結(jié)構(gòu)設(shè)計,用多個agent來實現(xiàn)機器人各系統(tǒng)模塊的功能,從而實現(xiàn)了基于多agent的移動機器人體系結(jié)構(gòu)[5,6]。
2基于任務(wù)的分層混合式仿人機器人體系結(jié)構(gòu)
2.1仿人機器人功能分析
作為未來人類生活和工作環(huán)境中的伙伴和助手,仿人機器人不僅需要模仿人的外形,如頭部、雙手、雙腳和軀干等,更重要的是能夠模擬人的大腦、眼睛、耳朵和嘴等器官的功能。圖1為基于多agent的仿人機器人系統(tǒng)結(jié)構(gòu)圖[7]。圖中ABrain、AEye、AEar、AMouth、AHand、ALeg分別是模擬人的腦、眼、耳、嘴、手和腳等功能的agent。
圖1中,模擬人腦功能的ABrain是仿人機器人的核心功能模塊,由四個子功能模塊構(gòu)成,如圖2所示。
感覺中樞(perception center,PC)是模擬人類丘腦功能的感覺中樞模型。PC接收來自各種感受器,如AEye、AEar及其他傳感器的數(shù)據(jù),是各種感知數(shù)據(jù)的信息處理中心,負責(zé)對不同模態(tài)的數(shù)據(jù)進行信息融合。
思維中樞(thinking center,TC)是模擬人類大腦功能的思維中樞模型。TC由左腦和右腦兩部分組成。其中左腦負責(zé)根據(jù)感覺中樞提供的知識進行分析、推理、規(guī)劃、決策,并對感覺中樞和行為中樞進行協(xié)調(diào)控制;右腦負責(zé)知識的存儲,由一個常理知識庫和一個全局環(huán)境模型數(shù)據(jù)庫組成。左腦處理后的新知識可以存儲到右腦中,從而實現(xiàn)學(xué)習(xí)功能;右腦負責(zé)對左腦提高先驗知識。左腦和右腦協(xié)同工作。
行為中樞(behavior center,BC)是模擬人類小腦功能的行為中樞模型。BC的主要功能是協(xié)調(diào)雙手和雙腿的運動和行為,保持運動的穩(wěn)定和平衡,對整體的運動和姿態(tài)進行協(xié)調(diào)控制。
以上各功能模塊均模仿了人的某一功能器官的作用。因而,具有以上功能模塊的仿人機器人有可能具有接近人類的智能水平,從而有可能幫助人來完成各種繁瑣、復(fù)雜的日常任務(wù)。
2.2基于任務(wù)的仿人機器人分層體系結(jié)構(gòu)
能否自然、高效地完成人類生活或工作中的各種日常任務(wù)是衡量仿人機器人智能水平和有效性的重要標(biāo)準(zhǔn)。仿人機器人的任務(wù)實現(xiàn)過程可分為人機交互、導(dǎo)航和對象操作三個階段。這三個階段之間具有明顯不同的特征:人機交互階段是仿人機器人與人之間的交互過程,目的是確定任務(wù)屬性、當(dāng)前位姿及目標(biāo)位姿;導(dǎo)航階段是仿人機器人與所處環(huán)境之間的交互過程,任務(wù)是快速、安全地從當(dāng)前位姿運動到目標(biāo)位姿;對象操作階段是仿人機器人與目標(biāo)物體之間的交互過程,目標(biāo)是安全可靠地操作目標(biāo)對象,完成任務(wù)。三個階段具有不同的工作方式,且具有時間上的先后順序。因此,本文提出了一種基于任務(wù)的分層混合式仿人機器人體系結(jié)構(gòu),總體框圖如圖3所示。
人機交互、導(dǎo)航和對象操作功能均可以利用圖1所示的agent來實現(xiàn),以下是各層功能的具體實現(xiàn)。
1)人機交互層人機交互過程通常是仿人機器人任務(wù)實現(xiàn)過程的第一步。在日常生活中,人主要通過對話或手
勢向仿人機器人指派任務(wù)。如果是對話信息,仿人機器人通過AEar將數(shù)據(jù)送到PC進行語音識別處理,PC處理后的語音信息通過TC的自然語音識別系統(tǒng)理解用戶任務(wù)要求,然后仿人機器人通過行為中樞BC中的語音合成模塊對用戶進行應(yīng)答;對于手勢信息,仿人機器人通過AEye將數(shù)據(jù)送到PC進行手勢識別,TC根據(jù)PC處理后的信息計算出應(yīng)答手勢,并通過BC控制AHand對用戶手勢進行應(yīng)答。圖4是人機交互層結(jié)構(gòu)框圖。
2)導(dǎo)航層人機交互后,仿人機器人理解了用戶的任務(wù)需求以及目標(biāo)物體位置,接下來的任務(wù)是如何安全快速地到達目標(biāo)位置。在導(dǎo)航階段,仿人機器人首先根據(jù)任務(wù)要求和TC中的全局環(huán)境模型進行任務(wù)規(guī)劃,將復(fù)雜任務(wù)分解為容易實現(xiàn)的子任務(wù)的序列,并對每個子任務(wù)計算出靜態(tài)情況下的最優(yōu)路徑。在運動過程中,傳感器獲取的環(huán)境數(shù)據(jù)經(jīng)PC處理后送到TC,如果TC計算出運動方向一定距離內(nèi)存在動態(tài)障礙物,則TC直接下指令到BC,采取避障行為。傳感器信息的主要作用是機器人定位,TC根據(jù)定位信息以及靜態(tài)路徑規(guī)劃路線參數(shù)計算下一時刻的運動速度和方向,并將參數(shù)送到BC。BC協(xié)調(diào)ALeg及全身的運動,從而實現(xiàn)到目標(biāo)的運動規(guī)劃。導(dǎo)航層結(jié)構(gòu)框圖如圖5所示。
3)對象操作層能夠端茶倒水、遞送文件是辦公型仿人機器人的基本任務(wù)要求,這些任務(wù)要求機器人具有良好的對象操作能力。在對象操作過程中,PC將AEye檢測到的圖像信息處理后送到TC,TC通過BC來控制AHand對目標(biāo)物體的操作過程。圖6是仿人機器人的對象操作層結(jié)構(gòu)框圖。
3結(jié)束語
本文提出了一種基于任務(wù)的分層混合式仿人機器人體系結(jié)構(gòu)。該體系結(jié)構(gòu)不僅用多agent模擬了人的主要器官的功能,而且模仿人類的行為方式實現(xiàn)了任務(wù)實現(xiàn)過程中的三個主要內(nèi)容:人機交互、導(dǎo)航和對象操作。該體系結(jié)構(gòu)對于高智能水平的仿人機器人的研究與開發(fā)具有重要意義。
參考文獻:
[1]劉海波,顧國昌,張國印. 智能機器人體系結(jié)構(gòu)分類研究[J]. 哈爾濱工程大學(xué)學(xué)報,2003,24(6):664-668.
[2]NILSSON N J. Shakey the robot[R]. Menlo Park: SRI Internatio-nal, 1984.
[3]BROOKS R A. A robust layered control system for a mobile robot[J].IEEE Journal of Robotics and Automation, 1986,2(1):14-23.
[4]GAT E. On three-layer architectures[C]//KORTENKAMP D, BONNASSO R P, MURRPHY R. Artificial Intelligence and Mobile Robots.[S.l.]: MIT/AAAI Press, 1998:195-210.
[5]王海,田彥濤. 基于行為的分布式多智能體系統(tǒng)[J]. 吉林大學(xué)學(xué)報:工學(xué)版, 2002,32(1):93-97.
[6]李智軍,羅青,呂恬生,等.基于混合結(jié)構(gòu)的機器人agent控制結(jié)構(gòu)研究[J]. 計算機工程與應(yīng)用, 2003,39(21):90-93.
[7]TU Xu-yan. AI, AL and robotics[C]//Proc of FIRA Robot World Congress. Seoul:[s.n.], 2002:1-5.
“本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文”