聶艷明 林吳航 董佩杰 梁會 張志剛 鐘夢浩
摘要:NAO機器人是一款可編程人形機器人,集成攝像頭、麥克風、觸碰、超聲波、紅外等多種傳感器,具備對外部環境進行綜合感知和交互的能力。文章基于NAOqi API實現人臉圖像識別與簡單的觸覺感知,借助訊飛語音云和圖靈機器人進行語音識別與理解,結合NAO機器人視覺、聽覺、觸覺等開發多種通道人機交互案例,為基于NAO機器人的多通道交互應用研究奠定基礎。
關鍵詞:人機交互;NAO機器人;NAOqi API;多通道
中圖分類號:R749.94;TP242 文獻標識碼:A 文章編號:1007-9416(2018)04-0078-03
1 引言
人機交互是實現人與計算機對話的技術[1]。當前多通道的人機交互已成為一種新興的人機交互方式。人機交互通道指的是人機交互的途徑。所謂多通道人機交互就是在單一通道交互方式的基礎上,發展融合視覺、觸覺、聽覺、語音和肢體行為的多種通道交互,使人機雙方都能得到及時的反饋[2]。
作為一種可編程人形機器人,NAO機器人(如圖1所示)集成攝像頭、麥克風、觸碰、超聲波、紅外等多種傳感器,具備對外部環境進行綜合感知和交互的能力。在自閉癥醫治、全身運動、多智能系統、自動化、信號處理等領域具有廣泛的應用[1][2]。
2 NAO機器人的人機交互通道
2.1 視覺
在NAO機器人頭部有兩個攝像頭,其分辨率都為640×480,圖像的有效像素為920萬,系統可提供30幀/秒的圖像幀率[6]。在NAO機器人的人機交互過程中,通過攝像頭采集視頻信息流,完成相應處理[7]。
2.2 聽覺
NAO機器人內安裝有四個麥克風,通過利用NAOqi中ALAudioRecorder模塊,實現NAO聽覺功能?!?br>