基于NAO機器人的多種通道人機交互研究與案例實現

2018-08-18 08:23:26聶艷明林吳航董佩杰梁會張志剛鐘夢浩

數字技術與應用 2018年4期

聶艷明林吳航董佩杰梁會張志剛鐘夢浩

摘要：NAO機器人是一款可編程人形機器人，集成攝像頭、麥克風、觸碰、超聲波、紅外等多種傳感器，具備對外部環境進行綜合感知和交互的能力。文章基于NAOqi API實現人臉圖像識別與簡單的觸覺感知，借助訊飛語音云和圖靈機器人進行語音識別與理解，結合NAO機器人視覺、聽覺、觸覺等開發多種通道人機交互案例，為基于NAO機器人的多通道交互應用研究奠定基礎。

關鍵詞：人機交互；NAO機器人；NAOqi API；多通道

中圖分類號：R749.94；TP242 文獻標識碼：A 文章編號：1007-9416（2018）04-0078-03

1 引言

人機交互是實現人與計算機對話的技術[1]。當前多通道的人機交互已成為一種新興的人機交互方式。人機交互通道指的是人機交互的途徑。所謂多通道人機交互就是在單一通道交互方式的基礎上，發展融合視覺、觸覺、聽覺、語音和肢體行為的多種通道交互，使人機雙方都能得到及時的反饋[2]。

作為一種可編程人形機器人，NAO機器人（如圖1所示）集成攝像頭、麥克風、觸碰、超聲波、紅外等多種傳感器，具備對外部環境進行綜合感知和交互的能力。在自閉癥醫治、全身運動、多智能系統、自動化、信號處理等領域具有廣泛的應用[1][2]。

2 NAO機器人的人機交互通道

2.1 視覺

在NAO機器人頭部有兩個攝像頭，其分辨率都為640×480，圖像的有效像素為920萬，系統可提供30幀/秒的圖像幀率[6]。在NAO機器人的人機交互過程中，通過攝像頭采集視頻信息流，完成相應處理[7]。

2.2 聽覺

NAO機器人內安裝有四個麥克風，通過利用NAOqi中ALAudioRecorder模塊，實現NAO聽覺功能?！?br>

登錄APP查看全文

數字技術與應用 2018年4期

數字技術與應用的其它文章: 淺談AWA DVOR/DME設備故障及排除; HTML5技術在新媒體上的應用; 量子計算機的進展與方向; 基于人工智能在計算機網絡技術中的應用探析; 分層技術在計算機軟件開發中的應用探討; 三正則二部網絡的結構