インテリジェントロボットを実現するための主要な課題は、一般的なユーザーが簡単かつ直感的にプログラミングできるようにするために、認知能力をロボットに提供することです。そのようなプログラミングの1つの方法は、インタラクティブなデモンストレーションによって作業タスクを教えることです。これをユーザーにとって効果的かつ便利にするために、マシンは共通の注意の焦点を確立し、話し言葉の指示、視覚、ジェスチャーコマンドなどの非言語的手がかりを使用および統合できる必要があります。統計的手法、ニューラルネットワーク、有限状態マシンを統合したシステムにマンマシンインタラクションによる把握タスクを指示するためのハイブリッドアーキテクチャの構築の進捗状況を報告します。このシステムは、視覚的注意とジェスチャー指示のためのGRAVISロボットと、音声認識と言語解釈のためのインテリジェントインターフェイス、およびオブジェクトの器用なロボット操作に関するマルチモーダルタスク指向のマンマシン通信を可能にするモダリティフュージョンモジュールを組み合わせています。
A major challenge for the realization of intelligent robots is to supply them with cognitive abilities in order to allow ordinary users to program them easily and intuitively. One way of such programming is teaching work tasks by interactive demonstration. To make this effective and convenient for the user, the machine must be capable to establish a common focus of attention and be able to use and integrate spoken instructions, visual perceptions, and non-verbal clues like gestural commands. We report progress in building a hybrid architecture that combines statistical methods, neural networks, and finite state machines into an integrated system for instructing grasping tasks by man-machine interaction. The system combines the GRAVIS-robot for visual attention and gestural instruction with an intelligent interface for speech recognition and linguistic interpretation, and an modality fusion module to allow multi-modal task-oriented man-machine communication with respect to dextrous robot manipulation of objects.