arXiv reaDer
身体化されたエージェントのための多感覚洞察のためのフレームワーク
A Framework for Multisensory Foresight for Embodied Agents
ロボット、ドローン、自動運転車などの学習エージェントにとって、将来の感覚状態を予測することは非常に重要です。この論文では、複数の感覚モダリティを探索的アクションと組み合わせ、この問題に対処するための予測ニューラルネットワークアーキテクチャを提案します。ほとんどの既存のアプローチは、手動で注釈が付けられた大規模なデータセットに依存するか、単一のモダリティとして視覚データのみを使用します。対照的に、ここで紹介する教師なし方法では、将来の視覚フレームを予測するためにマルチモーダル知覚を使用します。その結果、提案されたモデルはより包括的であり、環境の時空間ダイナミクスをより適切にキャプチャでき、より正確な視覚的フレーム予測につながります。私たちのフレームワークの他の目新しさは、将来の触覚、音声、および触覚信号を予測するための専用のサブネットワークの使用です。フレームワークは、ヒューマノイドロボットで4つの感覚モダリティ(視覚、触覚、音声、触覚)を含むデータセットを使用してテストおよび検証され、多数のオブジェクトに対して9つの動作を複数回実行しました。視覚情報が主要なモダリティですが、追加の非視覚モダリティを利用すると、予測の精度が向上します。
Predicting future sensory states is crucial for learning agents such as robots, drones, and autonomous vehicles. In this paper, we couple multiple sensory modalities with exploratory actions and propose a predictive neural network architecture to address this problem. Most existing approaches rely on large, manually annotated datasets, or only use visual data as a single modality. In contrast, the unsupervised method presented here uses multi-modal perceptions for predicting future visual frames. As a result, the proposed model is more comprehensive and can better capture the spatio-temporal dynamics of the environment, leading to more accurate visual frame prediction. The other novelty of our framework is the use of sub-networks dedicated to anticipating future haptic, audio, and tactile signals. The framework was tested and validated with a dataset containing 4 sensory modalities (vision, haptic, audio, and tactile) on a humanoid robot performing 9 behaviors multiple times on a large set of objects. While the visual information is the dominant modality, utilizing the additional non-visual modalities improves the accuracy of predictions.
updated: Wed Sep 15 2021 20:20:04 GMT+0000 (UTC)
published: Wed Sep 15 2021 20:20:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト