新しいメモリアーキテクチャであるベイジアンリレーショナルメモリ(BRM)を導入して、見えない環境でのセマンティックビジュアルナビゲーションエージェントの一般化機能を改善します。 BRMは、セマンティックエンティティ(部屋タイプなど)の確率的関係グラフの形式を取り、(1)トレーニング環境から事前にレイアウト、つまり事前知識をキャプチャし、(2)テスト時に事後レイアウト、つまりメモリを推定します。更新、および(3)ナビゲーションの効率的な計画、全体。サブ目標を生成するためのBRMモジュールと制御のための目標条件付き移動モジュールで構成されるBRMエージェントを開発します。見えない環境でテストする場合、BRMエージェントは、確率論的なリレーショナルメモリ構造を明示的に利用していないベースラインよりも優れています
We introduce a new memory architecture, Bayesian Relational Memory (BRM), to improve the generalization ability for semantic visual navigation agents in unseen environments, where an agent is given a semantic target to navigate towards. BRM takes the form of a probabilistic relation graph over semantic entities (e.g., room types), which allows (1) capturing the layout prior from training environments, i.e., prior knowledge, (2) estimating posterior layout at test time, i.e., memory update, and (3) efficient planning for navigation, altogether. We develop a BRM agent consisting of a BRM module for producing sub-goals and a goal-conditioned locomotion module for control. When testing in unseen environments, the BRM agent outperforms baselines that do not explicitly utilize the probabilistic relational memory structure