arXiv reaDer
Auxiliary Tasks and Exploration Enable ObjectNav
ObjectGoal Navigation(ObjectNav)は、エージェントが見えない環境でオブジェクトインスタンスにナビゲートする具体化されたタスクです。以前の研究では、CNN + RNNなどのバニラビジュアルモジュールとリカレントモジュールを使用するエンドツーエンドのObjectNavエージェントは、過剰適合とサンプルの非効率性のためにパフォーマンスが低下することが示されています。これにより、分析コンポーネントと学習コンポーネントを混合し、環境の明示的な空間マップを操作するための現在の最先端の方法が動機付けられました。代わりに、補助学習タスクと探索報酬を追加することにより、一般的な学習エージェントを再度有効にします。私たちのエージェントは、Habitat ObjectNavチャレンジで24.5%の成功と8.1%のSPLを達成し、以前の最先端技術に比べてそれぞれ37%と8%の相対的な改善を達成しています。私たちの分析から、エージェントはRNNダイナミクスを滑らかにするために視覚入力を単純化するように行動し、補助タスクは効果的なRNN次元を最小化することによって過剰適合を減らすことを提案します。つまり、長期にわたって一貫した計画を維持する必要があるパフォーマンスの高いObjectNavエージェントは、スムーズで低次元の反復ダイナミクスを学習することによってそれを行います。サイト:
ObjectGoal Navigation (ObjectNav) is an embodied task wherein agents are to navigate to an object instance in an unseen environment. Prior works have shown that end-to-end ObjectNav agents that use vanilla visual and recurrent modules, e.g. a CNN+RNN, perform poorly due to overfitting and sample inefficiency. This has motivated current state-of-the-art methods to mix analytic and learned components and operate on explicit spatial maps of the environment. We instead re-enable a generic learned agent by adding auxiliary learning tasks and an exploration reward. Our agents achieve 24.5% success and 8.1% SPL, a 37% and 8% relative improvement over prior state-of-the-art, respectively, on the Habitat ObjectNav Challenge. From our analysis, we propose that agents will act to simplify their visual inputs so as to smooth their RNN dynamics, and that auxiliary tasks reduce overfitting by minimizing effective RNN dimensionality; i.e. a performant ObjectNav agent that must maintain coherent plans over long horizons does so by learning smooth, low-dimensional recurrent dynamics. Site:
updated: Tue Aug 03 2021 00:18:52 GMT+0000 (UTC)
published: Thu Apr 08 2021 23:03:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト