私たちは、視覚と政策学習を分離する方法であるSplitNetを提案します。補助的なタスクとモデルの一部の選択的学習を組み込むことにより、視覚的ナビゲーションの学習目標を世界を知覚し、その知覚に基づいて行動するように明示的に分解します。 Sim2Realへの有望なステップである、シミュレーター間での転送に関して、ベースラインモデルに比べて劇的な改善を示しています。さらに、SplitNetは、同じシミュレーターからの目に見えない環境により適切に一般化され、新規の具体化されたナビゲーションタスクにより迅速かつ効果的に転送します。さらに、ターゲットドメインからのサンプルが少ない場合、SplitNetは、データセット全体を受信する従来のエンドツーエンドパイプラインのパフォーマンスと一致させることができます。コードはhttps://github.com/facebookresearch/splitnetで入手可能です
We propose SplitNet, a method for decoupling visual perception and policy learning. By incorporating auxiliary tasks and selective learning of portions of the model, we explicitly decompose the learning objectives for visual navigation into perceiving the world and acting on that perception. We show dramatic improvements over baseline models on transferring between simulators, an encouraging step towards Sim2Real. Additionally, SplitNet generalizes better to unseen environments from the same simulator and transfers faster and more effectively to novel embodied navigation tasks. Further, given only a small sample from a target domain, SplitNet can match the performance of traditional end-to-end pipelines which receive the entire dataset. Code is available https://github.com/facebookresearch/splitnet