arXiv reaDer
地域提案相互作用ネットワークによる長期視覚ダイナミクスの学習
Learning Long-term Visual Dynamics with Region Proposal Interaction Networks
長期的なダイナミクスモデルを学ぶことは、物理的な常識を理解するための鍵です。視覚入力からダイナミクスを学習するための既存のアプローチのほとんどは、短期モデルを使用した迅速な再計画に頼ることにより、長期予測を回避します。これには、そのようなモデルが非常に正確である必要があるだけでなく、エージェントが継続的にフィードバックを取得し、完了するまで各ステップでアクションを実行できるタスクのみに制限されます。このホワイトペーパーでは、視覚認識タスクのサクセスストーリーのアイデアを活用して、オブジェクト間およびオブジェクトと環境の相互作用を長期にわたってキャプチャできるオブジェクト表現を構築することを目指しています。この目的のために、我々は、潜在的な領域提案特徴空間における各オブジェクトの軌道について推論する領域提案相互作用ネットワーク(RPIN)を提案します。シンプルでありながら効果的なオブジェクト表現のおかげで、私たちのアプローチは、予測品質とダウンストリームタスクを計画する能力の両方の点で以前の方法を大幅に上回り、新しい環境にも一般化できます。コード、事前トレーニング済みモデル、およびその他の視覚化結果は、https://haozhi.io/RPINで入手できます。
Learning long-term dynamics models is the key to understanding physical common sense. Most existing approaches on learning dynamics from visual input sidestep long-term predictions by resorting to rapid re-planning with short-term models. This not only requires such models to be super accurate but also limits them only to tasks where an agent can continuously obtain feedback and take action at each step until completion. In this paper, we aim to leverage the ideas from success stories in visual recognition tasks to build object representations that can capture inter-object and object-environment interactions over a long-range. To this end, we propose Region Proposal Interaction Networks (RPIN), which reason about each object's trajectory in a latent region-proposal feature space. Thanks to the simple yet effective object representation, our approach outperforms prior methods by a significant margin both in terms of prediction quality and their ability to plan for downstream tasks, and also generalize well to novel environments. Code, pre-trained models, and more visualization results are available at https://haozhi.io/RPIN.
updated: Thu Mar 18 2021 03:36:37 GMT+0000 (UTC)
published: Wed Aug 05 2020 17:48:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト