arXiv reaDer
目標条件付き階層予測子を使用した長期計画のビジュアルプランニング
Long-Horizon Visual Planning with Goal-Conditioned Hierarchical Predictors
将来を予測して計画する能力は、世界で行動するエージェントの基本です。遠い目標に到達するために、複数のタイムスケールで軌道を予測し、最初に目標に向けて大まかな計画を考案し、次に徐々に詳細を入力します。対照的に、視覚的予測と計画のための現在の学習アプローチは、(1)目標情報を考慮せずに予測を生成し、(2)一度に1ステップずつ最も細かい時間分解能で予測を生成するため、長期的なタスクに失敗します。この作業では、これらの制限の両方を克服できる視覚的な予測と計画のフレームワークを提案します。最初に、目標に向かって予測する問題を定式化し、対応するクラスの潜在空間目標条件付き予測子(GCP)を提案します。 GCPは、目標に到達する軌道のみに検索スペースを制限することで、計画の効率を大幅に向上させます。さらに、2つの観測値が与えられ、それらの間の観測値を予測し、軌道の各部分を再帰的に分割することによって完全なシーケンスを生成する階層モデルとしてGCPを自然に定式化する方法を示します。この分割統治戦略は長期予測に効果的であり、軌道を大雑把に細かく最適化する効果的な階層計画アルゴリズムを設計することができます。ゴールコンディショニングと階層予測の両方を使用することで、GCPにより、以前よりもはるかに長い期間でビジュアルプランニングタスクを解決できることがわかります。
The ability to predict and plan into the future is fundamental for agents acting in the world. To reach a faraway goal, we predict trajectories at multiple timescales, first devising a coarse plan towards the goal and then gradually filling in details. In contrast, current learning approaches for visual prediction and planning fail on long-horizon tasks as they generate predictions (1) without considering goal information, and (2) at the finest temporal resolution, one step at a time. In this work we propose a framework for visual prediction and planning that is able to overcome both of these limitations. First, we formulate the problem of predicting towards a goal and propose the corresponding class of latent space goal-conditioned predictors (GCPs). GCPs significantly improve planning efficiency by constraining the search space to only those trajectories that reach the goal. Further, we show how GCPs can be naturally formulated as hierarchical models that, given two observations, predict an observation between them, and by recursively subdividing each part of the trajectory generate complete sequences. This divide-and-conquer strategy is effective at long-term prediction, and enables us to design an effective hierarchical planning algorithm that optimizes trajectories in a coarse-to-fine manner. We show that by using both goal-conditioning and hierarchical prediction, GCPs enable us to solve visual planning tasks with much longer horizon than previously possible.
updated: Fri Nov 27 2020 22:34:30 GMT+0000 (UTC)
published: Tue Jun 23 2020 17:58:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト