マルチステップ操作の計画の基本的な課題は、タスクの目標につながる効果的でもっともらしいアクションシーケンスを見つけることです。カスケード変分推論(CAVIN)プランナーを提示します。これは、潜在空間からサンプリングして階層的にプランを生成するモデルベースの方法です。長期にわたる計画を容易にするために、この方法は、カスケードされた変分推論による低レベルの動きの生成から高レベルの効果の予測を切り離す潜在的な表現を学習します。これにより、階層計画の2つの異なるレベルの時間分解能でダイナミクスをモデル化できます。高次元の観測が与えられた散らかった卓上環境での3つのマルチステップロボット操作タスクでのアプローチを評価します。経験的結果は、提案された方法が複数のオブジェクトと戦略的に相互作用することにより、最先端のモデルベースの方法よりも優れていることを示しています。
The fundamental challenge of planning for multi-step manipulation is to find effective and plausible action sequences that lead to the task goal. We present Cascaded Variational Inference (CAVIN) Planner, a model-based method that hierarchically generates plans by sampling from latent spaces. To facilitate planning over long time horizons, our method learns latent representations that decouple the prediction of high-level effects from the generation of low-level motions through cascaded variational inference. This enables us to model dynamics at two different levels of temporal resolutions for hierarchical planning. We evaluate our approach in three multi-step robotic manipulation tasks in cluttered tabletop environments given high-dimensional observations. Empirical results demonstrate that the proposed method outperforms state-of-the-art model-based methods by strategically interacting with multiple objects.