arXiv reaDer
回帰計画ネットワーク
Regression Planning Networks
  最近の学習計画法は、観測空間から直接計画することで有望な結果を示しています。しかし、長期のタスクを計画する能力は、予測モデルの精度によって制限されます。一方、古典的なシンボリックプランナーは、長期的な課題を解決する優れた能力を示しますが、事前定義されたシンボリックルールとシンボリック状態が必要であり、実際の適用性が制限されます。この作業では、これら2つのパラダイムの利点を組み合わせて、高次元の観測を条件とする長期のシンボリックプランを直接生成できるプラン学習方法を提案します。古典的な計画の文献から回帰(後方)計画のアイデアを取り入れ、回帰目標計画ネットワーク(RPN)を導入します。私たちのモデルは、象徴的な計画から多くの好ましい特性、たとえば、これまで見えなかったタスクを解決する能力を継承するだけでなく、視覚的な入力からエンドツーエンドの方法で学習できることを示します。グリッドワールド環境と複雑な視覚シーンと長いタスク期間を特徴とするシミュレートされた3Dキッチン環境でRPNの機能を評価し、完全に新しいタスクインスタンスでほぼ最適なパフォーマンスを達成することを示します。
Recent learning-to-plan methods have shown promising results on planning directly from observation space. Yet, their ability to plan for long-horizon tasks is limited by the accuracy of the prediction model. On the other hand, classical symbolic planners show remarkable capabilities in solving long-horizon tasks, but they require predefined symbolic rules and symbolic states, restricting their real-world applicability. In this work, we combine the benefits of these two paradigms and propose a learning-to-plan method that can directly generate a long-term symbolic plan conditioned on high-dimensional observations. We borrow the idea of regression (backward) planning from classical planning literature and introduce Regression Planning Networks (RPN), a neural network architecture that plans backward starting at a task goal and generates a sequence of intermediate goals that reaches the current observation. We show that our model not only inherits many favorable traits from symbolic planning, e.g., the ability to solve previously unseen tasks but also can learn from visual inputs in an end-to-end manner. We evaluate the capabilities of RPN in a grid world environment and a simulated 3D kitchen environment featuring complex visual scenes and long task horizons, and show that it achieves near-optimal performance in completely new task instances.
updated: Sat Sep 28 2019 11:30:24 GMT+0000 (UTC)
published: Sat Sep 28 2019 11:30:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト