arXiv reaDer
堅牢なキーポイント表現によるロボット操作のエンドツーエンド強化学習
End-to-end Reinforcement Learning of Robotic Manipulation with Robust Keypoints Representation
堅牢で効率的なキーポイント表現を使用して、ロボット操作タスクのためのエンドツーエンドの強化学習(RL)フレームワークを提示します。提案された方法は、自己監視オートエンコーダアーキテクチャを介して、状態表現としてカメラ画像からキーポイントを学習します。キーポイントは、幾何学的情報、およびツールとターゲットの関係をコンパクトな表現でエンコードして、効率的で堅牢な学習を保証します。キーポイントの学習後、RLステップは、抽出されたキーポイントの状態表現からロボットの動きを学習します。キーポイントとRL学習プロセスは、完全にシミュレートされた環境で実行されます。さまざまなシナリオで、握るや押すなどのロボット操作タスクで提案された方法の有効性を示します。また、トレーニングされたモデルの一般化機能についても調査します。堅牢なキーポイント表現に加えて、ドメインのランダム化と敵対的なトレーニングの例をさらに適用して、実世界のロボット操作タスクでゼロショットのsimからrealへの転送を実現します。
We present an end-to-end Reinforcement Learning(RL) framework for robotic manipulation tasks, using a robust and efficient keypoints representation. The proposed method learns keypoints from camera images as the state representation, through a self-supervised autoencoder architecture. The keypoints encode the geometric information, as well as the relationship of the tool and target in a compact representation to ensure efficient and robust learning. After keypoints learning, the RL step then learns the robot motion from the extracted keypoints state representation. The keypoints and RL learning processes are entirely done in the simulated environment. We demonstrate the effectiveness of the proposed method on robotic manipulation tasks including grasping and pushing, in different scenarios. We also investigate the generalization capability of the trained model. In addition to the robust keypoints representation, we further apply domain randomization and adversarial training examples to achieve zero-shot sim-to-real transfer in real-world robotic manipulation tasks.
updated: Sat Feb 12 2022 09:58:09 GMT+0000 (UTC)
published: Sat Feb 12 2022 09:58:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト