arXiv reaDer
Q-attention: 視覚ベースのロボット操作のための効率的な学習の実現
Q-attention: Enabling Efficient Learning for Vision-based Robotic Manipulation
強化学習手法の成功にもかかわらず、広範なロボット操作タスクに適用された場合、それらはまだ画期的な瞬間を迎えていません。これは、強化学習アルゴリズムのトレーニングが非常に困難で時間がかかることで有名であり、完全な状態の入力ではなく画像からトレーニングすると悪化するという事実によるものです。人間が操作タスクを実行するとき、私たちの目はプロセスのすべてのステップを注意深く監視し、視線は操作対象のオブジェクトに順次焦点を合わせます。これを念頭に置いて、アテンション駆動型ロボット操作 (ARM) アルゴリズムを紹介します。これは、少数のデモンストレーションのみを前提として、さまざまなまばらな報酬のタスクに適用できる一般的な操作アルゴリズムです。 ARM は、操作の複雑なタスクを 3 段階のパイプラインに分割します。(1) Q-attention エージェントは、RGB および点群入力から興味深いピクセル位置を抽出します。(2) Q-attention エージェントからのクロップを受け入れる次善のポーズ エージェント(3) 目標ポーズを取って関節動作を出力する制御エージェント。現在の学習アルゴリズムは、さまざまな RLBench タスクで失敗しますが、ARM は成功します。
Despite the success of reinforcement learning methods, they have yet to have their breakthrough moment when applied to a broad range of robotic manipulation tasks. This is partly due to the fact that reinforcement learning algorithms are notoriously difficult and time consuming to train, which is exacerbated when training from images rather than full-state inputs. As humans perform manipulation tasks, our eyes closely monitor every step of the process with our gaze focusing sequentially on the objects being manipulated. With this in mind, we present our Attention-driven Robotic Manipulation (ARM) algorithm, which is a general manipulation algorithm that can be applied to a range of sparse-rewarded tasks, given only a small number of demonstrations. ARM splits the complex task of manipulation into a 3 stage pipeline: (1) a Q-attention agent extracts interesting pixel locations from RGB and point cloud inputs, (2) a next-best pose agent that accepts crops from the Q-attention agent and outputs poses, and (3) a control agent that takes the goal pose and outputs joint actions. We show that current learning algorithms fail on a range of RLBench tasks, whilst ARM is successful.
updated: Mon May 31 2021 09:44:16 GMT+0000 (UTC)
published: Mon May 31 2021 09:44:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト