arXiv reaDer
Split Deep Q-Learning for Robust Object Singulation
 雑然とした環境で他のオブジェクトの山から既知のターゲットオブジェクトを抽出することは、多くのロボットアプリケーションで遭遇する困難なロボット操作タスクです。このような状況では、ターゲットオブジェクトが隣接する障害物オブジェクトに接触するか、隣接する障害物オブジェクトで覆われているため、従来の把持技術が無効になります。本論文では、十分な「把握室」が達成されるまで、隣接オブジェクトとターゲットオブジェクトの両方の横方向のプッシュ動作により、周囲のクラッターからターゲットオブジェクトを個別化することを目的としたプッシュポリシーを提案します。上記の目標を達成するために、強化学習、特にディープQラーニング(DQN)を使用して、試行錯誤によって最適なプッシュポリシーを学習します。学習率を改善し、アルゴリズムのモジュール性を高めるために、新しいSplit DQNが提案されています。実験によると、学習はシミュレーション環境で実行されますが、学習したポリシーを実際の環境に転送することは、強力な機能選択のおかげで効果的です。最後に、アルゴリズムのモジュール性により、モデルを最初から再トレーニングせずに追加のプリミティブを追加できることを示します。
Extracting a known target object from a pile of other objects in a cluttered environment is a challenging robotic manipulation task encountered in many robotic applications. In such conditions, the target object touches or is covered by adjacent obstacle objects, thus rendering traditional grasping techniques ineffective. In this paper, we propose a pushing policy aiming at singulating the target object from its surrounding clutter, by means of lateral pushing movements of both the neighboring objects and the target object until sufficient 'grasping room' has been achieved. To achieve the above goal we employ reinforcement learning and particularly Deep Q-learning (DQN) to learn optimal push policies by trial and error. A novel Split DQN is proposed to improve the learning rate and increase the modularity of the algorithm. Experiments show that although learning is performed in a simulated environment the transfer of learned policies to a real environment is effective thanks to robust feature selection. Finally, we demonstrate that the modularity of the algorithm allows the addition of extra primitives without retraining the model from scratch.
updated: Thu Feb 27 2020 12:57:31 GMT+0000 (UTC)
published: Tue Sep 17 2019 21:14:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト