arXiv reaDer
深層強化学習を使用したヒューマノイドサッカーロボットのリアルタイムアクティブビジョン
Real-time Active Vision for a Humanoid Soccer Robot Using Deep Reinforcement Learning
本論文では、ヒューマノイドサッカー競技ロボットのための深層強化学習アプローチを用いたアクティブビジョン法を提示した。提案された方法は、ロボットの視点を適応的に最適化して、ボールをその視点に保ちながら、自己位置特定のための最も有用なランドマークを取得します。アクティブビジョンは、視野が限られているヒューマノイドの意思決定者ロボットにとって重要です。アクティブな視覚の問題に対処するために、自己局在化モデルの精度に大きく依存するいくつかの確率的エントロピーベースのアプローチが以前に提案されてきた。ただし、本研究では、この問題を一時的な強化学習問題として定式化し、ディープQ学習法を用いて解決します。提案されたネットワークは、ロボットの頭を最良の視点に向けて動かすためにカメラの生画像のみを必要とします。このモデルは、最良の視点を達成する上で80%の成功率という非常に競争力のある率を示しています。提案手法をWebotsシミュレータでシミュレートしたヒューマノイドロボットに実装しました。私たちの評価と実験結果は、提案された方法が、自己局在化エラーが高い場合に、RoboCupコンテキストでエントロピーベースの方法よりも優れていることを示しています。
In this paper, we present an active vision method using a deep reinforcement learning approach for a humanoid soccer-playing robot. The proposed method adaptively optimises the viewpoint of the robot to acquire the most useful landmarks for self-localisation while keeping the ball into its viewpoint. Active vision is critical for humanoid decision-maker robots with a limited field of view. To deal with an active vision problem, several probabilistic entropy-based approaches have previously been proposed which are highly dependent on the accuracy of the self-localisation model. However, in this research, we formulate the problem as an episodic reinforcement learning problem and employ a Deep Q-learning method to solve it. The proposed network only requires the raw images of the camera to move the robot's head toward the best viewpoint. The model shows a very competitive rate of 80% success rate in achieving the best viewpoint. We implemented the proposed method on a humanoid robot simulated in Webots simulator. Our evaluations and experimental results show that the proposed method outperforms the entropy-based methods in the RoboCup context, in cases with high self-localisation errors.
updated: Fri Nov 27 2020 17:29:48 GMT+0000 (UTC)
published: Fri Nov 27 2020 17:29:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト