arXiv reaDer
CityLearn:サンプル効率の良いナビゲーションポリシー学習のための多様な実世界環境
CityLearn: Diverse Real-World Environments for Sample-Efficient Navigation Policy Learning
 実際の環境での視覚的なナビゲーションタスクでは、多くの場合、自己運動と場所認識フィードバックの両方が必要です。深層強化学習は、これらの認識と意思決定の問題をエンドツーエンドで解決することに成功しましたが、これらのアルゴリズムは、高次元のデータからナビゲーションポリシーを学習するために大量の経験を必要とします。サンプルの複雑さ。このホワイトペーパーでは、これらの問題に主に2つの貢献をします。まず、場所認識とディープラーニングテクニックを目標の目的地フィードバックと組み合わせて活用し、コンパクトなバイモーダル画像表現を生成します。これを使用して、少量の経験から制御ポリシーを効果的に学習できます。次に、インタラクティブなフレームワークであるCityLearnを提示します。これにより、視覚的な外観が極端に変化する都市規模の現実的な環境で初めてナビゲーションアルゴリズムのトレーニングと展開が可能になります。 CityLearnは、視覚的な場所の認識や自動運転の研究でよく使用される10を超えるベンチマークデータセットを備えています。これには、世界中の60の都市で記録された100以上の横断が含まれます。 2つのCityLearn環境でのアプローチを評価し、1回の横断でナビゲーションポリシーをトレーニングします。結果は、この方法は生の画像を使用する場合よりも2桁以上高速であり、昼から夜、夏から冬への移行を含む極端な視覚的変化にわたって一般化できることを示しています。
Visual navigation tasks in real-world environments often require both self-motion and place recognition feedback. While deep reinforcement learning has shown success in solving these perception and decision-making problems in an end-to-end manner, these algorithms require large amounts of experience to learn navigation policies from high-dimensional data, which is generally impractical for real robots due to sample complexity. In this paper, we address these problems with two main contributions. We first leverage place recognition and deep learning techniques combined with goal destination feedback to generate compact, bimodal image representations that can then be used to effectively learn control policies from a small amount of experience. Second, we present an interactive framework, CityLearn, that enables for the first time training and deployment of navigation algorithms across city-sized, realistic environments with extreme visual appearance changes. CityLearn features more than 10 benchmark datasets, often used in visual place recognition and autonomous driving research, including over 100 recorded traversals across 60 cities around the world. We evaluate our approach on two CityLearn environments, training our navigation policy on a single traversal. Results show our method can be over 2 orders of magnitude faster than when using raw images, and can also generalize across extreme visual changes including day to night and summer to winter transitions.
updated: Mon Mar 02 2020 10:24:13 GMT+0000 (UTC)
published: Thu Oct 10 2019 02:34:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト