arXiv reaDer
ピクセルからの連続制御における視覚的一般化の測定
Measuring Visual Generalization in Continuous Control from Pixels
自己教師あり学習とデータ拡張により、継続的な制御タスクにおける状態と画像ベースの強化学習エージェント間のパフォーマンスのギャップが大幅に減少しました。ただし、現在の技術が実際の環境で必要とされるさまざまな視覚的条件に直面できるかどうかはまだ不明です。既存の連続制御ドメインにグラフィカルな多様性を追加することにより、エージェントの視覚的な一般化をテストする挑戦的なベンチマークを提案します。私たちの経験的分析は、現在の方法が視覚的変化の多様なセット全体で一般化するのに苦労していることを示しており、これらのタスクを困難にする変動の特定の要因を調べます。データ拡張技術は教師あり学習アプローチよりも優れており、より重要な画像変換により視覚的な一般化が向上することがわかりました\ footnote {ベンチマークと拡張されたアクター批評家の実装はオープンソースです@https://github.com/QData/dmc_remastered )
Self-supervised learning and data augmentation have significantly reduced the performance gap between state and image-based reinforcement learning agents in continuous control tasks. However, it is still unclear whether current techniques can face a variety of visual conditions required by real-world environments. We propose a challenging benchmark that tests agents' visual generalization by adding graphical variety to existing continuous control domains. Our empirical analysis shows that current methods struggle to generalize across a diverse set of visual changes, and we examine the specific factors of variation that make these tasks difficult. We find that data augmentation techniques outperform self-supervised learning approaches and that more significant image transformations provide better visual generalization \footnote{The benchmark and our augmented actor-critic implementation are open-sourced @ https://github.com/QData/dmc_remastered)
updated: Fri Nov 27 2020 20:33:03 GMT+0000 (UTC)
published: Tue Oct 13 2020 23:42:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト