Adversarial Domain Randomization
ドメインランダム化(DR)は、良好なパフォーマンスを得るために大量のトレーニングデータを必要とすることが知られています。これは、シミュレーションパラメータ全体に一様分布を使用してランダムデータを生成するDRの戦略によるものであり、その結果、DRは学習者にとって有益でないサンプルを生成することがよくあります。この作業では、マルチソースドメイン適応からのアイデアを使用してDRを理論的に分析します。私たちの調査結果に基づいて、トレーニング中に学習者に関して敵対的なサンプルを生成するDRの効率的なバリアントとして、敵対的なドメインランダム化(ADR)を提案します。アクション空間が量子化されたシミュレーションパラメータ空間であるポリシーとしてADRを実装します。各反復で、ポリシーのアクションはラベル付きデータを生成し、報酬はこのデータでの学習者の損失の負として設定されます。その結果、ADRは、オブジェクト検出用の切り捨てられたオブジェクトやオクルージョンされたオブジェクト、画像分類用の紛らわしいクラスなど、学習者向けの新しいサンプルを頻繁に生成することがわかります。 CLEVR、Syn2Real、VIRATなどのデータセットに対してさまざまなタスクの評価を実行し、生成するデータサンプルの数が少ないためにADRがDRよりも優れていることを示します。
Domain Randomization (DR) is known to require a significant amount of training data for good performance. We argue that this is due to DR's strategy of random data generation using a uniform distribution over simulation parameters, as a result, DR often generates samples which are uninformative for the learner. In this work, we theoretically analyze DR using ideas from multi-source domain adaptation. Based on our findings, we propose Adversarial Domain Randomization (ADR) as an efficient variant of DR which generates adversarial samples with respect to the learner during training. We implement ADR as a policy whose action space is the quantized simulation parameter space. At each iteration, the policy's action generates labeled data and the reward is set as negative of learner's loss on this data. As a result, we observe ADR frequently generates novel samples for the learner like truncated and occluded objects for object detection and confusing classes for image classification. We perform evaluations on datasets like CLEVR, Syn2Real, and VIRAT for various tasks where we demonstrate that ADR outperforms DR by generating fewer data samples.
updated: Sun Aug 29 2021 21:13:26 GMT+0000 (UTC)
published: Mon Dec 03 2018 00:00:28 GMT+0000 (UTC)
