arXiv reaDer
ドメイン一般化のためのエピソードトレーニング
Episodic Training for Domain Generalization
 ドメイン一般化(DG)は、一連の既知のトレーニングドメインとは異なる統計情報を持つ新規のテストドメインに一般化する学習モデルの挑戦的かつ局所的な問題です。すべてのソースドメインからデータを集約し、すべてのデータで単一のディープニューラルネットワークをエンドツーエンドでトレーニングするという単純なアプローチは、以前に公開された多くの方法を超える驚くほど強力なベースラインを提供します。このホワイトペーパーでは、実行時に新規ドメインを特徴付けるドメインシフトにさらされるように単一のディープネットワークをトレーニングする一時的なトレーニング手順を設計することにより、この強力なベースラインを構築します。具体的には、深層ネットワークを特徴抽出コンポーネントと分類コンポーネントに分解し、現在のドメインに対して適切に調整されていないパートナーと対話することで各コンポーネントをトレーニングします。これにより、両方のコンポーネントがより堅牢になり、最終的に3つのDGベンチマークで最先端のパフォーマンスを生み出すネットワークにつながります。さらに、ImageNetでトレーニングされたCNNをダウンストリーム認識タスクの固定機能抽出として使用する一般的なワークフローを検討します。 Visual Decathlonベンチマークを使用して、エピソードDGトレーニングが、新規問題に対するロバスト性のために機能を明示的にトレーニングすることにより、このような汎用機能抽出のパフォーマンスを改善することを示します。これは、DGトレーニングがコンピュータービジョンの標準的な実践に役立つことを示しています。
Domain generalization (DG) is the challenging and topical problem of learning models that generalize to novel testing domains with different statistics than a set of known training domains. The simple approach of aggregating data from all source domains and training a single deep neural network end-to-end on all the data provides a surprisingly strong baseline that surpasses many prior published methods. In this paper, we build on this strong baseline by designing an episodic training procedure that trains a single deep network in a way that exposes it to the domain shift that characterises a novel domain at runtime. Specifically, we decompose a deep network into feature extractor and classifier components, and then train each component by simulating it interacting with a partner who is badly tuned for the current domain. This makes both components more robust, ultimately leading to our networks producing state-of-the-art performance on three DG benchmarks. Furthermore, we consider the pervasive workflow of using an ImageNet trained CNN as a fixed feature extractor for downstream recognition tasks. Using the Visual Decathlon benchmark, we demonstrate that our episodic-DG training improves the performance of such a general-purpose feature extractor by explicitly training a feature for robustness to novel problems. This shows that DG training can benefit standard practice in computer vision.
updated: Fri Dec 06 2019 12:31:57 GMT+0000 (UTC)
published: Thu Jan 31 2019 22:45:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト