arXiv reaDer
StyleAugment:事前定義されたテクスチャを使用しないスタイル拡張によるテクスチャの偏りのない表現の学習
StyleAugment: Learning Texture De-biased Representations by Style Augmentation without Pre-defined Textures
最近の強力な視覚分類器はテクスチャに偏っていますが、形状情報はモデルによって見落とされています。 Stylized ImageNetと呼ばれる芸術的なスタイルの転送方法を使用してトレーニング画像を拡張するという単純な試みは、テクスチャの偏りを減らすことができます。ただし、定型化されたImageNetアプローチには、忠実度と多様性に2つの欠点があります。まず、生成された画像は、自然の画像と芸術的な絵画の間に大きな意味上のギャップがあるため、画質が低くなります。また、定型化されたImageNetトレーニングサンプルはトレーニング前に事前に計算されているため、各サンプルの多様性が欠如していることがわかります。ミニバッチからスタイルを拡張することにより、StyleAugmentを提案します。 StyleAugmentは、事前定義されたスタイル参照に依存しませんが、参照のミニバッチ内の自然画像によってオンザフライで拡張画像を生成します。したがって、StyleAugmentを使用すると、モデルはオンザフライの拡張戦略によって各画像の豊富な交絡キューを観察できますが、拡張画像は芸術的なスタイルの転送画像よりも現実的です。 ImageNetデータセットのStyleAugmentの有効性を、テクスチャのバイアス除去精度、破損の堅牢性、自然な敵対サンプル、オクルージョンの堅牢性などの堅牢性ベンチマークを使用して検証します。 StyleAugmentは、実験において、以前の教師なしバイアス除去方法や最先端のデータ拡張方法よりも優れた一般化パフォーマンスを示しています。
Recent powerful vision classifiers are biased towards textures, while shape information is overlooked by the models. A simple attempt by augmenting training images using the artistic style transfer method, called Stylized ImageNet, can reduce the texture bias. However, Stylized ImageNet approach has two drawbacks in fidelity and diversity. First, the generated images show low image quality due to the significant semantic gap betweeen natural images and artistic paintings. Also, Stylized ImageNet training samples are pre-computed before training, resulting in showing the lack of diversity for each sample. We propose a StyleAugment by augmenting styles from the mini-batch. StyleAugment does not rely on the pre-defined style references, but generates augmented images on-the-fly by natural images in the mini-batch for the references. Hence, StyleAugment let the model observe abundant confounding cues for each image by on-the-fly the augmentation strategy, while the augmented images are more realistic than artistic style transferred images. We validate the effectiveness of StyleAugment in the ImageNet dataset with robustness benchmarks, such as texture de-biased accuracy, corruption robustness, natural adversarial samples, and occlusion robustness. StyleAugment shows better generalization performances than previous unsupervised de-biasing methods and state-of-the-art data augmentation methods in our experiments.
updated: Tue Aug 24 2021 07:17:02 GMT+0000 (UTC)
published: Tue Aug 24 2021 07:17:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト