arXiv reaDer
Implicit Semantic Data Augmentation for Deep Networks
 このホワイトペーパーでは、フリッピング、並進、回転などの従来の拡張技術を補完する、新しい暗黙のセマンティックデータ拡張(ISDA)アプローチを提案します。私たちの仕事は、ディープネットワークがフィーチャの線形化に驚くほど優れているという興味深い特性に動機付けられています。たとえば、ディープフィーチャ空間の特定の方向は、意味のある意味変換(たとえば、サングラスの追加や背景の変更)に対応しています。結果として、特徴空間の多くの意味的方向に沿ってトレーニングサンプルを変換すると、データセットを効果的に補強して一般化を向上させることができます。このアイデアを効果的かつ効率的に実装するには、まず、クラスごとの深い特徴の共分散行列のオンライン推定を実行します。これにより、クラス内のセマンティックのバリエーションがキャプチャされます。次に、ランダムなベクトルが推定された共分散を使用してゼロ平均正規分布から描画され、そのクラスのトレーニングデータが拡張されます。重要なのは、サンプルを明示的に増やす代わりに、拡張されたトレーニングセットで予想されるクロスエントロピー(CE)損失の上限を直接最小限に抑えることができるため、アルゴリズムが非常に効率的になることです。実際、提案されたISDAは、新規のロバストなCE損失を最小限に抑え、通常のトレーニング手順に無視できる余分な計算コストを追加することを示しています。 ISDAは単純ですが、さまざまなデータセット(CIFAR-10、CIFAR-100、ImageNetなど)の一般的なディープモデル(ResNetsおよびDenseNets)の汎化パフォーマンスを一貫して向上させます。結果を再現するためのコードは、で入手できます。
In this paper, we propose a novel implicit semantic data augmentation (ISDA) approach to complement traditional augmentation techniques like flipping, translation or rotation. Our work is motivated by the intriguing property that deep networks are surprisingly good at linearizing features, such that certain directions in the deep feature space correspond to meaningful semantic transformations, e.g., adding sunglasses or changing backgrounds. As a consequence, translating training samples along many semantic directions in the feature space can effectively augment the dataset to improve generalization. To implement this idea effectively and efficiently, we first perform an online estimate of the covariance matrix of deep features for each class, which captures the intra-class semantic variations. Then random vectors are drawn from a zero-mean normal distribution with the estimated covariance to augment the training data in that class. Importantly, instead of augmenting the samples explicitly, we can directly minimize an upper bound of the expected cross-entropy (CE) loss on the augmented training set, leading to a highly efficient algorithm. In fact, we show that the proposed ISDA amounts to minimizing a novel robust CE loss, which adds negligible extra computational cost to a normal training procedure. Although being simple, ISDA consistently improves the generalization performance of popular deep models (ResNets and DenseNets) on a variety of datasets, e.g., CIFAR-10, CIFAR-100 and ImageNet. Code for reproducing our results is available at
updated: Sat Apr 25 2020 03:13:03 GMT+0000 (UTC)
published: Thu Sep 26 2019 16:17:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト