AutoAugment: データからオーグメンテーションポリシーを学習する
AutoAugment: Learning Augmentation Policies from Data
データオーグメンテーションは、最新の画像分類器の精度を向上させるための有効な手法である。しかし、現在のデータオーグメンテーションの実装は、手動で設計されている。本論文では、AutoAugmentと呼ばれる簡単な手続きを用いて、改善されたデータ補強ポリシーを自動的に検索する方法について述べる。我々の実装では、1つのポリシーが多数のサブポリシーからなる探索空間を設計し、そのうちの1つが各ミニバッチの画像に対してランダムに選択される。サブポリシーは2つの操作で構成され、それぞれの操作は並進、回転、剪断などの画像処理関数と、それらの関数が適用される確率と大きさである。我々は検索アルゴリズムを用いて、ニューラルネットワークが対象データセットに対して最高の検証精度を得るような最適なポリシーを見つけ出す。我々の手法は、CIFAR-10、CIFAR-100、SVHN、ImageNet(追加データなし)において、最先端の精度を達成している。ImageNetでは、これまでの記録83.1%より0.4%良い83.5%のトップ1精度を達成した。CIFAR-10では、エラー率1.5%を達成しており、これは従来の最新技術と比較して0.6%の改善である。我々が発見した拡張ポリシーは、データセット間での移行が可能である。ImageNetで学習したポリシーは、Oxford Flowers、Caltech-101、Oxford-IIT Pets、FGVC Aircraft、Stanford Carsなどの他のデータセットにも適用可能であることがわかった。
Data augmentation is an effective technique for improving the accuracy of modern image classifiers. However, current data augmentation implementations are manually designed. In this paper, we describe a simple procedure called AutoAugment to automatically search for improved data augmentation policies. In our implementation, we have designed a search space where a policy consists of many sub-policies, one of which is randomly chosen for each image in each mini-batch. A sub-policy consists of two operations, each operation being an image processing function such as translation, rotation, or shearing, and the probabilities and magnitudes with which the functions are applied. We use a search algorithm to find the best policy such that the neural network yields the highest validation accuracy on a target dataset. Our method achieves state-of-the-art accuracy on CIFAR-10, CIFAR-100, SVHN, and ImageNet (without additional data). On ImageNet, we attain a Top-1 accuracy of 83.5% which is 0.4% better than the previous record of 83.1%. On CIFAR-10, we achieve an error rate of 1.5%, which is 0.6% better than the previous state-of-the-art. Augmentation policies we find are transferable between datasets. The policy learned on ImageNet transfers well to achieve significant improvements on other datasets, such as Oxford Flowers, Caltech-101, Oxford-IIT Pets, FGVC Aircraft, and Stanford Cars.
updated: Thu Apr 11 2019 22:39:27 GMT+0000 (UTC)
published: Thu May 24 2018 04:05:42 GMT+0000 (UTC)
