ディープラーニングは、多くのコンピュータービジョンタスクで驚くべき結果を達成しています。ディープニューラルネットワークは通常、過剰適合を回避するために大量のトレーニングデータに依存しています。ただし、実際のアプリケーションのラベル付きデータは制限される場合があります。トレーニングデータの量と多様性を改善することにより、データ拡張は、画像データを使用した深層学習モデルトレーニングの必然的な部分になりました。トレーニングデータの十分性と多様性を改善する効果的な方法として、データ拡張は、画像データへの深層学習モデルの適用を成功させるために必要な部分になっています。この論文では、さまざまな画像データ拡張方法を体系的にレビューします。レビューされた方法の分類法を提案し、これらの方法の長所と制限を示します。また、セマンティックセグメンテーション、画像分類、オブジェクト検出など、3つの典型的なコンピュータビジョンタスクでさまざまなデータ拡張方法を使用して広範な実験を行います。最後に、データ拡張が直面している現在の課題と将来の研究の方向性について説明し、いくつかの有用な研究ガイダンスを提示します。
Deep learning has achieved remarkable results in many computer vision tasks. Deep neural networks typically rely on large amounts of training data to avoid overfitting. However, labeled data for real-world applications may be limited. By improving the quantity and diversity of training data, data augmentation has become an inevitable part of deep learning model training with image data. As an effective way to improve the sufficiency and diversity of training data, data augmentation has become a necessary part of successful application of deep learning models on image data. In this paper, we systematically review different image data augmentation methods. We propose a taxonomy of reviewed methods and present the strengths and limitations of these methods. We also conduct extensive experiments with various data augmentation methods on three typical computer vision tasks, including semantic segmentation, image classification and object detection. Finally, we discuss current challenges faced by data augmentation and future research directions to put forward some useful research guidance.