arXiv reaDer
深層学習のための画像増強技術の包括的な調査
A Comprehensive Survey of Image Augmentation Techniques for Deep Learning
ディープラーニングは、大量の画像を必要とするコンピュータービジョンで適切なパフォーマンスを達成していますが、多くのシナリオでは、画像の収集には費用がかかり、困難です。この問題を軽減するために、多くの画像増強アルゴリズムが効果的かつ効率的な戦略として提案されてきました。現在のアルゴリズムを理解することは、適切な方法を見つけたり、特定のタスクに新しい技術を開発したりするために不可欠です。この論文では、新しい有益な分類法を用いた深層学習のための画像増強に関する包括的な調査を行います。画像の増強が必要な理由の基本的な考え方を理解するために、コンピュータビジョンタスクと周辺分布の課題を紹介します。次に、アルゴリズムは3つのカテゴリに分けられます。モデルフリー、モデルベース、および最適化ポリシーベース。モデルフリーカテゴリは画像処理方法を採用し、モデルベースの方法はトレーニング可能な画像生成モデルを活用します。対照的に、最適化ポリシーベースのアプローチは、最適な操作またはそれらの組み合わせを見つけることを目的としています。さらに、グループ理論やカーネル理論など、画像拡張を理解するためのさまざまな方法を活用することと、教師なし学習のために画像拡張を展開することの2つのアクティブなトピックで、一般的なアプリケーションの現在の傾向について説明します。分析に基づいて、私たちの調査は、適切な方法を選択したり、実用的なアプリケーションに新しいアルゴリズムを設計したりするのに役立つ理解を深めることができると信じています。
Deep learning has been achieving decent performance in computer vision requiring a large volume of images, however, collecting images is expensive and difficult in many scenarios. To alleviate this issue, many image augmentation algorithms have been proposed as effective and efficient strategies. Understanding current algorithms is essential to find suitable methods or develop novel techniques for given tasks. In this paper, we perform a comprehensive survey on image augmentation for deep learning with a novel informative taxonomy. To get the basic idea why we need image augmentation, we introduce the challenges in computer vision tasks and vicinity distribution. Then, the algorithms are split into three categories; model-free, model-based, and optimizing policy-based. The model-free category employs image processing methods while the model-based method leverages trainable image generation models. In contrast, the optimizing policy-based approach aims to find the optimal operations or their combinations. Furthermore, we discuss the current trend of common applications with two more active topics, leveraging different ways to understand image augmentation, such as group and kernel theory, and deploying image augmentation for unsupervised learning. Based on the analysis, we believe that our survey gives a better understanding helpful to choose suitable methods or design novel algorithms for practical applications.
updated: Wed Nov 23 2022 10:48:23 GMT+0000 (UTC)
published: Tue May 03 2022 13:45:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト