データ増強は、特にディープニューラルネットワークのトレーニング時に一般化を改善する効果的な方法論として広く適用されています。最近、研究者はいくつかの集中的なデータ増強技術を提案しましたが、実際に精度が向上しましたが、これらの方法がデータを増強するとクリーンなデータと増強されたデータの間にかなりのギャップが生じることに気付きます。この論文では、分析的観点からこの問題を再検討し、それぞれ経験的リスクと一般化誤差という2つの用語を使用して予想リスクの上限を推定します。正則化としてのデータ増大の理解を深め、主要な機能を強調します。その結果、データの増強により一般化エラーが大幅に削減されますが、その一方で経験的リスクがわずかに高くなります。データ増強はモデルがより良い領域に収束するのに役立つという仮定で、モデルは単純な方法、すなわち、あまり増強されていないデータを使用して、完全に増強されたデータで訓練されたモデルを改良することによって達成されるより低い経験的リスクの恩恵を受けることができます。私たちのアプローチは、いくつかの標準的な画像分類ベンチマークで一貫した精度向上を達成し、その向上はオブジェクト検出に移行します。
Data augmentation has been widely applied as an effective methodology to improve generalization in particular when training deep neural networks. Recently, researchers proposed a few intensive data augmentation techniques, which indeed improved accuracy, yet we notice that these methods augment data have also caused a considerable gap between clean and augmented data. In this paper, we revisit this problem from an analytical perspective, for which we estimate the upper-bound of expected risk using two terms, namely, empirical risk and generalization error, respectively. We develop an understanding of data augmentation as regularization, which highlights the major features. As a result, data augmentation significantly reduces the generalization error, but meanwhile leads to a slightly higher empirical risk. On the assumption that data augmentation helps models converge to a better region, the model can benefit from a lower empirical risk achieved by a simple method, i.e., using less-augmented data to refine the model trained on fully-augmented data. Our approach achieves consistent accuracy gain on a few standard image classification benchmarks, and the gain transfers to object detection.