データ拡張は、深層学習の成功に大きく貢献する要素ですが、常に利用できるとは限らない以前のドメイン知識に大きく依存しています。自動データ拡張に関する最近の研究では、一連の拡張操作を形成するポリシーを学習しますが、これらはまだ事前定義されており、限られたオプションに制限されています。この論文では、ラベルの最小限の十分な情報を保存することを目的とした表現学習原理から、事前のない自律的なデータ拡張の目的を導き出すことができることを示します。例が与えられた場合、この目的は、元のラベルを維持しながら、拡張として遠く離れた「ハードポジティブ例」を作成することを目的としています。次に、教師あり、半教師あり、およびノイジー ラベル学習など、幅広いクラスの機械学習タスクの既存の方法に効率的に最適化してシームレスに統合できる、目的の実用的な代理を提案します。以前の作品とは異なり、私たちの方法は、追加の生成モデルをトレーニングする必要はありませんが、代わりに、データ拡張を生成するためにエンドタスク モデルの中間層表現を活用します。実験では、私たちの方法が、効率と最終的なパフォーマンスの両方から、前述の 3 つの学習タスクに自明ではない改善を一貫してもたらすことを示しています。既存の拡張技術はうまく機能しません。コードは https://github.com/kai-wen-yang/LPA3}{https://github.com/kai-wen-yang/LPA3 で入手できます。
Data augmentation is a critical contributing factor to the success of deep learning but heavily relies on prior domain knowledge which is not always available. Recent works on automatic data augmentation learn a policy to form a sequence of augmentation operations, which are still pre-defined and restricted to limited options. In this paper, we show that a prior-free autonomous data augmentation's objective can be derived from a representation learning principle that aims to preserve the minimum sufficient information of the labels. Given an example, the objective aims at creating a distant "hard positive example" as the augmentation, while still preserving the original label. We then propose a practical surrogate to the objective that can be optimized efficiently and integrated seamlessly into existing methods for a broad class of machine learning tasks, e.g., supervised, semi-supervised, and noisy-label learning. Unlike previous works, our method does not require training an extra generative model but instead leverages the intermediate layer representations of the end-task model for generating data augmentations. In experiments, we show that our method consistently brings non-trivial improvements to the three aforementioned learning tasks from both efficiency and final performance, either or not combined with strong pre-defined augmentations, e.g., on medical images when domain knowledge is unavailable and the existing augmentation techniques perform poorly. Code is available at: https://github.com/kai-wen-yang/LPA3}{https://github.com/kai-wen-yang/LPA3.