モデルのトレーニングを改善するために、データの例の重み付けや新しいインスタンスの追加などのデータの操作がますます使用されています。これまでの研究では、特定の種類のデータ操作用に設計されたさまざまなルールベースまたは学習ベースのアプローチが研究されてきました。この作業では、同じ勾配ベースのアルゴリズムで異なる操作スキームの学習をサポートする新しい方法を提案します。私たちのアプローチは、教師あり学習と強化学習(RL)の最近の接続に基づいており、RLの市販の報酬学習アルゴリズムをデータ操作学習とモデルトレーニングの両方に適応させています。 「データ報酬」機能の異なるパラメーター化は、異なる操作スキームをインスタンス化します。テキスト変換ネットワークを学習するデータの増強と、データサンプルの重要性を動的に調整するデータの重み付けを紹介します。実験により、結果のアルゴリズムは、低データ領域とクラス不均衡の問題で画像とテキストの分類パフォーマンスを大幅に改善することが示されています。
Manipulating data, such as weighting data examples or augmenting with new instances, has been increasingly used to improve model training. Previous work has studied various rule- or learning-based approaches designed for specific types of data manipulation. In this work, we propose a new method that supports learning different manipulation schemes with the same gradient-based algorithm. Our approach builds upon a recent connection of supervised learning and reinforcement learning (RL), and adapts an off-the-shelf reward learning algorithm from RL for joint data manipulation learning and model training. Different parameterization of the "data reward" function instantiates different manipulation schemes. We showcase data augmentation that learns a text transformation network, and data weighting that dynamically adapts the data sample importance. Experiments show the resulting algorithms significantly improve the image and text classification performance in low data regime and class-imbalance problems.