データの準備、つまり生データを効果的な機械学習モデルのトレーニングに使用できる形式に変換するプロセスは、面倒で時間のかかる作業です。画像データの場合、前処理には通常、画像のトリミング、フィルタリング、回転、反転などの一連の基本的な変換が含まれます。現在、データサイエンティストは、経験に基づいて、特定の画像データセットにどの変換をどの特定の順序で適用するかを手動で決定しています。現実世界のデータサイエンスプロジェクトのボトルネックを構成することに加えて、手動の画像データ前処理は、データサイエンティストが可能な画像変換の空間を探索するときに直感または試行錯誤のアプローチに依存する必要があるため、次善の結果をもたらす可能性があります。最も効果的なものを発見してください。手動データ前処理の非効率性と潜在的な非効率性を軽減するために、この論文では、画像分類器をトレーニングするための最適なデータ前処理ステップを自動的に発見するための深層強化学習フレームワークを提案します。フレームワークは、ラベル付けされた画像と事前定義された前処理変換の入力セットを受け取ります。分類器と個々の画像の最適な前処理変換を共同で学習します。実験結果は、提案されたアプローチが画像分類器の精度を改善するだけでなく、テスト時のノイズの多い入力に対してそれらを実質的によりロバストにすることを示しています。
Data preparation, i.e. the process of transforming raw data into a format that can be used for training effective machine learning models, is a tedious and time-consuming task. For image data, preprocessing typically involves a sequence of basic transformations such as cropping, filtering, rotating or flipping images. Currently, data scientists decide manually based on their experience which transformations to apply in which particular order to a given image data set. Besides constituting a bottleneck in real-world data science projects, manual image data preprocessing may yield suboptimal results as data scientists need to rely on intuition or trial-and-error approaches when exploring the space of possible image transformations and thus might not be able to discover the most effective ones. To mitigate the inefficiency and potential ineffectiveness of manual data preprocessing, this paper proposes a deep reinforcement learning framework to automatically discover the optimal data preprocessing steps for training an image classifier. The framework takes as input sets of labeled images and predefined preprocessing transformations. It jointly learns the classifier and the optimal preprocessing transformations for individual images. Experimental results show that the proposed approach not only improves the accuracy of image classifiers, but also makes them substantially more robust to noisy inputs at test time.