arXiv reaDer
画像分類のためのクラスバランス型アクティブラーニング
Class-Balanced Active Learning for Image Classification
アクティブラーニングは、ラベル付けされていない大規模なデータプールからラベルを要求する必要がある最も関連性の高いデータを選択する取得関数を学習することにより、アルゴリズムのトレーニングに必要なラベル付けの労力を軽減することを目的としています。アクティブラーニングは通常、クラスごとに同量の画像が利用できるバランスの取れたデータセットで研究されます。ただし、実際のデータセットは、深刻な不均衡なクラス、いわゆるロングテール分布に悩まされています。不均衡なデータプールは次善の分類器をもたらす可能性があるため、これはアクティブラーニングプロセスをさらに複雑にすることを主張します。アクティブラーニングのコンテキストでこの問題に対処するために、クラスバランシングを明示的に考慮に入れる一般的な最適化フレームワークを提案しました。 3つのデータセットの結果は、この方法が一般的であり(ほとんどの既存のアクティブラーニングアルゴリズムと組み合わせることができる)、有益な方法と代表的な方法の両方のパフォーマンスを向上させるために効果的に適用できることを示しました。さらに、バランスの取れたデータセットでも、私たちの方法は一般的にパフォーマンスの向上をもたらすことを示しました。
Active learning aims to reduce the labeling effort that is required to train algorithms by learning an acquisition function selecting the most relevant data for which a label should be requested from a large unlabeled data pool. Active learning is generally studied on balanced datasets where an equal amount of images per class is available. However, real-world datasets suffer from severe imbalanced classes, the so called long-tail distribution. We argue that this further complicates the active learning process, since the imbalanced data pool can result in suboptimal classifiers. To address this problem in the context of active learning, we proposed a general optimization framework that explicitly takes class-balancing into account. Results on three datasets showed that the method is general (it can be combined with most existing active learning algorithms) and can be effectively applied to boost the performance of both informative and representative-based active learning methods. In addition, we showed that also on balanced datasets our method generally results in a performance gain.
updated: Sat Oct 09 2021 11:30:26 GMT+0000 (UTC)
published: Sat Oct 09 2021 11:30:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト