arXiv reaDer
アクティブラーニングのための自己監視型口実タスクの使用
Using Self-Supervised Pretext Tasks for Active Learning
大量のデータセットにラベルを付けるにはコストがかかります。アクティブラーニングは、ラベルのないセットから最も有益なデータのみに注釈を付けるように依頼することで、この問題に取り組むことを目的としています。自己監視型の口実タスクと独自のデータサンプラーを利用して、困難で代表的なデータを選択する、新しいアクティブラーニングアプローチを提案します。回転予測などの単純な自己監視の口実タスクの損失は、下流のタスクの損失と密接に関連していることがわかります。口実タスク学習者は、ラベルなしセットでトレーニングされ、ラベルなしデータは、口実タスクの損失によってバッチにソートおよびグループ化されます。各反復では、メインタスクモデルを使用して、注釈を付けるバッチ内の最も不確実なデータをサンプリングします。さまざまな画像分類およびセグメンテーションベンチマークでメソッドを評価し、CIFAR10、Caltech-101、ImageNet、およびCityScapesで魅力的なパフォーマンスを実現します。
Labeling a large set of data is expensive. Active learning aims to tackle this problem by asking to annotate only the most informative data from the unlabeled set. We propose a novel active learning approach that utilizes self-supervised pretext tasks and a unique data sampler to select data that are both difficult and representative. We discover that the loss of a simple self-supervised pretext task, such as rotation prediction, is closely correlated to the downstream task loss. The pretext task learner is trained on the unlabeled set, and the unlabeled data are sorted and grouped into batches by their pretext task losses. In each iteration, the main task model is used to sample the most uncertain data in a batch to be annotated. We evaluate our method on various image classification and segmentation benchmarks and achieve compelling performances on CIFAR10, Caltech-101, ImageNet, and CityScapes.
updated: Wed Jan 19 2022 07:58:06 GMT+0000 (UTC)
published: Wed Jan 19 2022 07:58:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト