arXiv reaDer
一般的かつ効率的なアクティブラーニングに向けて
Towards General and Efficient Active Learning
アクティブラーニングは、限られた注釈予算を活用するために最も有益なサンプルを選択します。既存の作業は、時間のかかるモデルトレーニングとバッチデータ選択を複数回繰り返す面倒なパイプラインに従います。この論文では、設計された新しいパイプラインに従って、新しい一般的で効率的なアクティブラーニング(GEAL)手法を提案することにより、この現状に挑戦します。公開されている事前トレーニング済みモデルを利用して、この方法では、追加のトレーニングや監視なしで、同じモデルのシングルパス推論を使用して異なるデータセットからデータを選択します。微妙なローカル情報をキャプチャするために、中間の特徴から抽出された知識クラスターを提案します。面倒なバッチ選択戦略から解放され、すべてのデータサンプルは、きめ細かい知識クラスターレベルでの距離ベースのサンプリングを通じてワンショットで選択されます。このプロセス全体は、従来技術よりも何百倍も高速です。広範な実験により、オブジェクト検出、画像分類、およびセマンティックセグメンテーションに対するこの方法の有効性が検証されます。私たちのコードはhttps://github.com/yichen928/GEAL_active_learningで公開されています。
Active learning selects the most informative samples to exploit limited annotation budgets. Existing work follows a cumbersome pipeline that repeats the time-consuming model training and batch data selection multiple times. In this paper, we challenge this status quo by proposing a novel general and efficient active learning (GEAL) method following our designed new pipeline. Utilizing a publicly available pretrained model, our method selects data from different datasets with a single-pass inference of the same model without extra training or supervision. To capture subtle local information, we propose knowledge clusters extracted from intermediate features. Free from the troublesome batch selection strategy, all data samples are selected in one-shot through a distance-based sampling in the fine-grained knowledge cluster level. This whole process is faster than prior arts by hundreds of times. Extensive experiments verify the effectiveness of our method on object detection, image classification, and semantic segmentation. Our code is publicly available in https://github.com/yichen928/GEAL_active_learning.
updated: Sun Mar 20 2022 19:47:04 GMT+0000 (UTC)
published: Wed Dec 15 2021 08:35:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト