arXiv reaDer
フルアノテーションかウィークアノテーションか?予算に制約のあるアノテーション キャンペーンの適応戦略
Full or Weak annotations? An adaptive strategy for budget-constrained annotation campaigns
機械学習タスク用の新しいデータセットに注釈を付けるのは、面倒で、時間とコストがかかります。セグメンテーション アプリケーションの場合、関連する画像コンテンツの手動による描写はしばしば非常に高価であるか、ドメイン固有の知識を持つ専門家のみが行うことができるため、負担は特に高くなります。弱い教師による転移学習とトレーニングの発展のおかげで、セグメンテーション モデルはさまざまな種類の注釈から大きな恩恵を受けることができるようになりました。ただし、弱い監視の使用を検討している新しいドメイン アプリケーションの場合、データセット ビルダーは、完全なセグメンテーションとその他の弱い注釈を配布するための戦略を定義する必要があります。ただし、特定の新しいデータセットの注釈予算をどのように分配するかはアプリオリに不明であるため、そうするのは困難です。この目的のために、セグメンテーション データセットのアノテーション戦略を決定するための新しいアプローチを提案します。これにより、固定予算で収集する必要があるセグメンテーションおよび分類アノテーションの割合を推定します。そうするために、私たちの方法は、最終的なセグメンテーションモデルの予想される改善をモデル化することにより、予算分数のために収集するセグメンテーションと分類の注釈の割合を順次決定します。私たちの実験では、私たちのアプローチが、多くの異なるアノテーション予算とデータセットに対して最適に非常に近いパフォーマンスを発揮するアノテーションを生み出すことを示しています。
Annotating new datasets for machine learning tasks is tedious, time-consuming, and costly. For segmentation applications, the burden is particularly high as manual delineations of relevant image content are often extremely expensive or can only be done by experts with domain-specific knowledge. Thanks to developments in transfer learning and training with weak supervision, segmentation models can now also greatly benefit from annotations of different kinds. However, for any new domain application looking to use weak supervision, the dataset builder still needs to define a strategy to distribute full segmentation and other weak annotations. Doing so is challenging, however, as it is a priori unknown how to distribute an annotation budget for a given new dataset. To this end, we propose a novel approach to determine annotation strategies for segmentation datasets, whereby estimating what proportion of segmentation and classification annotations should be collected given a fixed budget. To do so, our method sequentially determines proportions of segmentation and classification annotations to collect for budget-fractions by modeling the expected improvement of the final segmentation model. We show in our experiments that our approach yields annotations that perform very close to the optimal for a number of different annotation budgets and datasets.
updated: Tue Mar 21 2023 08:41:54 GMT+0000 (UTC)
published: Tue Mar 21 2023 08:41:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト