arXiv reaDer
クラウドソーシングアノテーションの再考:マルチラベル画像分類のための顕著なラベルによる部分アノテーション
Rethinking Crowdsourcing Annotation: Partial Annotation with Salient Labels for Multi-Label Image Classification
注釈付き画像は、教師ありモデルのトレーニングと画像分類の評価の両方に必要です。画像に手動で注釈を付けることは、特にマルチラベルの画像の場合、面倒で費用がかかります。このような面倒な注釈タスクを実行する最近の傾向は、クラウドソーシングによるものです。クラウドソーシングでは、画像にボランティアまたはオンラインの有料ワーカー(Amazon Mechanical Turkのワーカーなど)が最初から注釈を付けます。ただし、クラウドソーシング画像の注釈の品質は保証できません。クラウドソーシング注釈の2つの主要な懸念事項は、不完全さと不正確さです。このような懸念に対処するために、クラウドソーシングアノテーションを再考します。単純な仮説は、アノテーターが自信を持って顕著なラベルでマルチラベル画像に部分的にのみアノテーションを付ける場合、アノテーションエラーが少なくなり、アノテーターが不確実性に費やす時間が少なくなるというものです。ラベル。嬉しい驚きとして、同じ注釈予算で、顕著な注釈のある画像によって監視されるマルチラベル画像分類子が、完全に注釈が付けられた画像によって監視されるモデルよりも優れていることを示します。私たちの方法の貢献は2つあります。マルチラベル画像の顕著なラベルを取得するためのアクティブラーニングの方法が提案されています。マルチラベル画像分類のために、特に部分注釈を使用する新しい適応温度関連モデル(ATAM)が提案されています。実用的なクラウドソーシングデータ、Open Street Map(OSM)データセットおよびベンチマークデータセットCOCO 2014で実験を行います。完全に注釈が付けられた画像でトレーニングされた最先端の分類方法と比較すると、提案されたATAMはより高い精度を達成できます。提案されたアイデアは、クラウドソーシングのデータ注釈に有望です。私たちのコードは公開されます。
Annotated images are required for both supervised model training and evaluation in image classification. Manually annotating images is arduous and expensive, especially for multi-labeled images. A recent trend for conducting such laboursome annotation tasks is through crowdsourcing, where images are annotated by volunteers or paid workers online (e.g., workers of Amazon Mechanical Turk) from scratch. However, the quality of crowdsourcing image annotations cannot be guaranteed, and incompleteness and incorrectness are two major concerns for crowdsourcing annotations. To address such concerns, we have a rethinking of crowdsourcing annotations: Our simple hypothesis is that if the annotators only partially annotate multi-label images with salient labels they are confident in, there will be fewer annotation errors and annotators will spend less time on uncertain labels. As a pleasant surprise, with the same annotation budget, we show a multi-label image classifier supervised by images with salient annotations can outperform models supervised by fully annotated images. Our method contributions are 2-fold: An active learning way is proposed to acquire salient labels for multi-label images; and a novel Adaptive Temperature Associated Model (ATAM) specifically using partial annotations is proposed for multi-label image classification. We conduct experiments on practical crowdsourcing data, the Open Street Map (OSM) dataset and benchmark dataset COCO 2014. When compared with state-of-the-art classification methods trained on fully annotated images, the proposed ATAM can achieve higher accuracy. The proposed idea is promising for crowdsourcing data annotation. Our code will be publicly available.
updated: Mon Sep 06 2021 18:28:53 GMT+0000 (UTC)
published: Mon Sep 06 2021 18:28:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト