arXiv reaDer
Bamboo:人間と機械の相乗効果で継続的にメガスケールのビジョンデータセットを構築する
Bamboo: Building Mega-Scale Vision Dataset Continually with Human-Machine Synergy
大規模なデータセットは、コンピュータービジョンにおいて重要な役割を果たします。既存のデータセットは、ヒューリスティックラベルシステムに従って収集されるか、サンプルに区別せずに盲目的に注釈が付けられるため、非効率的で拡張性がありません。メガスケールのデータセットを体系的に収集、注釈付け、構築する方法は、未解決の問題のままです。この作業では、包括的なラベルシステム上で高品質のビジョンデータセットを積極的かつ継続的に構築することを提唱します。具体的には、分類と検出の両方のためのメガスケールで情報密度の高いデータセットであるBambooDatasetを提供します。 Bambooは、69Mの画像分類アノテーションと170,586のオブジェクトバウンディングボックスアノテーションを包括的なカテゴリに追加することを目的としています。 ImageNet22KおよびObjects365と比較して、Bambooで事前トレーニングされたモデルは、さまざまなダウンストリームタスク間で優れたパフォーマンスを実現します(分類で6.2%の向上、検出で2.1%の向上)。さらに、1,000を超える実験からの大規模な事前トレーニングに関する貴重な観察結果を提供します。ラベルシステムとアノテーションパイプラインの両方でスケーラブルな性質を備えているため、Bambooは成長を続け、コミュニティの共同の取り組みから恩恵を受けます。これにより、より一般的なビジョンモデルへの道が開かれることを願っています。
Large-scale datasets play a vital role in computer vision. Existing datasets are either collected according to heuristic label systems or annotated blindly without differentiation to samples, making them inefficient and unscalable. How to systematically collect, annotate and build a mega-scale dataset remains an open question. In this work, we advocate building a high-quality vision dataset actively and continually on a comprehensive label system. Specifically, we contribute Bamboo Dataset, a mega-scale and information-dense dataset for both classification and detection. Bamboo aims to populate the comprehensive categories with 69M image classification annotations and 170,586 object bounding box annotations. Compared to ImageNet22K and Objects365, models pre-trained on Bamboo achieve superior performance among various downstream tasks (6.2% gains on classification and 2.1% gains on detection). In addition, we provide valuable observations regarding large-scale pre-training from over 1,000 experiments. Due to its scalable nature on both label system and annotation pipeline, Bamboo will continue to grow and benefit from the collective efforts of the community, which we hope would pave the way for more general vision models.
updated: Tue Mar 15 2022 13:01:00 GMT+0000 (UTC)
published: Tue Mar 15 2022 13:01:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト