arXiv reaDer
OmniLabel: 言語ベースのオブジェクト検出の挑戦的なベンチマーク
OmniLabel: A Challenging Benchmark for Language-Based Object Detection
言語ベースのオブジェクト検出は、単純なカテゴリ名をはるかに超える、画像内のオブジェクトを説明するための自然なインターフェイスを構築するための有望な方向性です。最近の方法はその方向で大きな進歩を見せていますが、適切な評価が不足しています。 OmniLabel を使用して、新しいタスク定義、データセット、および評価指標を提案します。このタスクには、標準語彙とオープン語彙の検出、および参照表現が含まれます。 OmniLabel は、25,000 を超える画像に 28,000 を超える一意のオブジェクトの説明を使用して、自然にオープンな語彙設定で多様で複雑なオブジェクトの説明を使用して、挑戦的なベンチマークを提供します。さらに、既存のベンチマークとの主な違いは、オブジェクトの説明が 1 つ、複数、またはまったくオブジェクトを参照できないため、自由形式のテキストで否定的な例を提供できることです。提案された評価は、大きなラベル スペースを処理し、修正された平均精度メトリックを介してパフォーマンスを判断します。これは、強力な言語ベースのベースラインを評価することによって検証されます。 OmniLabel は確かに、言語ベースの検出に関する将来の研究のための挑戦的なテスト ベッドを提供します。
Language-based object detection is a promising direction towards building a natural interface to describe objects in images that goes far beyond plain category names. While recent methods show great progress in that direction, proper evaluation is lacking. With OmniLabel, we propose a novel task definition, dataset, and evaluation metric. The task subsumes standard- and open-vocabulary detection as well as referring expressions. With more than 28K unique object descriptions on over 25K images, OmniLabel provides a challenging benchmark with diverse and complex object descriptions in a naturally open-vocabulary setting. Moreover, a key differentiation to existing benchmarks is that our object descriptions can refer to one, multiple or even no object, hence, providing negative examples in free-form text. The proposed evaluation handles the large label space and judges performance via a modified average precision metric, which we validate by evaluating strong language-based baselines. OmniLabel indeed provides a challenging test bed for future research on language-based detection.
updated: Mon Aug 14 2023 21:43:42 GMT+0000 (UTC)
published: Sat Apr 22 2023 18:35:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト