arXiv reaDer
隠されたオブジェクトの検出
Concealed Object Detection
背景に「完全に」埋め込まれているオブジェクトを識別することを目的とした、隠しオブジェクト検出(COD)に関する最初の体系的な研究を紹介します。隠されたオブジェクトとその背景の間の高い固有の類似性により、CODは従来のオブジェクトの検出/セグメンテーションよりもはるかに困難になります。このタスクをよりよく理解するために、COD10Kと呼ばれる大規模なデータセットを収集します。これは、78のオブジェクトカテゴリからのさまざまな現実世界のシナリオで隠されたオブジェクトをカバーする10,000枚の画像で構成されます。さらに、オブジェクトカテゴリ、オブジェクト境界、やりがいのある属性、オブジェクトレベルのラベル、インスタンスレベルの注釈などの豊富な注釈を提供します。私たちのCOD10Kは、これまでで最大のCODデータセットであり、最も豊富な注釈が付いています。これにより、隠されたオブジェクトを包括的に理解でき、検出、セグメンテーション、分類など、他のいくつかの視覚タスクの進行に使用することもできます。野生では、検索識別ネットワーク(SINet)と呼ばれるCODのシンプルで強力なベースラインも設計します。 SINetは、テストされたすべてのデータセットで12の最先端のベースラインを上回り、CODの将来の研究の触媒として役立つ可能性のある堅牢で一般的なアーキテクチャになっています。最後に、いくつかの興味深い発見を提供し、いくつかの潜在的なアプリケーションと将来の方向性を強調します。この新しい分野での研究を促進するために、コード、データセット、およびオンラインデモは、プロジェクトページhttp://mmcheng.net/codで入手できます。
We present the first systematic study on concealed object detection (COD), which aims to identify objects that are "perfectly" embedded in their background. The high intrinsic similarities between the concealed objects and their background make COD far more challenging than traditional object detection/segmentation. To better understand this task, we collect a large-scale dataset, called COD10K, which consists of 10,000 images covering concealed objects in diverse real-world scenarios from 78 object categories. Further, we provide rich annotations including object categories, object boundaries, challenging attributes, object-level labels, and instance-level annotations. Our COD10K is the largest COD dataset to date, with the richest annotations, which enables comprehensive concealed object understanding and can even be used to help progress several other vision tasks, such as detection, segmentation, classification, etc. Motivated by how animals hunt in the wild, we also design a simple but strong baseline for COD, termed the Search Identification Network (SINet). Without any bells and whistles, SINet outperforms 12 cutting-edge baselines on all datasets tested, making them robust, general architectures that could serve as catalysts for future research in COD. Finally, we provide some interesting findings and highlight several potential applications and future directions. To spark research in this new field, our code, dataset, and online demo are available on our project page: http://mmcheng.net/cod.
updated: Thu Jun 10 2021 05:36:12 GMT+0000 (UTC)
published: Sat Feb 20 2021 06:49:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト