arXiv reaDer
RGBT顕著なオブジェクトの検出:大規模なデータセットとベンチマーク
RGBT Salient Object Detection: A Large-scale Dataset and Benchmark
複雑なシーンや環境での顕著な物体の検出は、難しい研究トピックです。ほとんどの作品はRGBベースの顕著なオブジェクト検出に焦点を当てており、暗い環境や複雑な背景などの悪条件に直面した場合、実際のアプリケーションのパフォーマンスを制限します。熱赤外線スペクトルイメージングは補足情報を提供し、多くのコンピュータービジョンタスクに適用されているため、RGBと熱赤外線画像を利用することは、複雑なシーンで顕著なオブジェクトを検出するための新しい研究方向になります。ただし、RGBTの顕著なオブジェクトの検出に関する現在の研究は、大規模なデータセットと包括的なベンチマークがないために制限されています。この作業は、グラウンドトゥルースアノテーション付きの空間的に配置された5000個のRGBT画像ペアを含む、VT5000という名前のそのようなRGBT画像データセットに貢献しています。 VT5000には、アルゴリズムの堅牢性を探索するために、さまざまなシーンや環境で収集された11の課題があります。このデータセットを使用して、各モダリティ内のマルチレベル機能を抽出し、注意メカニズムを使用してすべてのモダリティのこれらの機能を集約する強力なベースラインアプローチを提案し、正確なRGBT顕著オブジェクト検出を実現します。広範な実験は、提案されたベースラインアプローチがVT5000データセットおよび他の2つのパブリックデータセットで最先端の方法よりも優れていることを示しています。さらに、VT5000データセットでRGBT顕著オブジェクト検出のさまざまなアルゴリズムの包括的な分析を実行し、いくつかの価値ある結論を導き、RGBT顕著オブジェクト検出の潜在的な研究の方向性を提供します。
Salient object detection in complex scenes and environments is a challenging research topic. Most works focus on RGB-based salient object detection, which limits its performance of real-life applications when confronted with adverse conditions such as dark environments and complex backgrounds. Taking advantage of RGB and thermal infrared images becomes a new research direction for detecting salient object in complex scenes recently, as thermal infrared spectrum imaging provides the complementary information and has been applied to many computer vision tasks. However, current research for RGBT salient object detection is limited by the lack of a large-scale dataset and comprehensive benchmark. This work contributes such a RGBT image dataset named VT5000, including 5000 spatially aligned RGBT image pairs with ground truth annotations. VT5000 has 11 challenges collected in different scenes and environments for exploring the robustness of algorithms. With this dataset, we propose a powerful baseline approach, which extracts multi-level features within each modality and aggregates these features of all modalities with the attention mechanism, for accurate RGBT salient object detection. Extensive experiments show that the proposed baseline approach outperforms the state-of-the-art methods on VT5000 dataset and other two public datasets. In addition, we carry out a comprehensive analysis of different algorithms of RGBT salient object detection on VT5000 dataset, and then make several valuable conclusions and provide some potential research directions for RGBT salient object detection.
updated: Wed Nov 18 2020 12:27:14 GMT+0000 (UTC)
published: Tue Jul 07 2020 07:58:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト