arXiv reaDer
マルチモーダルビジュアルトラッキング:レビューと実験的比較
Multi-modal Visual Tracking: Review and Experimental Comparison
コンピュータビジョンの基本的なタスクとして、視覚オブジェクトの追跡は、近年多くの注目を集めています。トラッカーをより広い範囲のアプリケーションに拡張するために、研究者は特定のシーンを処理するために複数のモダリティからの情報を導入しました。これは、新しい方法とベンチマークを備えた有望な研究の見通しです。マルチモーダル追跡の徹底的なレビューを提供するために、マルチモーダル追跡アルゴリズム、特に可視深度(RGB-D)追跡と可視熱(RGB-T)追跡を、さまざまな側面から統一された分類法で要約します。次に、関連するベンチマークと課題の詳細な説明を提供します。さらに、PTB、VOT19-RGBD、GTOT、RGBT234、およびVOT19-RGBTの5つのデータセットでトラッカーの有効性を分析するための広範な実験を実施します。最後に、モデル設計やさらなる研究のためのデータセット構築など、さまざまな観点からさまざまな将来の方向性について説明します。
Visual object tracking, as a fundamental task in computer vision, has drawn much attention in recent years. To extend trackers to a wider range of applications, researchers have introduced information from multiple modalities to handle specific scenes, which is a promising research prospect with emerging methods and benchmarks. To provide a thorough review of multi-modal track-ing, we summarize the multi-modal tracking algorithms, especially visible-depth (RGB-D) tracking and visible-thermal (RGB-T) tracking in a unified taxonomy from different aspects. Second, we provide a detailed description of the related benchmarks and challenges. Furthermore, we conduct extensive experiments to analyze the effectiveness of trackers on five datasets: PTB, VOT19-RGBD, GTOT, RGBT234, and VOT19-RGBT. Finally, we discuss various future directions from different perspectives, including model design and dataset construction for further research.
updated: Tue Dec 08 2020 02:39:38 GMT+0000 (UTC)
published: Tue Dec 08 2020 02:39:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト