arXiv reaDer
OmniTracker: Tracking-with-Detection によるオブジェクト追跡の統合
OmniTracker: Unifying Object Tracking by Tracking-with-Detection
オブジェクト トラッキング (OT) は、ビデオ シーケンス内のターゲット オブジェクトの位置を推定することを目的としています。ターゲットオブジェクトの初期状態が最初のフレームまたはカテゴリで提供される注釈によって指定されるかどうかに応じて、OT はインスタンス追跡 (例: SOT および VOS) およびカテゴリ追跡 (例: MOT、MOTS、および VIS) タスクとして分類できます。 .両方のコミュニティで開発されたベスト プラクティスの利点を組み合わせて、新しい検出付き追跡パラダイムを提案します。このパラダイムでは、追跡が検出のために出現前を補完し、検出が関連付けのための候補境界ボックスで追跡を提供します。このような設計を備えた統合追跡モデル OmniTracker は、完全に共有されたネットワーク アーキテクチャ、モデルの重み、および推論パイプラインを使用してすべての追跡タスクを解決するためにさらに提示されます。 LaSOT、TrackingNet、DAVIS16-17、MOT17、MOTS20、YTVIS19 を含む 7 つの追跡データセットに関する広範な実験では、OmniTracker がタスク固有の追跡モデルと統合された追跡モデルの両方よりも同等またはそれ以上の結果を達成することが実証されています。
Object tracking (OT) aims to estimate the positions of target objects in a video sequence. Depending on whether the initial states of target objects are specified by provided annotations in the first frame or the categories, OT could be classified as instance tracking (e.g., SOT and VOS) and category tracking (e.g., MOT, MOTS, and VIS) tasks. Combing the advantages of the best practices developed in both communities, we propose a novel tracking-with-detection paradigm, where tracking supplements appearance priors for detection and detection provides tracking with candidate bounding boxes for association. Equipped with such a design, a unified tracking model, OmniTracker, is further presented to resolve all the tracking tasks with a fully shared network architecture, model weights, and inference pipeline. Extensive experiments on 7 tracking datasets, including LaSOT, TrackingNet, DAVIS16-17, MOT17, MOTS20, and YTVIS19, demonstrate that OmniTracker achieves on-par or even better results than both task-specific and unified tracking models.
updated: Tue Mar 21 2023 17:59:57 GMT+0000 (UTC)
published: Tue Mar 21 2023 17:59:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト