arXiv reaDer
高密度の時空間位置エンコーディングによるターゲットの追跡
Track Targets by Dense Spatio-Temporal Position Encoding
この作業では、変圧器を使用してビデオでターゲットを追跡するためのターゲットの位置をエンコードするための新しいパラダイムを提案します。提案されたパラダイムである高密度時空間 (DST) 位置エンコーディングは、時空間位置情報をピクセル単位の密な方法でエンコードします。提供された位置エンコーディングは、2 つの境界ボックス内のオブジェクトを比較することにより、外観の一致を超えて、フレーム全体でターゲットを関連付けるための位置情報を提供します。典型的なトランス位置エンコーディングと比較して、提案されたエンコーディングは、投影された特徴ベクトルの代わりに 2D CNN 特徴に適用され、位置情報の損失を回避します。さらに、設計された DST エンコーディングは、単一フレーム オブジェクトの位置と、フレーム間の軌跡の位置の進化を均一に表すことができます。 DST エンコーディングと統合して、トランスフォーマーベースのマルチオブジェクト追跡モデルを構築します。このモデルはビデオ クリップを入力として受け取り、クリップ内でターゲットの関連付けを行います。また、既存の軌跡を新しいフレームのオブジェクトに関連付けることで、オンライン推論を実行することもできます。ビデオ マルチオブジェクト トラッキング (MOT) およびマルチオブジェクト トラッキングとセグメンテーション (MOTS) データセットに関する実験は、提案された DST 位置エンコードの有効性を示しています。
In this work, we propose a novel paradigm to encode the position of targets for target tracking in videos using transformers. The proposed paradigm, Dense Spatio-Temporal (DST) position encoding, encodes spatio-temporal position information in a pixel-wise dense fashion. The provided position encoding provides location information to associate targets across frames beyond appearance matching by comparing objects in two bounding boxes. Compared to the typical transformer positional encoding, our proposed encoding is applied to the 2D CNN features instead of the projected feature vectors to avoid losing positional information. Moreover, the designed DST encoding can represent the location of a single-frame object and the evolution of the location of the trajectory among frames uniformly. Integrated with the DST encoding, we build a transformer-based multi-object tracking model. The model takes a video clip as input and conducts the target association in the clip. It can also perform online inference by associating existing trajectories with objects from the new-coming frames. Experiments on video multi-object tracking (MOT) and multi-object tracking and segmentation (MOTS) datasets demonstrate the effectiveness of the proposed DST position encoding.
updated: Mon Oct 17 2022 22:04:39 GMT+0000 (UTC)
published: Mon Oct 17 2022 22:04:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト