arXiv reaDer
TDT:完全に注釈が付けられたビデオなしで追跡する検出器を教える
TDT: Teaching Detectors to Track without Fully Annotated Videos
最近、ジョイントモデルを使用して1回のフォワードパスでの検出と外観の埋め込みの両方を予測する1ステージトラッカーが大きな注目を集め、マルチオブジェクトトラッキング(MOT)ベンチマークで最先端の結果を達成しました。ただし、それらの成功は、追跡データで完全に注釈が付けられたビデオの可用性に依存します。これは、費用がかかり、入手が困難です。これにより、モデルの一般化が制限される可能性があります。比較すると、検出と埋め込みを別々に実行する2段階のアプローチは低速ですが、データに注釈を付けるのが簡単なため、トレーニングが簡単です。データ蒸留アプローチを通じて、2つの世界の最良のものを組み合わせることを提案します。具体的には、Re-IDデータセットでトレーニングされた教師埋め込みを使用して、検出データセットの疑似外観埋め込みラベルを生成します。次に、拡張データセットを使用して、これらの疑似埋め込みを完全畳み込み方式で回帰できる検出器をトレーニングします。私たちが提案する1ステージのソリューションは、2ステージのソリューションと品質が一致しますが、3倍高速です。教師の埋め込み者はトレーニング中に追跡データを見ていませんが、提案されたトラッカーは、完全にラベル付けされた追跡データでトレーニングされたいくつかの人気のあるトラッカー(JDEなど)との競争力のあるパフォーマンスを実現します。
Recently, one-stage trackers that use a joint model to predict both detections and appearance embeddings in one forward pass received much attention and achieved state-of-the-art results on the Multi-Object Tracking (MOT) benchmarks. However, their success depends on the availability of videos that are fully annotated with tracking data, which is expensive and hard to obtain. This can limit the model generalization. In comparison, the two-stage approach, which performs detection and embedding separately, is slower but easier to train as their data are easier to annotate. We propose to combine the best of the two worlds through a data distillation approach. Specifically, we use a teacher embedder, trained on Re-ID datasets, to generate pseudo appearance embedding labels for the detection datasets. Then, we use the augmented dataset to train a detector that is also capable of regressing these pseudo-embeddings in a fully-convolutional fashion. Our proposed one-stage solution matches the two-stage counterpart in quality but is 3 times faster. Even though the teacher embedder has not seen any tracking data during training, our proposed tracker achieves competitive performance with some popular trackers (e.g. JDE) trained with fully labeled tracking data.
updated: Wed May 11 2022 15:56:17 GMT+0000 (UTC)
published: Wed May 11 2022 15:56:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト