arXiv reaDer
正確なシャム追跡の教師なし学習
Unsupervised Learning of Accurate Siamese Tracking
教師なし学習は、視覚オブジェクトの追跡など、さまざまなコンピュータビジョンタスクで人気があります。ただし、以前の教師なし追跡アプローチは、テンプレートと検索のペアからの空間監視に大きく依存しており、長期間にわたって大きな変動があるオブジェクトを追跡することはできません。時間のサイクルに沿ってビデオを追跡することで無制限の自己監視信号を取得できるため、ビデオを前後に追跡することでシャムトラッカーの進化を調査します。分類ブランチと回帰ブランチの両方で時間的対応を学習できる、新しい教師なし追跡フレームワークを提示します。具体的には、順方向伝播プロセスで信頼できるテンプレート機能を伝播して、トラッカーをサイクルでトレーニングできるようにするために、最初に整合性伝播変換を提案します。次に、後方伝播プロセスの従来のサイクルトレーニングにおける不適切なペナルティ問題を特定します。したがって、特徴を選択するだけでなく、中間フレームのトラッキングエラーに暗黙的にペナルティを課すために、微分可能な領域マスクが提案されます。さらに、ノイズの多いラベルはトレーニングを低下させる可能性があるため、疑似ラベルの品質に基づいて動的な重みを割り当てるためのマスクガイドによる損失の再重み付け戦略を提案します。大規模な実験では、TrackingNetやLaSOTなどの大規模なデータセットでの教師あり手法と同等のパフォーマンスで、トラッカーは教師なし手法よりも大幅に優れています。コードはhttps://github.com/FlorinShum/ULASTで入手できます。
Unsupervised learning has been popular in various computer vision tasks, including visual object tracking. However, prior unsupervised tracking approaches rely heavily on spatial supervision from template-search pairs and are still unable to track objects with strong variation over a long time span. As unlimited self-supervision signals can be obtained by tracking a video along a cycle in time, we investigate evolving a Siamese tracker by tracking videos forward-backward. We present a novel unsupervised tracking framework, in which we can learn temporal correspondence both on the classification branch and regression branch. Specifically, to propagate reliable template feature in the forward propagation process so that the tracker can be trained in the cycle, we first propose a consistency propagation transformation. We then identify an ill-posed penalty problem in conventional cycle training in backward propagation process. Thus, a differentiable region mask is proposed to select features as well as to implicitly penalize tracking errors on intermediate frames. Moreover, since noisy labels may degrade training, we propose a mask-guided loss reweighting strategy to assign dynamic weights based on the quality of pseudo labels. In extensive experiments, our tracker outperforms preceding unsupervised methods by a substantial margin, performing on par with supervised methods on large-scale datasets such as TrackingNet and LaSOT. Code is available at https://github.com/FlorinShum/ULAST.
updated: Mon Apr 04 2022 13:39:43 GMT+0000 (UTC)
published: Mon Apr 04 2022 13:39:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト