DomainSiam: Domain-Aware Siamese Network for Visual Object Tracking
ビジュアルオブジェクトの追跡は、コンピュータービジョンの分野における基本的なタスクです。最近、シャムのトラッカーは最近のベンチマークで最先端のパフォーマンスを達成しました。ただし、シャムのトラッカーは、画像分類タスクでトレーニングされた事前トレーニング済みネットワークからのセマンティックおよびオブジェクトネス情報を完全には利用していません。さらに、事前にトレーニングされたシャムアーキテクチャは、カテゴリラベルによってまばらにアクティブ化されるため、不必要な計算と過剰適合が発生します。この論文では、リッジ回帰ネットワークを使用してクラスに依存しない、セマンティックおよびオブジェクトネス情報を完全に活用するドメイン認識を学習することを提案します。さらに、スパース性の問題を減らすために、微分可能な重み付き動的損失関数でリッジ回帰問題を解きます。 DomainSiamと呼ばれるトラッカーは、トレーニング段階での機能学習と他のドメインへの一般化機能を改善します。検証セットのOTB2013およびOTB2015を含む5つの追跡ベンチマークで、広範な実験が行われています。テストセット用のVOT2017、VOT2018、LaSOT、TrackingNet、GOT10kも同様です。 DomainSiamは、53 FPSで動作しながら、これらのベンチマークで最先端のパフォーマンスを達成しています。
Visual object tracking is a fundamental task in the field of computer vision. Recently, Siamese trackers have achieved state-of-the-art performance on recent benchmarks. However, Siamese trackers do not fully utilize semantic and objectness information from pre-trained networks that have been trained on the image classification task. Furthermore, the pre-trained Siamese architecture is sparsely activated by the category label which leads to unnecessary calculations and overfitting. In this paper, we propose to learn a Domain-Aware, that is fully utilizing semantic and objectness information while producing a class-agnostic using a ridge regression network. Moreover, to reduce the sparsity problem, we solve the ridge regression problem with a differentiable weighted-dynamic loss function. Our tracker, dubbed DomainSiam, improves the feature learning in the training phase and generalization capability to other domains. Extensive experiments are performed on five tracking benchmarks including OTB2013 and OTB2015 for a validation set; as well as the VOT2017, VOT2018, LaSOT, TrackingNet, and GOT10k for a testing set. DomainSiam achieves state-of-the-art performance on these benchmarks while running at 53 FPS.
updated: Wed Aug 21 2019 15:04:24 GMT+0000 (UTC)
published: Wed Aug 21 2019 15:04:24 GMT+0000 (UTC)
