ビジュアル トラッカーには、ネットワークと後処理が含まれます。水中画像の色の歪みと低コントラストにもかかわらず、深層学習によってネットワークがターゲットの外観の特徴を識別できるようになるため、高度なトラッカーは水中のオブジェクト追跡において依然として非常に競争力があります。ただし、水中の物体追跡には別の問題もあります。魚やイルカなどの水中の対象物は群れで出現することが多く、同じ種の生物は見た目の特徴が似ていることが多いため、ネットワークだけで弱差特性を判別することは困難です。既存の検出ベースの後処理は、単一フレーム検出の結果のみを反映しますが、類似のターゲットの中から実際のターゲットを見つけることはできません。この論文では、モーションに基づく新しい後処理戦略を提案します。これは、カルマン フィルター (KF) を使用して、ターゲットのモーション情報を維持し、周囲の同様のターゲットを除外します。具体的には、応答マップ内の KF 予測ボックスと候補ボックス、およびそれらの信頼度を使用して、実際のターゲットを見つけるための候補位置スコアを計算します。私たちの方法は、ネットワーク構造を変更したり、トラッカーの追加のトレーニングを実行したりしません。同様のターゲット問題を持つ他の追跡フィールドにすばやく適用できます。この方法に基づいて SOTA トラッカーを改良し、UOT100 と UTB180 での方法の有効性を証明しました。同様のサブシーケンスに対する OSTrack のメソッドの AUC は、平均で 3% 以上改善され、精度と正規化の精度は平均で 3.5% 以上改善されています。我々の方法は、同様のターゲット問題を処理する上で良好な互換性を持ち、他の方法と一緒にトラッカーのパフォーマンスを向上させることができることが証明されています.詳細については、https://github.com/LiYunfengLYF/KF_in_underwater_trackers を参照してください。
Visual tracker includes network and post-processing. Despite the color distortion and low contrast of underwater images, advanced trackers can still be very competitive in underwater object tracking because deep learning empowers the networks to discriminate the appearance features of the target. However, underwater object tracking also faces another problem. Underwater targets such as fish and dolphins, usually appear in groups, and creatures of the same species usually have similar expressions of appearance features, so it is challenging to distinguish the weak differences characteristics only by the network itself. The existing detection-based post-processing only reflects the results of single frame detection, but cannot locate real targets among similar targets. In this paper, we propose a new post-processing strategy based on motion, which uses Kalman filter (KF) to maintain the motion information of the target and exclude similar targets around. Specifically, we use the KF predicted box and the candidate boxes in the response map and their confidence to calculate the candidate location score to find the real target. Our method does not change the network structure, nor does it perform additional training for the tracker. It can be quickly applied to other tracking fields with similar target problem. We improved SOTA trackers based on our method, and proved the effectiveness of our method on UOT100 and UTB180. The AUC of our method for OSTrack on similar subsequences is improved by more than 3% on average, and the precision and normalization precision are improved by more than 3.5% on average. It has been proved that our method has good compatibility in dealing with similar target problems and can enhance performance of the tracker together with other methods. More details can be found in: https://github.com/LiYunfengLYF/KF_in_underwater_trackers.