最新のトラッカーは、水中の画像劣化に対処する際に優れたパフォーマンスを発揮しますが、水中オブジェクト トラッキング (UOT) に適用する際にはまだ 2 つの問題があります。一方では、単一オブジェクト トラッカーは屋外のデータセットでトレーニングされます。つまり、トラッカーが UOT に適用された場合、水中のオブジェクトと屋外のオブジェクトの間で深刻なサンプルの不均衡が生じます。一方で、魚やイルカなど水中の対象物は見た目が似ていることが多く、識別力の弱い特徴をモデル自体で判別することは困難です。既存の検出ベースの後処理では、追跡されたターゲットを類似のオブジェクトから区別することは困難です。この論文では、水中画像と野外シーケンスハイブリッドトレーニング(UOHT)とモーションベースのポストプロセッシング(MBPP)で構成されるUOSTrackを提案します。 UOHT は、サンプルの不均衡水中トラッカーを調整するように設計されています。具体的には、水中物体検出 (UOD) 画像は、カスタマイズされたデータ増強によって画像ペアに変換されるため、トラッカーはより多くの水中ドメイン トレーニング サンプルを持ち、水中物体の特徴表現を学習します。 MBPP は、ターゲット周辺の類似オブジェクトを除外するために提案されています。具体的には、カルマン フィルターによって予測された推定ボックスと各フレームの候補ボックスを使用して、ターゲットが失われたときに候補領域に隠れているターゲットを再確認します。 UOSTrack は、UOT100 および UTB180 データセットの類似オブジェクト チャレンジで OSTrack より平均 3.5% パフォーマンスが向上しています。 UOT100 と UTB180 での UOSTrack の平均パフォーマンス向上は、それぞれ 1% と 3% です。 2 つの UOT ベンチマークでの実験は、UOHT と MBPP の有効性、および UOT に対する MBPP の一般化と適用可能性を示しています。
Although modern trackers have competitive performance when dealing with underwater image degradation, there are still two problems when applying them to Underwater Object Tracking (UOT). On the one hand, the single object tracker is trained on the open-air datasets, which means that the tracker has a serious sample imbalance between underwater objects and open-air objects when applied to UOT. On the other hand, underwater targets such as fish and dolphins usually have a similar appearance, it is challenging for the model itself to discriminate the weak discriminative features. The existing detection-based post processing is hard to distinguish the tracked target among similar objects. In this paper, we propose UOSTrack, which consists of Underwater images and Open-air sequences Hybrid Training (UOHT) and Motion-based Post Processing (MBPP). UOHT is designed to adjust the sample imbalance underwater tracker. Specifically, Underwater Object Detection (UOD) image is converted into imag pairs through customized data augmentation, so that the tracker has more underwater domain training samples and learn the feature expression of underwater objects. MBPP is proposed to exclude similar objects around the target. Specifically, it uses the estimation box predicted by the Kalman Filter and candidate boxes in each frame to reconfirm the target that is hidden in the candidate area when the target is lost. UOSTrack has an average performance improvement of 3.5% over OSTrack on Similar Object challenge of the UOT100 and UTB180 datasets. The average performance improvement of UOSTrack on UOT100 and UTB180 is 1% and 3%, respectively. Experiments on two UOT benchmarks demonstrate the effectiveness of UOHT and MBPP, and the generalization and applicability of MBPP for UOT.