微調整やベンチマークごとのハイパーパラメータ選択を必要としない、マルチオブジェクトの追跡とセグメンテーションの方法を提案します。提案されたトラッカーMeNToSは、特にデータの関連付けの問題に対処します。実際、最近導入されたHOTAメトリックは、検出と関連付けの品質のバランスを均等にすることで人間の視覚的評価との整合性が向上しているため、データの関連付けには依然として改善が必要であることが示されています。インスタンスセグメンテーションとオプティカルフローを使用してトラックレットを作成した後、提案された方法は、ワンショットビデオオブジェクトセグメンテーション用に開発された時空間メモリネットワークに依存して、トラックレットと時間的ギャップとの関連付けを改善します。 KITTIMOTSとMOTSChallengeでトラッカーを評価し、HOTAメトリックを使用したデータ関連付け戦略の利点を示しました。プロジェクトページはwww.mehdimiah.com/mentos+です。
We propose a method for multi-object tracking and segmentation that does not require fine-tuning or per benchmark hyper-parameter selection. The proposed tracker, MeNToS, addresses particularly the data association problem. Indeed, the recently introduced HOTA metric, which has a better alignment with the human visual assessment by evenly balancing detections and associations quality, has shown that improvements are still needed for data association. After creating tracklets using instance segmentation and optical flow, the proposed method relies on a space-time memory network developed for one-shot video object segmentation to improve the association of tracklets with temporal gaps. We evaluated our tracker on KITTIMOTS and MOTSChallenge and show the benefit of our data association strategy with the HOTA metric. The project page is www.mehdimiah.com/mentos+.