arXiv reaDer
SiamMask:高速オンラインオブジェクト追跡とセグメンテーションのためのフレームワーク
SiamMask: A Framework for Fast Online Object Tracking and Segmentation
この論文では、同じ簡単な方法で、視覚オブジェクト追跡とビデオオブジェクトセグメンテーションの両方をリアルタイムで実行するフレームワークであるSiamMaskを紹介します。バイナリセグメンテーションタスクで損失を増やすことにより、一般的な完全畳み込みシャムアプローチのオフライントレーニング手順を改善します。オフライントレーニングが完了すると、SiamMaskは初期化に1つのバウンディングボックスのみを必要とし、高フレームレートで視覚的なオブジェクトの追跡とセグメンテーションを同時に実行できます。さらに、カスケード方式でマルチタスクモデルを再利用するだけで、フレームワークを拡張して複数のオブジェクトの追跡とセグメンテーションを処理できることを示します。実験結果は、私たちのアプローチが毎秒約55フレームという高い処理効率を持っていることを示しています。ビジュアルオブジェクトトラッキングベンチマークでリアルタイムの最先端の結果を生成すると同時に、ビデオオブジェクトセグメンテーションベンチマークで高速で競争力のあるパフォーマンスを発揮します。
In this paper we introduce SiamMask, a framework to perform both visual object tracking and video object segmentation, in real-time, with the same simple method. We improve the offline training procedure of popular fully-convolutional Siamese approaches by augmenting their losses with a binary segmentation task. Once the offline training is completed, SiamMask only requires a single bounding box for initialization and can simultaneously carry out visual object tracking and segmentation at high frame-rates. Moreover, we show that it is possible to extend the framework to handle multiple object tracking and segmentation by simply re-using the multi-task model in a cascaded fashion. Experimental results show that our approach has high processing efficiency, at around 55 frames per second. It yields real-time state-of-the-art results on visual-object tracking benchmarks, while at the same time demonstrating competitive performance at a high speed for video object segmentation benchmarks.
updated: Tue Jul 05 2022 14:47:17 GMT+0000 (UTC)
published: Tue Jul 05 2022 14:47:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト