arXiv reaDer
何が動くかを推測する:動きを予測することによる教師なしビデオと画像のセグメンテーション
Guess What Moves: Unsupervised Video and Image Segmentation by Anticipating Motion
オプティカルフローを介して測定されるモーションは、画像やビデオ内のオブジェクトを発見して学習するための強力な手がかりを提供します。ただし、外観を使用する場合と比較すると、オブジェクトが動かないと見えなくなるなどの死角があります。この作業では、モーションベースと外観ベースのセグメンテーションの長所を組み合わせたアプローチを提案します。画像セグメンテーションネットワークを監視し、単純なモーションパターンを含む可能性が高く、オブジェクトに対応する可能性が高い領域を予測することを提案します。このネットワークを2つのモードで適用します。教師なしビデオセグメンテーションモードでは、ネットワークは、これらのビデオをセグメント化するためのアルゴリズムとして学習プロセス自体を使用して、ラベルのないビデオのコレクションでトレーニングされます。教師なし画像セグメンテーションモデルでは、ネットワークはビデオを使用して学習され、独立した静止画像をセグメント化するために適用されます。これにより、教師なしビデオと画像のセグメンテーションで強力な経験的結果が得られ、DAVISなどのベンチマークで最先端のパフォーマンスを大幅に上回り、場合によっては5%のIoUギャップがあります。
Motion, measured via optical flow, provides a powerful cue to discover and learn objects in images and videos. However, compared to using appearance, it has some blind spots, such as the fact that objects become invisible if they do not move. In this work, we propose an approach that combines the strengths of motion-based and appearance-based segmentation. We propose to supervise an image segmentation network, tasking it with predicting regions that are likely to contain simple motion patterns, and thus likely to correspond to objects. We apply this network in two modes. In the unsupervised video segmentation mode, the network is trained on a collection of unlabelled videos, using the learning process itself as an algorithm to segment these videos. In the unsupervised image segmentation model, the network is learned using videos and applied to segment independent still images. With this, we obtain strong empirical results in unsupervised video and image segmentation, significantly outperforming the state of the art on benchmarks such as DAVIS, sometimes with a 5% IoU gap.
updated: Mon May 16 2022 17:55:34 GMT+0000 (UTC)
published: Mon May 16 2022 17:55:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト