この論文では、オプティカルフローからのモーションセグメンテーションのためのCNNベースの完全に教師なしの方法を紹介します。入力オプティカル フローは、パラメトリック モーション モデル (通常はアフィンまたは二次モーション モデル) の区分的なセットとして表すことができると仮定します。私たちの仕事の核となるアイデアは、根拠のある方法で損失関数とモーション セグメンテーション ニューラル ネットワークの訓練手順を設計するために、期待値最大化 (EM) フレームワークを活用することです。注釈。ただし、従来の反復 EM とは対照的に、ネットワークがトレーニングされると、モーション モデルを推定することなく、単一の推論ステップで目に見えないオプティカル フロー フィールドのセグメンテーションを提供できます。堅牢な損失関数を含むさまざまな損失関数を調査し、オプティカル フローを入力として取る任意のネットワークに適用可能な、オプティカル フロー フィールドでの新しい効率的なデータ拡張手法を提案します。さらに、私たちの方法は、設計上、複数のモーションをセグメント化することができます。当社のモーション セグメンテーション ネットワークは、DAVIS2016、SegTrackV2、FBMS59、および MoCA の 4 つのベンチマークでテストされ、非常に良好に機能し、テスト時間は高速でした。
In this paper, we present a CNN-based fully unsupervised method for motion segmentation from optical flow. We assume that the input optical flow can be represented as a piecewise set of parametric motion models, typically, affine or quadratic motion models. The core idea of our work is to leverage the Expectation-Maximization (EM) framework in order to design in a well-founded manner a loss function and a training procedure of our motion segmentation neural network that does not require either ground-truth or manual annotation. However, in contrast to the classical iterative EM, once the network is trained, we can provide a segmentation for any unseen optical flow field in a single inference step and without estimating any motion models. We investigate different loss functions including robust ones and propose a novel efficient data augmentation technique on the optical flow field, applicable to any network taking optical flow as input. In addition, our method is able by design to segment multiple motions. Our motion segmentation network was tested on four benchmarks, DAVIS2016, SegTrackV2, FBMS59, and MoCA, and performed very well, while being fast at test time.