この論文では、バックグラウンド減算による教師なしビデオオブジェクトのセグメンテーションの問題を検討します。具体的には、ビデオの移動オブジェクトの非セマンティック抽出を、スパース行列と低ランク行列の合計を介した非凸最適化問題として提起します。結果の定式化は、ロバスト主成分分析の非負のバリアントであり、一般的に採用されている凸緩和よりも計算的に扱いやすいですが、一般的には全体的な最適性に対しては解けません。この制限にもかかわらず、ローカル検索方法を使用してオブジェクトセグメンテーションの一意性とグローバルな最適性が保証されるビデオデータの直感的で解釈可能な条件を導き出します。実際のビデオデータを使用したセグメンテーションの例を通して、これらの新しい最適性基準を示します。
In this paper, we consider the problem of unsupervised video object segmentation via background subtraction. Specifically, we pose the nonsemantic extraction of a video's moving objects as a nonconvex optimization problem via a sum of sparse and low-rank matrices. The resulting formulation, a nonnegative variant of robust principal component analysis, is more computationally tractable than its commonly employed convex relaxation, although not generally solvable to global optimality. In spite of this limitation, we derive intuitive and interpretable conditions on the video data under which the uniqueness and global optimality of the object segmentation are guaranteed using local search methods. We illustrate these novel optimality criteria through example segmentations using real video data.