外れ値によって破損したデータから線形部分空間を学習する問題を考えます。古典的なアプローチは、通常、部分空間の次元が周囲の次元に比べて小さい場合のために設計されています。私たちのアプローチは、部分空間の二重表現で機能するため、その直交補完を見つけることを目的としています。そのため、寸法が周囲寸法に近い部分空間(相対寸法の高い部分空間)に特に適しています。我々はデュアル主成分追求(DPCP)問題を呼び出す球、上の非凸ℓ_1最小化問題としてインライア部分空間への法線ベクトルを計算する問題を提起します。 DPCPのすべてのグローバルソリューションが、インライア部分空間の直交補完のベクトルであるという理論上の保証を提供します。また、我々は、溶液部分空間に直交するベクトルにステップの有限数に収束するように示されている線形プログラムの再帰に非凸DPCPの問題を緩和します。インライアの部分空間を超平面である場合、特に、線形プログラムの再帰に対する解決策は、ステップの有限数の非凸DPCP問題の大域的最小値に収束します。また、交互の最小化と反復的に再重み付けされた最小二乗法に基づくアルゴリズムを提案します。これは大規模データの処理に適しています。合成データの実験は、提案された方法が現在の最先端の方法よりも多くの外れ値と高い相対次元を処理できることを示しています。一方、コンピュータービジョンの3ビュージオメトリ問題のコンテキストでの実験は、提案された方法は、コンピュータビジョンやその他のアプリケーションのための従来のRANSACベースのアプローチに対する有用な、または優れた代替手段になります。
We consider the problem of learning a linear subspace from data corrupted by outliers. Classical approaches are typically designed for the case in which the subspace dimension is small relative to the ambient dimension. Our approach works with a dual representation of the subspace and hence aims to find its orthogonal complement; as such, it is particularly suitable for subspaces whose dimension is close to the ambient dimension (subspaces of high relative dimension). We pose the problem of computing normal vectors to the inlier subspace as a non-convex ℓ_1 minimization problem on the sphere, which we call Dual Principal Component Pursuit (DPCP) problem. We provide theoretical guarantees under which every global solution to DPCP is a vector in the orthogonal complement of the inlier subspace. Moreover, we relax the non-convex DPCP problem to a recursion of linear programs whose solutions are shown to converge in a finite number of steps to a vector orthogonal to the subspace. In particular, when the inlier subspace is a hyperplane, the solutions to the recursion of linear programs converge to the global minimum of the non-convex DPCP problem in a finite number of steps. We also propose algorithms based on alternating minimization and iteratively re-weighted least squares, which are suitable for dealing with large-scale data. Experiments on synthetic data show that the proposed methods are able to handle more outliers and higher relative dimensions than current state-of-the-art methods, while experiments in the context of the three-view geometry problem in computer vision suggest that the proposed methods can be a useful or even superior alternative to traditional RANSAC-based approaches for computer vision and other applications.