arXiv reaDer
多くの外れ値を持つハイブリッド線形モデリングのための中央Kフラット
Median K-flats for hybrid linear modeling with many outliers
 Median K-Flats(MKF)アルゴリズムについて説明します。これは、ハイブリッド線形モデリングの簡単なオンライン方法です。つまり、フラットの混合によってデータを近似します。このアルゴリズムは、データをクラスターに同時に分割すると同時に、対応する最適な近似l1 d-flatを見つけ、累積l1エラーを最小化します。現在の実装では、d-flatをd次元の線形部分空間に制限しています。 K d次元線形部分空間を持つD次元ユークリッド空間のN点で構成されるデータをモデル化する場合、無視できる量のストレージとその複雑さを必要としますが、次数はO(n K d D + nd ^ 2 D)です。 nは、収束に必要な反復回数です(経験的には10 ^ 4のオーダー)。これはオンラインアルゴリズムであるため、データをインクリメンタルに提供でき、対応する出力をインクリメンタルに生成できます。アルゴリズムのパフォーマンスは、合成データと実際のデータを使用して慎重に評価されます。
We describe the Median K-Flats (MKF) algorithm, a simple online method for hybrid linear modeling, i.e., for approximating data by a mixture of flats. This algorithm simultaneously partitions the data into clusters while finding their corresponding best approximating l1 d-flats, so that the cumulative l1 error is minimized. The current implementation restricts d-flats to be d-dimensional linear subspaces. It requires a negligible amount of storage, and its complexity, when modeling data consisting of N points in D-dimensional Euclidean space with K d-dimensional linear subspaces, is of order O(n K d D+n d^2 D), where n is the number of iterations required for convergence (empirically on the order of 10^4). Since it is an online algorithm, data can be supplied to it incrementally and it can incrementally produce the corresponding output. The performance of the algorithm is carefully evaluated using synthetic and real data.
updated: Wed Sep 16 2009 23:09:16 GMT+0000 (UTC)
published: Wed Sep 16 2009 23:09:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト