このホワイトペーパーでは、解釈的探索的データ分析ツールとしての非負行列因子分解(NMF)などの次元削減手法の信頼性を向上させる方法を検討します。 NMFの基礎となる最適化問題の難しさを最初に調べ、完全に正の因数分解の理論を使用して、非自明なNMFソリューションが常に存在し、最適化問題が実際に凸であることを初めて示します。その後、凸最適化からのさまざまなアイデアを使用して、グローバルに最適なNMFソリューションを見つけるための4つの新しいアプローチを検討します。次に、新しいメソッドであるアイソメトリックNMF(isoNMF)を開発します。アイソメトリックNMF(isoNMF)は、非負性を保持しながらアイソメトリック埋め込みも提供し、解釈に役立つ2つのプロパティを同時に実現します。その結果、より困難な最適化問題が発生しますが、結果の方法がスケーラブルであり、標準のNMFよりもコンパクトなスペクトルを実現することを実験的に示しています。
In this paper we explore avenues for improving the reliability of dimensionality reduction methods such as Non-Negative Matrix Factorization (NMF) as interpretive exploratory data analysis tools. We first explore the difficulties of the optimization problem underlying NMF, showing for the first time that non-trivial NMF solutions always exist and that the optimization problem is actually convex, by using the theory of Completely Positive Factorization. We subsequently explore four novel approaches to finding globally-optimal NMF solutions using various ideas from convex optimization. We then develop a new method, isometric NMF (isoNMF), which preserves non-negativity while also providing an isometric embedding, simultaneously achieving two properties which are helpful for interpretation. Though it results in a more difficult optimization problem, we show experimentally that the resulting method is scalable and even achieves more compact spectra than standard NMF.