Generalized Separable Nonnegative Matrix Factorization
  非負行列因数分解(NMF)は、画像分析、テキストマイニング、音源分離、ハイパースペクトルアンミキシングなどのアプリケーションを使用した非負データの線形次元手法です。データ行列$ M $と因数分解ランク$ r $が与えられると、NMFは$ r $列の非負行列$ W $と、$ M \ approx WH $のような$ r $行の非負行列$ H $を探します。 NMFは一般に解決が困難なNPです。ただし、基底ベクトルがデータポイントとして現れることを必要とする分離可能性の仮定の下で効率的に計算できます。つまり、$ W = M(:、\ mathcal {Kのようなインデックスセット$ \ mathcal {K $が存在する必要があります。 )$。この論文では、分離可能性の仮定を一般化します:$ k = 1,2、\ dots、r $の各ランク1因子$ W(:、k)H(k、:)$に対してのみ、 W(:、k)= M(:、j)$が$ j $の場合、または$ H(k、:) = M(i、:)$が$ i $の場合。対応する問題を一般化分離可能NMF(GS-NMF)と呼びます。 GS-NMFのいくつかの特性について説明し、高速勾配法を使用して解く凸最適化モデルを提案します。また、連続射影アルゴリズムに触発されたヒューリスティックアルゴリズムも提案します。私たちの方法の有効性を検証するために、合成、ドキュメント、および画像データセットのいくつかの最新の分離可能なNMFアルゴリズムと比較します。
Nonnegative matrix factorization (NMF) is a linear dimensionality technique for nonnegative data with applications such as image analysis, text mining, audio source separation and hyperspectral unmixing. Given a data matrix $M$ and a factorization rank $r$, NMF looks for a nonnegative matrix $W$ with $r$ columns and a nonnegative matrix $H$ with $r$ rows such that $M \approx WH$. NMF is NP-hard to solve in general. However, it can be computed efficiently under the separability assumption which requires that the basis vectors appear as data points, that is, that there exists an index set $\mathcal{K$ such that $W = M(:,\mathcal{K)$. In this paper, we generalize the separability assumption: We only require that for each rank-one factor $W(:,k)H(k,:)$ for $k=1,2,\dots,r$, either $W(:,k) = M(:,j)$ for some $j$ or $H(k,:) = M(i,:)$ for some $i$. We refer to the corresponding problem as generalized separable NMF (GS-NMF). We discuss some properties of GS-NMF and propose a convex optimization model which we solve using a fast gradient method. We also propose a heuristic algorithm inspired by the successive projection algorithm. To verify the effectiveness of our methods, we compare them with several state-of-the-art separable NMF algorithms on synthetic, document and image data sets.
updated: Tue Oct 15 2019 11:22:33 GMT+0000 (UTC)
published: Thu May 30 2019 12:18:25 GMT+0000 (UTC)
