非類似度混合オートエンコーダー(DMAE)は、柔軟な非類似度関数を組み込んだ機能ベースのクラスタリング用のニューラルネットワークモデルであり、あらゆる種類の深層学習アーキテクチャに統合できます。これは、K-Means、ガウス混合モデル、Bregmanクラスタリングなどの古典的な方法を、ニューラルネットワーク表現としての確率の再解釈を通じて、凸で微分可能な非類似度関数に拡張する非類似度混合モデル(DMM)を内部的に表します。 DMAEは、ディープラーニングアーキテクチャとエンドツーエンドモデルに統合できるため、クラスタリングとニューラルネットワークのパラメータを同時に推定できます。実験的評価は、DMAEが教師なし分類精度と正規化された相互情報量の点で競争力があることを示す画像とテキストのクラスタリングベンチマークデータセットで実行されました。 DMAEを実装したソースコードは、https://github.com/juselara1/dmaeで公開されています。
The dissimilarity mixture autoencoder (DMAE) is a neural network model for feature-based clustering that incorporates a flexible dissimilarity function and can be integrated into any kind of deep learning architecture. It internally represents a dissimilarity mixture model (DMM) that extends classical methods like K-Means, Gaussian mixture models, or Bregman clustering to any convex and differentiable dissimilarity function through the reinterpretation of probabilities as neural network representations. DMAE can be integrated with deep learning architectures into end-to-end models, allowing the simultaneous estimation of the clustering and neural network's parameters. Experimental evaluation was performed on image and text clustering benchmark datasets showing that DMAE is competitive in terms of unsupervised classification accuracy and normalized mutual information. The source code with the implementation of DMAE is publicly available at: https://github.com/juselara1/dmae