「Deep Archetypal Analysis」は、アーキタイプと呼ばれる直感的に理解可能な基本エンティティの断片に関して、高次元のデータセットの潜在的な表現を生成します。提案された方法は、線形「Archetypal Analysis」(AA)、多変量データポイントをデータセットの極値要素のスパース凸組み合わせとして表すための教師なし方法の拡張です。 AAの元の定式化とは異なり、「Deep AA」はサイド情報も処理でき、データ駆動型の表現学習機能を提供し、専門知識への依存を減らします。私たちの方法は、アーキタイプが単一のタスクに高度に適応した種である生物学の進化的トレードオフの研究によって動機付けられています。これらの線に沿って、「ディープAA」は、化学空間の監視された探索にも役立ち、de novo分子設計の明確な出発点を示すことを実証します。監視なしの設定では、CelebAで「ディープAA」を使用して典型的な顔を識別する方法を示します。これらは、それらが基づいているアーキタイプの主要な特性を継承する新しい顔を生成するために重ね合わせることができます。
"Deep Archetypal Analysis" generates latent representations of high-dimensional datasets in terms of fractions of intuitively understandable basic entities called archetypes. The proposed method is an extension of linear "Archetypal Analysis" (AA), an unsupervised method to represent multivariate data points as sparse convex combinations of extremal elements of the dataset. Unlike the original formulation of AA, "Deep AA" can also handle side information and provides the ability for data-driven representation learning which reduces the dependence on expert knowledge. Our method is motivated by studies of evolutionary trade-offs in biology where archetypes are species highly adapted to a single task. Along these lines, we demonstrate that "Deep AA" also lends itself to the supervised exploration of chemical space, marking a distinct starting point for de novo molecular design. In the unsupervised setting we show how "Deep AA" is used on CelebA to identify archetypal faces. These can then be superimposed in order to generate new faces which inherit dominant traits of the archetypes they are based on.