arXiv reaDer
可逆的な注意を払った生成フロー
Generative Flows with Invertible Attentions
フローベースの生成モデルは、一連の可逆変換を介してデータの確率密度関数を明示的に学習する優れた能力を示しています。それでも、生成フローで注目を集めることは、他の分野でブレークスルーをもたらした一方で、まだ十分に研究されていません。ギャップを埋めるために、このペーパーでは、無条件と条件付きの両方の生成フローに対して、2種類の可逆的注意メカニズム、つまりマップベースとトランスフォーマーベースの注意を紹介します。重要なアイデアは、これら2つの注意のマスクされたスキームを利用して、生成フローのコンテキストで長距離データの依存関係を学習することです。マスクされたスキームは、扱いやすいJacobian行列式を備えた可逆アテンションモジュールを可能にし、フローベースモデルの任意の位置でのシームレスな統合を可能にします。提案された注意メカニズムは、長期的なデータ依存関係をモデル化できるため、より効率的な生成フローにつながります。複数の画像合成タスクの評価は、提案された注意フローが効率的なモデルをもたらし、最先端の無条件および条件付き生成フローと比べて遜色がないことを示しています。
Flow-based generative models have shown an excellent ability to explicitly learn the probability density function of data via a sequence of invertible transformations. Yet, learning attentions in generative flows remains understudied, while it has made breakthroughs in other domains. To fill the gap, this paper introduces two types of invertible attention mechanisms, i.e., map-based and transformer-based attentions, for both unconditional and conditional generative flows. The key idea is to exploit a masked scheme of these two attentions to learn long-range data dependencies in the context of generative flows. The masked scheme allows for invertible attention modules with tractable Jacobian determinants, enabling its seamless integration at any positions of the flow-based models. The proposed attention mechanisms lead to more efficient generative flows, due to their capability of modeling the long-term data dependencies. Evaluation on multiple image synthesis tasks shows that the proposed attention flows result in efficient models and compare favorably against the state-of-the-art unconditional and conditional generative flows.
updated: Thu Mar 31 2022 04:35:39 GMT+0000 (UTC)
published: Mon Jun 07 2021 20:43:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト