arXiv reaDer
反復生成のためのスケーラブルな適応計算
Scalable Adaptive Computation for Iterative Generation
自然データは冗長ですが、入力空間と出力空間にわたって均一に計算を行うアーキテクチャが主流です。私たちは、コア計算をデータの次元から切り離すアテンションベースのアーキテクチャであるリカレント インターフェイス ネットワーク (RIN) を提案します。これにより、高次元データのよりスケーラブルな生成のための適応計算が可能になります。 RIN は、潜在トークンとデータ トークン間の情報の読み取りと書き込み (つまり、ルーティング) にクロス アテンションを使用して、一連の潜在トークンに計算の大部分 (つまり、グローバル セルフ アテンション) を集中させます。 RIN ブロックをスタッキングすると、ボトムアップ (データから潜在) およびトップダウン (潜在からデータ) のフィードバックが可能になり、より深く、より表現力豊かなルーティングが可能になります。このルーティングには課題が伴いますが、拡散モデルを使用した反復生成など、タスク (およびルーティングの問題) が徐々に変化する反復計算設定では、それほど問題になりません。逆拡散プロセスの各順方向パスで潜在トークンを以前の計算からのトークンで条件付けする、つまり潜在的自己調整によって再帰を活用する方法を示します。 RIN は、画像およびビデオ生成用の最先端のピクセル拡散モデルを生成し、カスケードやガイダンスなしで 1024X1024 画像にスケーリングすると同時に、ドメインに依存せず、2D および 3D U-Net よりも最大 10 倍効率的です。
Natural data is redundant yet predominant architectures tile computation uniformly across their input and output space. We propose the Recurrent Interface Networks (RINs), an attention-based architecture that decouples its core computation from the dimensionality of the data, enabling adaptive computation for more scalable generation of high-dimensional data. RINs focus the bulk of computation (i.e. global self-attention) on a set of latent tokens, using cross-attention to read and write (i.e. route) information between latent and data tokens. Stacking RIN blocks allows bottom-up (data to latent) and top-down (latent to data) feedback, leading to deeper and more expressive routing. While this routing introduces challenges, this is less problematic in recurrent computation settings where the task (and routing problem) changes gradually, such as iterative generation with diffusion models. We show how to leverage recurrence by conditioning the latent tokens at each forward pass of the reverse diffusion process with those from prior computation, i.e. latent self-conditioning. RINs yield state-of-the-art pixel diffusion models for image and video generation, scaling to 1024X1024 images without cascades or guidance, while being domain-agnostic and up to 10X more efficient than 2D and 3D U-Nets.
updated: Wed Jun 14 2023 03:32:57 GMT+0000 (UTC)
published: Thu Dec 22 2022 18:55:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト