arXiv reaDer
AdjointDPM: 拡散確率モデルの勾配逆伝播のためのアジョイント感度法
AdjointDPM: Adjoint Sensitivity Method for Gradient Backpropagation of Diffusion Probabilistic Models
既存のカスタマイズ方法では、事前トレーニングされた拡散確率モデル (DPM) をユーザーが提供する概念に合わせるために、複数の参照サンプルにアクセスする必要があります。このペーパーは、利用可能な監視が生成されたコンテンツに対して定義された微分可能なメトリックのみである場合の DPM カスタマイズの課題に対処することを目的としています。 DPM のサンプリング手順にはノイズ除去 UNet への再帰呼び出しが含まれるため、単純な勾配逆伝播ではすべての反復の中間状態を保存する必要があり、その結果、メモリ消費量が非常に多くなります。この問題を解決するために、我々は新しい手法 AdjointDPM を提案します。この手法は、最初に対応する確率フロー ODE を解くことによって拡散モデルから新しいサンプルを生成します。次に、アジョイント感度法を使用して、別の拡張 ODE を解くことで損失の勾配をモデルのパラメーター (調整信号、ネットワークの重み、初期ノイズを含む) に逆伝播します。順方向生成プロセスと勾配逆伝播プロセスの両方における数値誤差を削減するために、指数積分を使用して確率フロー ODE と拡張 ODE を単純な非スティッフ ODE としてさらに再パラメータ化します。最後に、視覚効果を識別テキスト埋め込みに変換すること、特定の種類の様式化に合わせて DPM を微調整すること、セキュリティ監査用の敵対的サンプルを生成するための初期ノイズの最適化という 3 つの興味深いタスクにおける AdjointDPM の有効性を実証します。
Existing customization methods require access to multiple reference examples to align pre-trained diffusion probabilistic models (DPMs) with user-provided concepts. This paper aims to address the challenge of DPM customization when the only available supervision is a differentiable metric defined on the generated contents. Since the sampling procedure of DPMs involves recursive calls to the denoising UNet, naïve gradient backpropagation requires storing the intermediate states of all iterations, resulting in extremely high memory consumption. To overcome this issue, we propose a novel method AdjointDPM, which first generates new samples from diffusion models by solving the corresponding probability-flow ODEs. It then uses the adjoint sensitivity method to backpropagate the gradients of the loss to the models' parameters (including conditioning signals, network weights, and initial noises) by solving another augmented ODE. To reduce numerical errors in both the forward generation and gradient backpropagation processes, we further reparameterize the probability-flow ODE and augmented ODE as simple non-stiff ODEs using exponential integration. Finally, we demonstrate the effectiveness of AdjointDPM on three interesting tasks: converting visual effects into identification text embeddings, finetuning DPMs for specific types of stylization, and optimizing initial noise to generate adversarial samples for security auditing.
updated: Fri Jul 21 2023 02:06:41 GMT+0000 (UTC)
published: Thu Jul 20 2023 09:06:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト