arXiv reaDer
ChiroDiff: 拡散モデルによる筆記データのモデリング
ChiroDiff: Modelling chirographic data with Diffusion Models
手書き、スケッチ、描画などの連続時間の幾何学的構造に対する生成モデリングは、自己回帰分布によって達成されています。しかし、このような厳密に順序付けされた離散因数分解は、筆記データの重要な特性を把握するには不十分です。一方向の可視性 (因果関係) のために、時間概念の全体論的理解を構築することはできません。その結果、時系列データは、真の根底にある概念を捉えるのではなく、固定サンプリング レートの個別のトークン シーケンスとしてモデル化されています。このホワイトペーパーでは、これらの欠陥に具体的に対処する筆記データ用の強力なモデルクラス、つまり「ノイズ除去拡散確率モデル」または DDPM を紹介します。 「ChiroDiff」という名前のモデルは、非自己回帰的であり、全体的な概念を捉えることを学習するため、より高い時間サンプリング レートに対してかなりの回復力を維持します。さらに、多くの重要なダウンストリーム ユーティリティ (条件付きサンプリング、クリエイティブ ミキシングなど) を ChiroDiff を使用して柔軟に実装できることを示します。さらに、確率的ベクトル化、ノイズ除去/ヒーリング、抽象化などのいくつかのユニークなユースケースも、このモデルクラスで可能であることを示しています。関連するデータセットでフレームワークの定量的および定性的評価を実行し、競合するアプローチよりも優れているか、同等であることがわかりました。
Generative modelling over continuous-time geometric constructs, a.k.a such as handwriting, sketches, drawings etc., have been accomplished through autoregressive distributions. Such strictly-ordered discrete factorization however falls short of capturing key properties of chirographic data -- it fails to build holistic understanding of the temporal concept due to one-way visibility (causality). Consequently, temporal data has been modelled as discrete token sequences of fixed sampling rate instead of capturing the true underlying concept. In this paper, we introduce a powerful model-class namely "Denoising Diffusion Probabilistic Models" or DDPMs for chirographic data that specifically addresses these flaws. Our model named "ChiroDiff", being non-autoregressive, learns to capture holistic concepts and therefore remains resilient to higher temporal sampling rate up to a good extent. Moreover, we show that many important downstream utilities (e.g. conditional sampling, creative mixing) can be flexibly implemented using ChiroDiff. We further show some unique use-cases like stochastic vectorization, de-noising/healing, abstraction are also possible with this model-class. We perform quantitative and qualitative evaluation of our framework on relevant datasets and found it to be better or on par with competing approaches.
updated: Fri Apr 07 2023 15:17:48 GMT+0000 (UTC)
published: Fri Apr 07 2023 15:17:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト