arXiv reaDer
どこから始めるかがすべてです: シード選択によるテキストから画像への生成
It is all about where you start: Text-to-image generation with seed selection
テキストから画像への拡散モデルは、新しい構成やシナリオで多種多様な概念を合成できます。しかし、珍しい概念、めったにない珍しい組み合わせ、または手のひらのような構造化された概念を生成することにまだ苦労しています。それらの制限の一部は、トレーニング データのロングテールの性質によるものです。Web クロールされたデータ セットは非常に不均衡であり、モデルが分布のテールから概念を過小評価する原因となります。ここでは、テキストから画像へのモデルに対する不均衡なトレーニング データの影響を特徴付け、改善策を提供します。ノイズ空間で適切な生成シードを慎重に選択することで、まれな概念を正しく生成できることを示します。これは、SeedSelect と呼ばれる手法です。 SeedSelect は効率的で、拡散モデルを再トレーニングする必要はありません。一連の問題に対する SeedSelect の利点を評価します。まず、少数ショットのセマンティック データ拡張で、少数ショットおよびロングテール ベンチマーク用に意味的に正しい画像を生成します。拡散モデルのトレーニング データの先頭と末尾の両方から、すべてのクラスで分類の改善を示します。さらに、現在の拡散モデルのよく知られた落とし穴である手の画像の修正に関する SeedSelect を評価し、手の生成が大幅に改善されることを示します。
Text-to-image diffusion models can synthesize a large variety of concepts in new compositions and scenarios. However, they still struggle with generating uncommon concepts, rare unusual combinations, or structured concepts like hand palms. Their limitation is partly due to the long-tail nature of their training data: web-crawled data sets are strongly unbalanced, causing models to under-represent concepts from the tail of the distribution. Here we characterize the effect of unbalanced training data on text-to-image models and offer a remedy. We show that rare concepts can be correctly generated by carefully selecting suitable generation seeds in the noise space, a technique that we call SeedSelect. SeedSelect is efficient and does not require retraining the diffusion model. We evaluate the benefit of SeedSelect on a series of problems. First, in few-shot semantic data augmentation, where we generate semantically correct images for few-shot and long-tail benchmarks. We show classification improvement on all classes, both from the head and tail of the training data of diffusion models. We further evaluate SeedSelect on correcting images of hands, a well-known pitfall of current diffusion models, and show that it improves hand generation substantially.
updated: Thu Apr 27 2023 20:55:38 GMT+0000 (UTC)
published: Thu Apr 27 2023 20:55:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト