arXiv reaDer
視覚認識のための生成データのベンチマークと分析
Benchmarking and Analyzing Generative Data for Visual Recognition
大規模な事前トレーニング済み生成モデルの進歩により、視覚認識における効果的なデータ ジェネレーターとしての可能性が拡大しました。この研究では、主に外部データを利用するパラダイム (つまり、生成 \vs 検索 \vs オリジナル) を比較しながら、生成画像の影響を詳しく調べています。私たちの主な貢献は次のとおりです。 1) GenBench の構築: さまざまな視覚認識タスクにわたって生成データを評価するために、2548 カテゴリを持つ 22 のデータセットで構成される広範なベンチマークである GenBench を考案しました。 2)CLERスコア:既存のメトリクス(例えば、FID、CLIPスコア)と下流の認識パフォーマンスとの不十分な相関に対処するために、トレーニング前の認識タスクに対する生成データの効率を示すトレーニング不要のメトリクスであるCLERを提案する。 3) 新しいベースライン: 生成データと同じ外部プールから取得したデータとの比較は、生成データの固有の特性を解明するのに役立ちます。 4) 外部知識の挿入: テキスト反転を介してカテゴリごとに特別なトークンの埋め込みを微調整することで、低解像度の参照画像を処理する場合を除き、17 のデータセット全体でパフォーマンスが向上します。当社の徹底的なベンチマークと分析は、視覚認識における生成データの可能性に焦点を当て、将来の調査のための重要な課題を特定します。
Advancements in large pre-trained generative models have expanded their potential as effective data generators in visual recognition. This work delves into the impact of generative images, primarily comparing paradigms that harness external data (i.e. generative \vs retrieval \vs original). Our key contributions are: 1) GenBench Construction: We devise GenBench, a broad benchmark comprising 22 datasets with 2548 categories, to appraise generative data across various visual recognition tasks. 2) CLER Score: To address the insufficient correlation of existing metrics (e.g. , FID, CLIP score) with downstream recognition performance, we propose CLER, a training-free metric indicating generative data's efficiency for recognition tasks prior to training. 3) New Baselines: Comparisons of generative data with retrieved data from the same external pool help to elucidate the unique traits of generative data. 4) External Knowledge Injection: By fine-tuning special token embeddings for each category via Textual Inversion, performance improves across 17 datasets, except when dealing with low-resolution reference images. Our exhaustive benchmark and analysis spotlight generative data's promise in visual recognition, while identifying key challenges for future investigation.
updated: Tue Jul 25 2023 17:59:59 GMT+0000 (UTC)
published: Tue Jul 25 2023 17:59:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト