arXiv reaDer
GenImage: AI 生成画像を検出するための 100 万規模のベンチマーク
GenImage: A Million-Scale Benchmark for Detecting AI-Generated Image
写真画像を生成する生成モデルの並外れた能力により、偽情報の拡散に対する懸念が高まり、AI が生成した偽画像と本物の画像を区別できる検出器の需要が高まっています。しかし、最先端の画像生成装置からの画像を含む大規模なデータセットが不足しているため、そのような検出器の開発には障害が生じています。この論文では、次の利点を持つ GenImage データセットを紹介します。 1) AI が生成した偽画像と収集された本物の画像の 100 万組以上を含む、豊富な画像。 2) 幅広い画像クラスを含む豊富な画像コンテンツ。 3) 最先端のジェネレーター。高度な拡散モデルと GAN を使用して画像を合成します。前述の利点により、GenImage でトレーニングされた検出器は徹底的な評価を受け、さまざまな画像への強力な適用性を実証できます。私たちはデータセットの包括的な分析を実行し、現実世界のシナリオに似た検出方法を評価するための 2 つのタスクを提案します。クロスジェネレーター画像分類タスクは、1 つのジェネレーターでトレーニングされた検出器が他のジェネレーターでテストされたときのパフォーマンスを測定します。劣化画像分類タスクでは、低解像度、ぼやけた画像、圧縮画像などの劣化画像を処理する検出器の能力を評価します。 GenImage データセットを使用すると、研究者は、一般的な手法と比較して、優れた AI 生成画像検出器の開発と評価を効果的に促進できます。
The extraordinary ability of generative models to generate photographic images has intensified concerns about the spread of disinformation, thereby leading to the demand for detectors capable of distinguishing between AI-generated fake images and real images. However, the lack of large datasets containing images from the most advanced image generators poses an obstacle to the development of such detectors. In this paper, we introduce the GenImage dataset, which has the following advantages: 1) Plenty of Images, including over one million pairs of AI-generated fake images and collected real images. 2) Rich Image Content, encompassing a broad range of image classes. 3) State-of-the-art Generators, synthesizing images with advanced diffusion models and GANs. The aforementioned advantages allow the detectors trained on GenImage to undergo a thorough evaluation and demonstrate strong applicability to diverse images. We conduct a comprehensive analysis of the dataset and propose two tasks for evaluating the detection method in resembling real-world scenarios. The cross-generator image classification task measures the performance of a detector trained on one generator when tested on the others. The degraded image classification task assesses the capability of the detectors in handling degraded images such as low-resolution, blurred, and compressed images. With the GenImage dataset, researchers can effectively expedite the development and evaluation of superior AI-generated image detectors in comparison to prevailing methodologies.
updated: Wed Jun 14 2023 15:21:09 GMT+0000 (UTC)
published: Wed Jun 14 2023 15:21:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト