最先端 (SOTA) 生成モデル (GM) は、人間が本物の写真と区別するのが難しいフォトリアリスティックな画像を合成できます。 GM の悪用の可能性に関する社会的懸念を軽減するには、操作されたメディアを特定し、理解することが重要です。 GM のリバース エンジニアリングを実行して、これらのモデルによって生成された画像からモデルのハイパーパラメーターを推測することを提案します。我々は、生成された画像を調べることによって GM ネットワーク アーキテクチャを推定し、損失関数をトレーニングするという新しい問題である「モデル解析」を定義します。これは人間には一見不可能なタスクです。この問題に取り組むために、我々は 2 つのコンポーネントを持つフレームワークを提案します。フィンガープリント推定ネットワーク (FEN) は、指紋が望ましい特性を持つようにするための 4 つの制約を使用してトレーニングすることにより、生成された画像から GM フィンガープリントを推定します。解析ネットワーク (PN) は、推定されたフィンガープリントからネットワーク アーキテクチャと損失関数を予測します。私たちのアプローチを評価するために、116 の異なる GM によって生成された 100,000 枚の画像を含む偽の画像データセットを収集します。広範な実験により、目に見えないモデルのハイパーパラメーターの解析において有望な結果が示されました。最後に、フィンガープリントの推定は、ディープフェイクの検出と画像の帰属に活用できます。ディープフェイク検出 (Celeb-DF) と画像アトリビューション ベンチマークの両方に関する SOTA 結果をレポートすることで示します。
State-of-the-art (SOTA) Generative Models (GMs) can synthesize photo-realistic images that are hard for humans to distinguish from genuine photos. Identifying and understanding manipulated media are crucial to mitigate the social concerns on the potential misuse of GMs. We propose to perform reverse engineering of GMs to infer model hyperparameters from the images generated by these models. We define a novel problem, ``model parsing", as estimating GM network architectures and training loss functions by examining their generated images -- a task seemingly impossible for human beings. To tackle this problem, we propose a framework with two components: a Fingerprint Estimation Network (FEN), which estimates a GM fingerprint from a generated image by training with four constraints to encourage the fingerprint to have desired properties, and a Parsing Network (PN), which predicts network architecture and loss functions from the estimated fingerprints. To evaluate our approach, we collect a fake image dataset with 100K images generated by 116 different GMs. Extensive experiments show encouraging results in parsing the hyperparameters of the unseen models. Finally, our fingerprint estimation can be leveraged for deepfake detection and image attribution, as we show by reporting SOTA results on both the deepfake detection (Celeb-DF) and image attribution benchmarks.