arXiv reaDer
多様化されたX線画像合成のための自己注意ガイド付きマルチスケール勾配GAN
A Self-attention Guided Multi-scale Gradient GAN for Diversified X-ray Image Synthesis
不均衡な画像データセットは、生物医学画像解析の分野で一般的に利用できます。生物医学画像には、標的疾患の予測に重要な多様な特徴が含まれています。 Generative Adversarial Networks (GAN) は、合成画像の生成を介してデータ制限の問題に対処するために利用されます。モードの崩壊、非収束、不安定性などのトレーニングの課題は、多様化された高品質の画像を合成する際の GAN のパフォーマンスを低下させます。この作業では、アテンションガイド型マルチスケール勾配 GAN アーキテクチャである MSG-SAGAN を提案して、生物医学画像の特徴の長距離依存関係の関係をモデル化し、複数の解像度でマルチスケール勾配の流れを使用してトレーニング パフォーマンスを向上させます。生成モデルと識別モデルの層。その目的は、モード崩壊の影響を軽減し、多様な X 線画像合成のためのマルチスケール勾配学習によるアテンション メカニズムを使用して、GAN のトレーニングを安定させることです。マルチスケール構造類似性指標 (MS-SSIM) とフレシェ開始距離 (FID) を使用して、モード崩壊の発生を識別し、生成された合成画像の多様性を評価します。提案されたアーキテクチャは、生成された合成画像の多様性を評価するために、マルチスケール勾配 GAN (MSG-GAN) と比較されます。結果は、MS-SSIM および FID スコアによって証明されるように、多様な画像の合成において MSG-SAGAN が MSG-GAN よりも優れていることを示しています。
Imbalanced image datasets are commonly available in the domain of biomedical image analysis. Biomedical images contain diversified features that are significant in predicting targeted diseases. Generative Adversarial Networks (GANs) are utilized to address the data limitation problem via the generation of synthetic images. Training challenges such as mode collapse, non-convergence, and instability degrade a GAN's performance in synthesizing diversified and high-quality images. In this work, MSG-SAGAN, an attention-guided multi-scale gradient GAN architecture is proposed to model the relationship between long-range dependencies of biomedical image features and improves the training performance using a flow of multi-scale gradients at multiple resolutions in the layers of generator and discriminator models. The intent is to reduce the impact of mode collapse and stabilize the training of GAN using an attention mechanism with multi-scale gradient learning for diversified X-ray image synthesis. Multi-scale Structural Similarity Index Measure (MS-SSIM) and Frechet Inception Distance (FID) are used to identify the occurrence of mode collapse and evaluate the diversity of synthetic images generated. The proposed architecture is compared with the multi-scale gradient GAN (MSG-GAN) to assess the diversity of generated synthetic images. Results indicate that the MSG-SAGAN outperforms MSG-GAN in synthesizing diversified images as evidenced by the MS-SSIM and FID scores.
updated: Sat Nov 12 2022 18:39:48 GMT+0000 (UTC)
published: Sun Oct 09 2022 13:17:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト