arXiv reaDer
合成画像を使用してセグメンテーション ネットワークをトレーニングする場合、GAN のアンサンブルはパフォーマンスの向上につながりますか?
Does an ensemble of GANs lead to better performance when training segmentation networks with synthetic images?
セグメンテーション ネットワークをトレーニングするには、注釈付きの大規模なデータセットが必要です。医用画像では、このようなデータセットを作成するのは困難で、時間と費用がかかることが多く、これらのデータセットを他の研究者と共有することも難しい場合があります。現在、さまざまな AI モデルが非常にリアルな合成画像を生成できます。これらの画像は、特定の人物のものではないため、公然と共有される可能性があります。ただし、最近の研究では、深層ネットワークのトレーニングに合成画像を使用すると、実際の画像を使用する場合に比べてパフォーマンスが低下することが多いことが示されています。ここでは、単一の GAN からではなく、20 個の GAN のアンサンブルから合成画像と注釈を使用すると、実際のテスト画像の Dice スコアが特定のクラスで 4.7% から 14.0% 増加することを示しています。
Large annotated datasets are required to train segmentation networks. In medical imaging, it is often difficult, time consuming and expensive to create such datasets, and it may also be difficult to share these datasets with other researchers. Different AI models can today generate very realistic synthetic images, which can potentially be openly shared as they do not belong to specific persons. However, recent work has shown that using synthetic images for training deep networks often leads to worse performance compared to using real images. Here we demonstrate that using synthetic images and annotations from an ensemble of 20 GANs, instead of from a single GAN, increases the Dice score on real test images with 4.7 % to 14.0 % on specific classes.
updated: Sun Mar 12 2023 13:42:25 GMT+0000 (UTC)
published: Tue Nov 08 2022 08:35:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト