arXiv reaDer
美女か野獣か: 合成医用画像のどの側面が注目に値するでしょうか?
The Beauty or the Beast: Which Aspect of Synthetic Medical Images Deserves Our Focus?
医療 AI アルゴリズムのトレーニングには、正確にラベル付けされた大量のデータセットが必要ですが、現実世界ではこれらを入手するのは困難です。深層生成モデルから生成された合成画像は、データ不足の問題を軽減するのに役立ちますが、その有効性は現実世界の画像への忠実度に依存します。通常、研究者は画質測定に基づいて合成モデルを選択し、リアルに見える合成画像を優先します。しかし、私たちの実証分析によれば、忠実度が高く視覚的に魅力的な合成画像が必ずしも優れているわけではありません。実際、下流のタスクにおいて、低忠実度の合成画像が高忠実度の合成画像よりも優れたパフォーマンスを示した事例を紹介します。私たちの調査結果は、合成データを現実世界のアプリケーションに組み込む前に、包括的な分析を行うことの重要性を浮き彫りにしています。私たちの結果が、医療 AI アルゴリズムのトレーニングにおける低忠実度の合成画像の価値に対する研究コミュニティの認識を高めることを願っています。
Training medical AI algorithms requires large volumes of accurately labeled datasets, which are difficult to obtain in the real world. Synthetic images generated from deep generative models can help alleviate the data scarcity problem, but their effectiveness relies on their fidelity to real-world images. Typically, researchers select synthesis models based on image quality measurements, prioritizing synthetic images that appear realistic. However, our empirical analysis shows that high-fidelity and visually appealing synthetic images are not necessarily superior. In fact, we present a case where low-fidelity synthetic images outperformed their high-fidelity counterparts in downstream tasks. Our findings highlight the importance of comprehensive analysis before incorporating synthetic data into real-world applications. We hope our results will raise awareness among the research community of the value of low-fidelity synthetic images in medical AI algorithm training.
updated: Wed Jun 14 2023 14:39:17 GMT+0000 (UTC)
published: Wed May 03 2023 09:09:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト