arXiv reaDer
オートエンコーダーは 3D CT 超解像に本当に適用できますか?
Is Autoencoder Truly Applicable for 3D CT Super-Resolution?
ボトルネック構造が特徴のオートエンコーダー (AE) とその亜種は、セグメンテーション、再構成、ノイズ除去など、さまざまな医用画像分析タスクに広く適用されています。前述のタスクでの有望なパフォーマンスにもかかわらず、この論文では、AE モデルは 3D CT データの単一画像超解像 (SISR) には適用できないと主張します。私たちの仮説は、AE モデルの特徴マップのサイズを変更するボトルネック アーキテクチャが入力画像の詳細を劣化させ、超解像のパフォーマンスを妨害する可能性があるというものです。 U-Net は、さまざまなレベルからの情報をマージするスキップ接続を提案しましたが、機能のサイズ変更操作の劣化の影響は、スキップ接続ではほとんど除去できないと主張しています。大規模なアブレーション実験を実施し、パブリック CT 肺データセットでボトルネック デザインを使用するモデルと使用しないモデルのパフォーマンスを比較することにより、U-Net を含む AE モデルが互換性のある SISR 結果を達成できなかったことを発見しました (p<0.05スチューデントの t 検定による) ベースライン モデルとの比較。私たちの研究は、3D CT SISR タスクに対する AE アーキテクチャの適合性を調査した最初の比較研究であり、研究者が特に 3D CT SISR タスクのモデル アーキテクチャの選択を再考する根拠となります。完全な実装とトレーニング済みのモデルは、https://github.com/Roldbach/Autoencoder-3D-CT-SISR にあります。
Featured by a bottleneck structure, autoencoder (AE) and its variants have been largely applied in various medical image analysis tasks, such as segmentation, reconstruction and de-noising. Despite of their promising performances in aforementioned tasks, in this paper, we claim that AE models are not applicable to single image super-resolution (SISR) for 3D CT data. Our hypothesis is that the bottleneck architecture that resizes feature maps in AE models degrades the details of input images, thus can sabotage the performance of super-resolution. Although U-Net proposed skip connections that merge information from different levels, we claim that the degrading impact of feature resizing operations could hardly be removed by skip connections. By conducting large-scale ablation experiments and comparing the performance between models with and without the bottleneck design on a public CT lung dataset , we have discovered that AE models, including U-Net, have failed to achieve a compatible SISR result (p<0.05 by Student's t-test) compared to the baseline model. Our work is the first comparative study investigating the suitability of AE architecture for 3D CT SISR tasks and brings a rationale for researchers to re-think the choice of model architectures especially for 3D CT SISR tasks. The full implementation and trained models can be found at: https://github.com/Roldbach/Autoencoder-3D-CT-SISR
updated: Fri Mar 31 2023 16:33:22 GMT+0000 (UTC)
published: Mon Jan 23 2023 12:48:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト