高解像度(HR)医用画像は、早期かつ正確な診断を容易にするために、豊富な解剖学的構造の詳細を提供します。 MRIでは、ハードウェア容量、スキャン時間、および患者の協力能力によって制限され、等方性3D HR画像取得は通常、長いスキャン時間を要求し、その結果、空間カバレッジが小さくなり、SNRが低くなります。最近の研究では、深い畳み込みニューラルネットワークを使用すると、等方性HR MR画像を単一画像超解像(SISR)アルゴリズムを介して低解像度(LR)入力から復元できることが示されました。ただし、ほとんどの既存のSISRメソッドは、LR画像とHR画像の間のスケール固有の投影に近づく傾向があるため、これらのメソッドは固定のアップサンプリングレートしか処理できません。さまざまなアップサンプリングレートを実現するには、複数のSRネットワークをそれぞれ構築する必要があります。これは、非常に時間とリソースを消費します。この論文では、3D HRMR画像を復元するための任意のスケールの超解像アプローチであるArSSRを提案します。 ArSSRモデルでは、異なるアップスケーリングレートでのHR画像の再構成は、観測されたLR画像から連続的な暗黙のボクセル関数を学習することとして定義されます。次に、SRタスクは、ペアのHR-LRトレーニング例のセットからの深いニューラルネットワークを介して暗黙のボクセル関数を表すように変換されます。 ArSSRモデルは、エンコーダネットワークとデコーダネットワークで構成されています。具体的には、畳み込みエンコーダネットワークはLR入力画像から特徴マップを抽出することであり、完全に接続されたデコーダネットワークは暗黙のボクセル関数を近似することです。学習された関数の連続性により、単一のArSSRモデルは、トレーニング後に任意の入力LR画像からHR画像の任意のアップサンプリングレートの再構成を実現できます。 3つのデータセットでの実験結果は、ArSSRモデルが、単一のトレーニング済みモデルを使用して任意のアップサンプリングスケールを実現しながら、3D HRMR画像再構成の最先端のSRパフォーマンスを実現できることを示しています。
High Resolution (HR) medical images provide rich anatomical structure details to facilitate early and accurate diagnosis. In MRI, restricted by hardware capacity, scan time, and patient cooperation ability, isotropic 3D HR image acquisition typically requests long scan time and, results in small spatial coverage and low SNR. Recent studies showed that, with deep convolutional neural networks, isotropic HR MR images could be recovered from low-resolution (LR) input via single image super-resolution (SISR) algorithms. However, most existing SISR methods tend to approach a scale-specific projection between LR and HR images, thus these methods can only deal with a fixed up-sampling rate. For achieving different up-sampling rates, multiple SR networks have to be built up respectively, which is very time-consuming and resource-intensive. In this paper, we propose ArSSR, an Arbitrary Scale Super-Resolution approach for recovering 3D HR MR images. In the ArSSR model, the reconstruction of HR images with different up-scaling rates is defined as learning a continuous implicit voxel function from the observed LR images. Then the SR task is converted to represent the implicit voxel function via deep neural networks from a set of paired HR-LR training examples. The ArSSR model consists of an encoder network and a decoder network. Specifically, the convolutional encoder network is to extract feature maps from the LR input images and the fully-connected decoder network is to approximate the implicit voxel function. Due to the continuity of the learned function, a single ArSSR model can achieve arbitrary up-sampling rate reconstruction of HR images from any input LR image after training. Experimental results on three datasets show that the ArSSR model can achieve state-of-the-art SR performance for 3D HR MR image reconstruction while using a single trained model to achieve arbitrary up-sampling scales.