arXiv reaDer
3D画像の2D畳み込みの再発明
Reinventing 2D Convolutions for 3D Images
3D医用画像での2Dおよび3D表現学習についてはかなりの議論がありました。 2Dアプローチは、大規模な2D事前トレーニングの恩恵を受ける可能性がありますが、大規模な3Dコンテキストのキャプチャには一般的に弱いものです。 3Dアプローチは、3Dコンテキストでは本来強力ですが、一般に公開されている3D医療データセットは、ユニバーサル3D事前トレーニングに十分な大きさで多様です。ハイブリッド(2D + 3D)アプローチの場合でも、2D / 3Dパーツに内在する不利な点が依然として存在します。この研究では、2D畳み込みを再発明することにより、2D畳み込みと3D畳み込みの間のギャップを埋めます。 2Dデータセットで事前にトレーニングされた重みを利用しながら、ネイティブに3D表現学習を実行するACS(軸-冠状-矢状)畳み込みを提案します。 ACS畳み込みでは、2D畳み込みカーネルはチャネルごとに3つの部分に分割され、3D表現の3つのビュー(アキシャル、コロナル、サジタル)で別々に畳み込まれます。理論的には、任意の2D CNN(ResNet、DenseNet、またはDeepLab)は、同じパラメーターサイズの事前トレーニング済みの重みを使用して3D ACSCNNに変換できます。いくつかの医療ベンチマーク(分類、セグメンテーション、検出タスクを含む)での広範な実験により、事前トレーニングあり/なしの2D / 3DCNN対応物に対する事前トレーニング済みACSCNNの一貫した優位性が検証されます。事前トレーニングがなくても、ACSコンボリューションは、標準の3Dコンボリューションのプラグアンドプレイの代替として使用でき、モデルサイズが小さく、計算量も少なくて済みます。
There have been considerable debates over 2D and 3D representation learning on 3D medical images. 2D approaches could benefit from large-scale 2D pretraining, whereas they are generally weak in capturing large 3D contexts. 3D approaches are natively strong in 3D contexts, however few publicly available 3D medical dataset is large and diverse enough for universal 3D pretraining. Even for hybrid (2D + 3D) approaches, the intrinsic disadvantages within the 2D / 3D parts still exist. In this study, we bridge the gap between 2D and 3D convolutions by reinventing the 2D convolutions. We propose ACS (axial-coronal-sagittal) convolutions to perform natively 3D representation learning, while utilizing the pretrained weights on 2D datasets. In ACS convolutions, 2D convolution kernels are split by channel into three parts, and convoluted separately on the three views (axial, coronal and sagittal) of 3D representations. Theoretically, ANY 2D CNN (ResNet, DenseNet, or DeepLab) is able to be converted into a 3D ACS CNN, with pretrained weight of a same parameter size. Extensive experiments on several medical benchmarks (including classification, segmentation and detection tasks) validate the consistent superiority of the pretrained ACS CNNs, over the 2D / 3D CNN counterparts with / without pretraining. Even without pretraining, the ACS convolution can be used as a plug-and-play replacement of standard 3D convolution, with smaller model size and less computation.
updated: Mon Jan 04 2021 07:24:49 GMT+0000 (UTC)
published: Sun Nov 24 2019 09:05:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト