畳み込みニューラル ネットワーク (CNN) では、線形層で畳み込みカーネルを使用することにより、パラメーター共有と並進等価性が可能になります。これらのカーネルを SO(3) 操縦可能に制限することで、CNN はパラメーターの共有と等分散をさらに改善できます。これらの同変畳み込み層には、標準の畳み込み層よりもいくつかの利点があります。たとえば、見えないポーズに対する堅牢性の向上、ネットワーク サイズの縮小、サンプル効率の向上などです。それにもかかわらず、医用画像解析で使用されるほとんどのセグメンテーション ネットワークは、引き続き標準の畳み込みカーネルに依存しています。この論文では、球面調和関数に基づく等変ボクセル畳み込み、および等変プーリングと正規化操作を使用するセグメンテーション ネットワークの新しいファミリーを紹介します。これらの SE(3) 等変ボリューム セグメンテーション ネットワークは、トレーニング中に見られないデータ ポーズに対して堅牢であり、トレーニング中に回転ベースのデータ拡張を必要としません。さらに、MRI 脳腫瘍および健康な脳構造のセグメンテーション タスクにおけるセグメンテーション パフォーマンスの向上、トレーニング データの量の削減に対するロバスト性の強化、およびパラメーター効率の向上を実証します。結果を再現し、他のタスクのために等変セグメンテーション ネットワークを実装するためのコードは、~http://github.com/SCAN-NRAD/e3nn_Unet で入手できます。
Convolutional neural networks (CNNs) allow for parameter sharing and translational equivariance by using convolutional kernels in their linear layers. By restricting these kernels to be SO(3)-steerable, CNNs can further improve parameter sharing and equivariance. These equivariant convolutional layers have several advantages over standard convolutional layers, including increased robustness to unseen poses, smaller network size, and improved sample efficiency. Despite this, most segmentation networks used in medical image analysis continue to rely on standard convolutional kernels. In this paper, we present a new family of segmentation networks that use equivariant voxel convolutions based on spherical harmonics, as well as equivariant pooling and normalization operations. These SE(3)-equivariant volumetric segmentation networks, which are robust to data poses not seen during training, do not require rotation-based data augmentation during training. In addition, we demonstrate improved segmentation performance in MRI brain tumor and healthy brain structure segmentation tasks, with enhanced robustness to reduced amounts of training data and improved parameter efficiency. Code to reproduce our results, and to implement the equivariant segmentation networks for other tasks is available at~http://github.com/SCAN-NRAD/e3nn_Unet.