グループ等変ネットワークの大きな経験的成功により、近年、多種多様な同変ネットワークアーキテクチャが生まれています。そのため、特定の焦点は、平面画像の回転と反射の同変CNNにあります。ここでは、操縦可能なCNNのフレームワークにおけるE(2)等変畳み込みの一般的な説明を示します。これにより、操縦可能なCNNの理論は、特徴空間の変換則を記述するグループ表現に依存する畳み込みカーネルに制約を与えます。任意のグループ表現に対するこれらの制約は、既約表現の下での制約に還元できることを示します。カーネル空間制約の一般的な解は、ユークリッドグループE(2)とそのサブグループの任意の表現に対して与えられます。私たちは、以前に提案された完全に新しい同等のネットワークアーキテクチャを幅広く実装し、それらのパフォーマンスを広範囲にわたって比較します。 E(2)ステアブルコンボリューションは、非等式コンボリューションのドロップイン置換として使用すると、CIFAR-10、CIFAR-100、およびSTL-10で顕著なゲインが得られることがさらに示されています。
The big empirical success of group equivariant networks has led in recent years to the sprouting of a great variety of equivariant network architectures. A particular focus has thereby been on rotation and reflection equivariant CNNs for planar images. Here we give a general description of E(2)-equivariant convolutions in the framework of Steerable CNNs. The theory of Steerable CNNs thereby yields constraints on the convolution kernels which depend on group representations describing the transformation laws of feature spaces. We show that these constraints for arbitrary group representations can be reduced to constraints under irreducible representations. A general solution of the kernel space constraint is given for arbitrary representations of the Euclidean group E(2) and its subgroups. We implement a wide range of previously proposed and entirely new equivariant network architectures and extensively compare their performances. E(2)-steerable convolutions are further shown to yield remarkable gains on CIFAR-10, CIFAR-100 and STL-10 when used as a drop-in replacement for non-equivariant convolutions.