arXiv reaDer
スケール回転等変リー群畳み込みニューラル ネットワーク (リー群 CNN)
Scale-Rotation-Equivariant Lie Group Convolution Neural Networks (Lie Group-CNNs)
畳み込みカーネルの重み共有メカニズムにより、畳み込みニューラル ネットワーク (CNN) の変換の等分散性が保証されます。最近、回転等分散性が研究されています。しかし、スケールの等分散性やスケールの回転と同時の等分散性に関する研究は十分ではありません。この研究では、画像分類タスクのスケール、回転、等分散性を維持できるリー群 CNN を提案します。リー群 CNN には、リフティング モジュール、一連のグループ畳み込みモジュール、グローバル プーリング層、および分類層が含まれています。リフティング モジュールは、入力画像をユークリッド空間からリー群空間に転送し、リー群要素のリー代数を入力として使用する完全接続ネットワークを通じて群畳み込みをパラメータ化し、スケール、回転、等分散性を実現します。リー群 SIM(2) は、スケール回転等分散を備えたリー群 CNN を確立するために利用されます。リー群 CNN のスケール回転等分散性が検証され、血球データセット (97.50%) および HAM10000 データセット (77.90%) で、リー代数畳み込みネットワーク、膨張畳み込み、空間変換ネットワーク、およびスケール同等の操縦可能なネットワーク。さらに、SIM(2) 上のリー群 CNN の回転等変性に関する汎化能力は、rotated-MNIST およびrotated-CIFAR10 で検証され、ネットワークのロバスト性は SO(2) および SE(2) で検証されます。 。したがって、リー群 CNN は幾何学的特徴をうまく抽出でき、回転とスケール変換を使用して画像に対して等変認識を実行できます。
The weight-sharing mechanism of convolutional kernels ensures translation-equivariance of convolution neural networks (CNNs). Recently, rotation-equivariance has been investigated. However, research on scale-equivariance or simultaneous scale-rotation-equivariance is insufficient. This study proposes a Lie group-CNN, which can keep scale-rotation-equivariance for image classification tasks. The Lie group-CNN includes a lifting module, a series of group convolution modules, a global pooling layer, and a classification layer. The lifting module transfers the input image from Euclidean space to Lie group space, and the group convolution is parameterized through a fully connected network using Lie-algebra of Lie-group elements as inputs to achieve scale-rotation-equivariance. The Lie group SIM(2) is utilized to establish the Lie group-CNN with scale-rotation-equivariance. Scale-rotation-equivariance of Lie group-CNN is verified and achieves the best recognition accuracy on the blood cell dataset (97.50%) and the HAM10000 dataset (77.90%) superior to Lie algebra convolution network, dilation convolution, spatial transformer network, and scale-equivariant steerable network. In addition, the generalization ability of the Lie group-CNN on SIM(2) on rotation-equivariance is verified on rotated-MNIST and rotated-CIFAR10, and the robustness of the network is verified on SO(2) and SE(2). Therefore, the Lie group-CNN can successfully extract geometric features and performs equivariant recognition on images with rotation and scale transformations.
updated: Mon Jun 12 2023 08:14:12 GMT+0000 (UTC)
published: Mon Jun 12 2023 08:14:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト