arXiv reaDer
類似度畳み込みを使用したスケールと回転の等価性によるネットワークの強化
Empowering Networks With Scale and Rotation Equivariance Using A Similarity Convolution
畳み込みニューラル ネットワーク (CNN) の並進同変の性質は、コンピューター ビジョンで大きな成功を収めた理由です。ただし、ネットワークは、回転やスケーリングなどのより一般的な等分散特性を利用できないため、最終的には汎化パフォーマンスが制限されます。この制限に対処するために、CNN に並進、回転、およびスケーリングに関して同時等価性を付与する方法を考案します。私たちのアプローチは、畳み込みのような操作を定義し、提案されたスケーラブルなフーリエ アルガン表現に基づいて等分散を保証します。この方法は、従来のネットワークと同様の効率を維持し、グループ畳み込み演算子でよく発生する計算上の問題に直面しないため、追加の学習可能なパラメーターをほとんど導入しません。画像分類タスクでのアプローチの有効性を検証し、その堅牢性と、スケーリングされた入力と回転された入力の両方に対する一般化能力を示します。
The translational equivariant nature of Convolutional Neural Networks (CNNs) is a reason for its great success in computer vision. However, networks do not enjoy more general equivariance properties such as rotation or scaling, ultimately limiting their generalization performance. To address this limitation, we devise a method that endows CNNs with simultaneous equivariance with respect to translation, rotation, and scaling. Our approach defines a convolution-like operation and ensures equivariance based on our proposed scalable Fourier-Argand representation. The method maintains similar efficiency as a traditional network and hardly introduces any additional learnable parameters, since it does not face the computational issue that often occurs in group-convolution operators. We validate the efficacy of our approach in the image classification task, demonstrating its robustness and the generalization ability to both scaled and rotated inputs.
updated: Wed Mar 01 2023 08:43:05 GMT+0000 (UTC)
published: Wed Mar 01 2023 08:43:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト