arXiv reaDer
真にシフト不変の畳み込みニューラルネットワーク
Truly shift-invariant convolutional neural networks
畳み込み層とプーリング層の使用のおかげで、畳み込みニューラルネットワークは長い間シフト不変であると考えられていました。ただし、最近の研究では、CNNの出力は、入力のわずかなシフトによって大幅に変化する可能性があることが示されています。これは、ダウンサンプリング(ストライド)層の存在によって引き起こされる問題です。既存のソリューションは、データ拡張またはアンチエイリアシングのいずれかに依存しています。どちらにも制限があり、どちらも完全なシフト不変性を実現していません。さらに、これらの方法から得られるゲインは、トレーニング中に見られない画像パターンには及びません。これらの課題に対処するために、畳み込みニューラルネットワークが精度を損なうことなくシフト下で分類パフォーマンスの100%の一貫性を達成できるようにする、単純なサブサンプリングスキームである適応多相サンプリング(APS)を提案します。 APSを使用すると、ネットワークはトレーニング前でもシフトに対して完全な一貫性を示し、畳み込みニューラルネットワークを真にシフト不変にする最初のアプローチになります。
Thanks to the use of convolution and pooling layers, convolutional neural networks were for a long time thought to be shift-invariant. However, recent works have shown that the output of a CNN can change significantly with small shifts in input: a problem caused by the presence of downsampling (stride) layers. The existing solutions rely either on data augmentation or on anti-aliasing, both of which have limitations and neither of which enables perfect shift invariance. Additionally, the gains obtained from these methods do not extend to image patterns not seen during training. To address these challenges, we propose adaptive polyphase sampling (APS), a simple sub-sampling scheme that allows convolutional neural networks to achieve 100% consistency in classification performance under shifts, without any loss in accuracy. With APS the networks exhibit perfect consistency to shifts even before training, making it the first approach that makes convolutional neural networks truly shift invariant.
updated: Tue Dec 01 2020 12:46:12 GMT+0000 (UTC)
published: Sat Nov 28 2020 20:57:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト