4-Connected Shift Residual Networks
  シフト操作は、空間畳み込みの代替として最近導入されました。操作は、アクティベーションのサブセットを水平方向および/または垂直方向に移動します。その後、空間畳み込みはシフト演算に置き換えられ、その後に点ごとの畳み込みが続き、計算コストが大幅に削減されます。この作業では、高精度のCNNにシフトを最適に適用する方法を調査します。 ImageNet上のResNetに2つの異なる近隣グループのシフトを適用します。最初に導入された8連結(8C)近隣シフトと、あまり研究されていない4連結(4C)近隣シフトです。 ResNetの空間畳み込みをシフトに置き換えると、両方のシフト近傍が等しいImageNet精度を与え、大きな画像に対する小さな近傍の十分性を示していることがわかります。興味深いことに、残差ネットワークのすべてのポイントワイズコンボリューションへのシフトを組み込む場合、4連結シフトは8連結シフトよりも優れています。このような4連接シフトのセットアップでは、完全な残余ネットワークと同じ精度が得られますが、パラメーターとFLOPの数は40%以上削減されます。次に、空間畳み込みがなければ、ResNetのダウンサンプリング/アップサンプリングのボトルネックチャネル構造が不要になることを強調します。元のResNetよりもはるかに短いが、同じ計算コストでより高い精度を持つ、新しい4Cシフトベースの残差ネットワークを示します。このネットワークは、これまでに示された最高精度のシフトベースのネットワークであり、ディープニューラルネットワークでのシフトの可能性を示しています。
The shift operation was recently introduced as an alternative to spatial convolutions. The operation moves subsets of activations horizontally and/or vertically. Spatial convolutions are then replaced with shift operations followed by point-wise convolutions, significantly reducing computational costs. In this work, we investigate how shifts should best be applied to high accuracy CNNs. We apply shifts of two different neighbourhood groups to ResNet on ImageNet: the originally introduced 8-connected (8C) neighbourhood shift and the less well studied 4-connected (4C) neighbourhood shift. We find that when replacing ResNet's spatial convolutions with shifts, both shift neighbourhoods give equal ImageNet accuracy, showing the sufficiency of small neighbourhoods for large images. Interestingly, when incorporating shifts to all point-wise convolutions in residual networks, 4-connected shifts outperform 8-connected shifts. Such a 4-connected shift setup gives the same accuracy as full residual networks while reducing the number of parameters and FLOPs by over 40%. We then highlight that without spatial convolutions, ResNet's downsampling/upsampling bottleneck channel structure is no longer needed. We show a new, 4C shift-based residual network, much shorter than the original ResNet yet with a higher accuracy for the same computational cost. This network is the highest accuracy shift-based network yet shown, demonstrating the potential of shifting in deep neural networks.
updated: Tue Oct 22 2019 12:46:31 GMT+0000 (UTC)
published: Tue Oct 22 2019 12:46:31 GMT+0000 (UTC)
