ACNet: Strengthening the Kernel Skeletons for Powerful CNN via Asymmetric Convolution Blocks
  特定のアプリケーションのコンテキストで適切な畳み込みニューラルネットワーク(CNN)アーキテクチャを設計するには、通常、人手がかかるか、GPU時間が非常に長くなるため、研究コミュニティは、複数の成熟したアーキテクチャに簡単にプラグインできる、アーキテクチャに中立なCNN構造を求めています実際のアプリケーションでのパフォーマンス。 CNNビルディングブロックとしてのアーキテクチャに中立な構造である非対称コンボリューションブロック(ACB)を提案します。これは、1D非対称コンボリューションを使用して平方コンボリューションカーネルを強化します。既製のアーキテクチャの場合、標準の正方形カーネル畳み込み層をACBに置き換えて、非対称畳み込みネットワーク(ACNet)を構築し、より高いレベルの精度に到達するようにトレーニングできます。トレーニング後、ACNetを同等に元の同じアーキテクチャに変換するため、余分な計算は必要ありません。 ACNetは、CIFARおよびImageNet上のさまざまなモデルのパフォーマンスを明確なマージンで改善できることがわかりました。さらなる実験を通じて、ACBの有効性は、回転歪みに対するモデルのロバスト性を高め、正方形の畳み込みカーネルの中心骨格部分を強化する能力に起因すると考えられます。
As designing appropriate Convolutional Neural Network (CNN) architecture in the context of a given application usually involves heavy human works or numerous GPU hours, the research community is soliciting the architecture-neutral CNN structures, which can be easily plugged into multiple mature architectures to improve the performance on our real-world applications. We propose Asymmetric Convolution Block (ACB), an architecture-neutral structure as a CNN building block, which uses 1D asymmetric convolutions to strengthen the square convolution kernels. For an off-the-shelf architecture, we replace the standard square-kernel convolutional layers with ACBs to construct an Asymmetric Convolutional Network (ACNet), which can be trained to reach a higher level of accuracy. After training, we equivalently convert the ACNet into the same original architecture, thus requiring no extra computations anymore. We have observed that ACNet can improve the performance of various models on CIFAR and ImageNet by a clear margin. Through further experiments, we attribute the effectiveness of ACB to its capability of enhancing the model's robustness to rotational distortions and strengthening the central skeleton parts of square convolution kernels.
updated: Sat Aug 31 2019 12:50:35 GMT+0000 (UTC)
published: Sun Aug 11 2019 16:06:58 GMT+0000 (UTC)
