畳み込み層は、最新のディープニューラルネットワークの基本的なビルディングブロックの1つです。基本的な前提の1つは、データセット内のすべての例でたたみ込みカーネルを共有する必要があることです。条件付きパラメーター化された畳み込み(CondConv)を提案します。これは、例ごとに特殊な畳み込みカーネルを学習します。通常の畳み込みをCondConvで置き換えると、効率的な推論を維持しながら、ネットワークのサイズと容量を増やすことができます。 CondConvを使用したネットワークのスケーリングにより、分類タスクと検出タスクの両方で、いくつかの既存の畳み込みニューラルネットワークアーキテクチャのパフォーマンスと推論コストのトレードオフが改善されることを示します。 ImageNet分類では、EfficientNet-B0に適用されたCondConvアプローチは、わずか413Mの乗算加算で78.3%の精度の最先端のパフォーマンスを実現します。 CondConv TensorflowレイヤーとCondConv-EfficientNetモデルのコードとチェックポイントは、https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet/condconvで入手できます。
Convolutional layers are one of the basic building blocks of modern deep neural networks. One fundamental assumption is that convolutional kernels should be shared for all examples in a dataset. We propose conditionally parameterized convolutions (CondConv), which learn specialized convolutional kernels for each example. Replacing normal convolutions with CondConv enables us to increase the size and capacity of a network, while maintaining efficient inference. We demonstrate that scaling networks with CondConv improves the performance and inference cost trade-off of several existing convolutional neural network architectures on both classification and detection tasks. On ImageNet classification, our CondConv approach applied to EfficientNet-B0 achieves state-of-the-art performance of 78.3% accuracy with only 413M multiply-adds. Code and checkpoints for the CondConv Tensorflow layer and CondConv-EfficientNet models are available at: https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet/condconv.