最近の研究では、畳み込みネットワークは、入力に近い層と出力に近い層の間の接続が短い方が、より深く、より正確で、効率的な学習が可能であることが示されている。本論文では、この観測を受けて、フィードフォワード的に各層を他の層に接続する高密度畳み込みネットワーク(DenseNet)を導入する。従来のL層の畳み込みネットワークでは,各層とそれに続く層との間にL個の接続があるのに対し,我々のネットワークではL(L+1)/2個の直接接続がある。各層については、先行するすべての層の特徴マップが入力として使用され、その層自身の特徴マップが後続のすべての層への入力として使用される。DenseNetには、消失勾配問題を緩和し、特徴の伝播を強化し、特徴の再利用を促進し、パラメータ数を大幅に削減するという、いくつかの説得力のある利点がある。我々は、競争の激しい4つの物体認識ベンチマークタスク(CIFAR-10, CIFAR-100, SVHN, ImageNet)を用いて、提案したアーキテクチャを評価した。その結果、DenseNetsは、ほとんどのタスクにおいて最先端のものよりも大幅に改善され、高い性能を達成するために必要な計算量が少なくて済むことがわかった。コードと事前学習モデルは https://github.com/liuzhuang13/DenseNet から入手可能である。
Recent work has shown that convolutional networks can be substantially deeper, more accurate, and efficient to train if they contain shorter connections between layers close to the input and those close to the output. In this paper, we embrace this observation and introduce the Dense Convolutional Network (DenseNet), which connects each layer to every other layer in a feed-forward fashion. Whereas traditional convolutional networks with L layers have L connections - one between each layer and its subsequent layer - our network has L(L+1)/2 direct connections. For each layer, the feature-maps of all preceding layers are used as inputs, and its own feature-maps are used as inputs into all subsequent layers. DenseNets have several compelling advantages: they alleviate the vanishing-gradient problem, strengthen feature propagation, encourage feature reuse, and substantially reduce the number of parameters. We evaluate our proposed architecture on four highly competitive object recognition benchmark tasks (CIFAR-10, CIFAR-100, SVHN, and ImageNet). DenseNets obtain significant improvements over the state-of-the-art on most of them, whilst requiring less computation to achieve high performance. Code and pre-trained models are available at https://github.com/liuzhuang13/DenseNet .