DenseNetsは、いくつかのコンピュータービジョンタスクで最先端の精度を実現する連結タイプのスキップ接続を導入しています。このホワイトペーパーでは、連結タイプのスキップ接続のトポロジが勾配伝播と密接に関連していることを明らかにします。これにより、DNNのテストパフォーマンスの予測可能な動作が可能になります。この目的のために、NN-Massと呼ばれる新しいメトリックを導入して、情報がDNNをどの程度効果的に流れるかを定量化します。さらに、NN-Massは、他のタイプのスキップ接続、たとえば、加算タイプのスキップ接続(つまり、残差または反転残差)を含むResNet、Wide-ResNet(WRN)、およびMobileNetでも機能することを経験的に示しています。そのため、DenseNetのようなCNNとResNets / WRN / MobileNetsの両方について、理論的に根拠のあるNN-Massは、サイズ/計算要件が大幅に異なるにもかかわらず、同様の精度でモデルを識別できます。合成データセットと実際のデータセット(MNIST、CIFAR-10、CIFAR-100、ImageNetなど)の両方での詳細な実験は、私たちの洞察の広範な証拠を提供します。最後に、NN-Massの閉形式の方程式により、時間のかかるトレーニングや検索を行うことなく、初期化時に大幅に圧縮されたDenseNet(CIFAR-10の場合)とMobileNet(ImageNetの場合)を直接設計できます。
DenseNets introduce concatenation-type skip connections that achieve state-of-the-art accuracy in several computer vision tasks. In this paper, we reveal that the topology of the concatenation-type skip connections is closely related to the gradient propagation which, in turn, enables a predictable behavior of DNNs' test performance. To this end, we introduce a new metric called NN-Mass to quantify how effectively information flows through DNNs. Moreover, we empirically show that NN-Mass also works for other types of skip connections, e.g., for ResNets, Wide-ResNets (WRNs), and MobileNets, which contain addition-type skip connections (i.e., residuals or inverted residuals). As such, for both DenseNet-like CNNs and ResNets/WRNs/MobileNets, our theoretically grounded NN-Mass can identify models with similar accuracy, despite having significantly different size/compute requirements. Detailed experiments on both synthetic and real datasets (e.g., MNIST, CIFAR-10, CIFAR-100, ImageNet) provide extensive evidence for our insights. Finally, the closed-form equation of our NN-Mass enables us to design significantly compressed DenseNets (for CIFAR-10) and MobileNets (for ImageNet) directly at initialization without time-consuming training and/or searching.