arXiv reaDer
一般的に効果的なCNNアーキテクチャを導出するための代表的な基盤としてのImageNet
ImageNet as a Representative Basis for Deriving Generally Effective CNN Architectures
多様なデータセットとアプリケーションドメインのセットでうまく機能する一般的に効果的な畳み込みニューラルネットワーク(CNN)アーキテクチャを導出するための基礎として、ImageNetの代表性を調査および改善します。この目的のために、広範なAnyNetXデザインスペースからサンプリングされた500個のCNNアーキテクチャを、ImageNetおよび他の8つの画像分類データセットでトレーニングする広範な実証研究を実施します。アーキテクチャのパフォーマンスはデータセットに大きく依存していることがわかります。一部のデータセットは、すべてのアーキテクチャでImageNetとの負のエラー相関を示しています。より少ないクラスに制限されたImageNetサブセットを利用することにより、これらの相関を大幅に高める方法を示します。また、データセットの変更に関して最も機密性の高い設計パラメーターとして、レイヤー間の累積幅とネットワークの合計深度を特定します。
We investigate and improve the representativeness of ImageNet as a basis for deriving generally effective convolutional neural network (CNN) architectures that perform well on a diverse set of datasets and application domains. To this end, we conduct an extensive empirical study for which we train 500 CNN architectures, sampled from the broad AnyNetX design space, on ImageNet as well as 8 other image classification datasets. We observe that the performances of the architectures are highly dataset-dependent. Some datasets even exhibit a negative error correlation with ImageNet across all architectures. We show how to significantly increase these correlations by utilizing ImageNet subsets restricted to fewer classes. We also identify the cumulative width across layers as well as the total depth of the network as the most sensitive design parameter with respect to changing datasets.
updated: Thu Mar 17 2022 19:17:25 GMT+0000 (UTC)
published: Tue Mar 16 2021 14:42:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト