コンボリューショナルニューラルネットワーク(CNN)は、コンピュータービジョンなどの領域で、生の入力データから問題固有の機能を学習できるため、主に手作りの機能の必要性を減らしました。ただし、データセット固有のCNNアーキテクチャの選択は、ほとんどが経験または専門知識のいずれかによって実行されるため、時間がかかり、エラーが発生しやすいプロセスです。 CNNアーキテクチャを学習するプロセスを自動化するために、このホワイトペーパーでは、完全に接続された(FC)レイヤーとデータセットの特性のいくつかとの関係を見つけようとします。 CNNアーキテクチャ、および最近のデータセットも、ディープ、シャロー、ワイドなどに分類されます。このホワイトペーパーでは、これらの用語を形式化し、以下の質問に答えようとします。 (i)より深く/浅いアーキテクチャがCNN w.r.tのパフォーマンスに与える影響FCレイヤー?、(ii)より深い/より広いデータセットがCNN w.r.tのパフォーマンスにどのように影響するか。 (iii)どの種類のアーキテクチャ(より深い/より浅い)が、どの種類の(より深い/より広い)データセットに適しているか。これらの調査結果に対処するために、深さが異なる3つのCNNアーキテクチャで実験を行いました。実験は、FC層の数を変化させることによって行われます。 CIFAR-10、CIFAR-100、Tiny ImageNet、CRCHistoPhenotypesなど、広く使用されている4つのデータセットを使用して、画像分類問題のコンテキストでの調査結果を正当化しました。この調査のソースコードは、https://github.com/shabbeersh/Impact-of-FC-layersで入手できます。
The Convolutional Neural Networks (CNNs), in domains like computer vision, mostly reduced the need for handcrafted features due to its ability to learn the problem-specific features from the raw input data. However, the selection of dataset-specific CNN architecture, which mostly performed by either experience or expertise is a time-consuming and error-prone process. To automate the process of learning a CNN architecture, this paper attempts at finding the relationship between Fully Connected (FC) layers with some of the characteristics of the datasets. The CNN architectures, and recently datasets also, are categorized as deep, shallow, wide, etc. This paper tries to formalize these terms along with answering the following questions. (i) What is the impact of deeper/shallow architectures on the performance of the CNN w.r.t. FC layers?, (ii) How the deeper/wider datasets influence the performance of CNN w.r.t. FC layers?, and (iii) Which kind of architecture (deeper/ shallower) is better suitable for which kind of (deeper/ wider) datasets. To address these findings, we have performed experiments with three CNN architectures having different depths. The experiments are conducted by varying the number of FC layers. We used four widely used datasets including CIFAR-10, CIFAR-100, Tiny ImageNet, and CRCHistoPhenotypes to justify our findings in the context of the image classification problem. The source code of this research is available at https://github.com/shabbeersh/Impact-of-FC-layers.