深い畳み込みネットワークは、最近、細粒度車両分類で優れたパフォーマンスを示しています。これらの既存の研究に基づいて、バックプローベーションアルゴリズムはできるだけ識別性の低い特徴を抽出することに焦点を当てておらず、損失関数がゼロに等しいことに焦点を当てていると考えます。直観的に、より識別性の低い機能を学習でき、これらの機能がトレーニングデータにうまく適合できる場合、ニューラルネットワークの一般化能力を改善できます。したがって、シャネルマックスプーリングと呼ばれる、完全に接続されたレイヤーと畳み込みレイヤーの間に配置される新しいレイヤーを提案します。提案されたレイヤーは、まず特徴マップをグループ化し、次に特徴マップのグループ内の同じ位置で最大ピクセルを計算することにより、各グループを新しい特徴マップに圧縮します。一方、提案されたレイヤーには、ニューラルネットワークが大量のパラメーターを削減できるという利点があります。 Stanford Cars-196データセットとComp Carsデータセットという2つの細粒度車両データセットの実験結果は、提案されたレイヤーが、大量のパラメーターが存在する状況で細粒度車両分類のディープニューラルネットワークの分類精度を改善できることを示しています減少。さらに、2つのデータセットの最先端のパフォーマンスと競合するパフォーマンスを備えています。
Deep convolutional networks have recently shown excellent performance on Fine-Grained Vehicle Classification. Based on these existing works, we consider that the back-probation algorithm does not focus on extracting less discriminative feature as much as possible, but focus on that the loss function equals zero. Intuitively, if we can learn less discriminative features, and these features still could fit the training data well, the generalization ability of neural network could be improved. Therefore, we propose a new layer which is placed between fully connected layers and convolutional layers, called as Chanel Max Pooling. The proposed layer groups the features map first and then compress each group into a new feature map by computing maximum of pixels with same positions in the group of feature maps. Meanwhile, the proposed layer has an advantage that it could help neural network reduce massive parameters. Experimental results on two fine-grained vehicle datasets, the Stanford Cars-196 dataset and the Comp Cars dataset, demonstrate that the proposed layer could improve classification accuracies of deep neural networks on fine-grained vehicle classification in the situation that a massive of parameters are reduced. Moreover, it has a competitive performance with the-state-of-art performance on the two datasets.