arXiv reaDer
ELoPE:効率的なローカリゼーション、プーリング、埋め込みを備えたきめ細かい視覚分類
ELoPE: Fine-Grained Visual Classification with Efficient Localization, Pooling and Embedding
 粒度の細かい視覚分類(FGVC)のタスクは、異なる鳥種や車のモデルを区別するなど、クラス間の小さな差異を表示する分類問題を扱います。最先端のアプローチは、通常、精巧なアテンションメカニズムまたは(部分)ローカリゼーション法を標準の畳み込みニューラルネットワーク(CNN)に統合することにより、この問題に対処します。また、この作業の目的は、FGVC専用に設計された3つの効率的で軽量なコンポーネントを含めることにより、ResNetなどのバックボーンCNNのパフォーマンスを向上させることです。これは、グローバルk-maxプーリング、クラス平均の最適化によってトレーニングされた判別的埋め込み層、およびトレーニングにクラスラベルのみを必要とする効率的な境界ボックス推定器を使用することによって実現されます。結果として得られるモデルは、スタンフォード車とFGVC-Aircraftデータセットで新しい最高の最先端の認識精度を達成します。
The task of fine-grained visual classification (FGVC) deals with classification problems that display a small inter-class variance such as distinguishing between different bird species or car models. State-of-the-art approaches typically tackle this problem by integrating an elaborate attention mechanism or (part-) localization method into a standard convolutional neural network (CNN). Also in this work the aim is to enhance the performance of a backbone CNN such as ResNet by including three efficient and lightweight components specifically designed for FGVC. This is achieved by using global k-max pooling, a discriminative embedding layer trained by optimizing class means and an efficient bounding box estimator that only needs class labels for training. The resulting model achieves new best state-of-the-art recognition accuracies on the Stanford cars and FGVC-Aircraft datasets.
updated: Sun Nov 17 2019 21:30:30 GMT+0000 (UTC)
published: Sun Nov 17 2019 21:30:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト