畳み込みブロックは局所特徴抽出器として機能し、ニューラル ネットワークの成功の鍵となります。ローカルのセマンティック機能の埋め込みをより明示的にするために、最適な一致するカーネルに従って、畳み込みブロックを機能選択として再定式化します。このようにして、バッチ正規化 (BN) とそれに続く修正線形ユニット (ReLU) が arg-max オプティマイザーとして解釈されると、典型的な ResNet ブロックが実際にテンプレート マッチングを介して局所特徴埋め込みを実行することを示します。この観点に従って、ラベル情報を使用して意味的に意味のあるローカル機能の埋め込みを明示的に強制する残差ブロックを調整します。具体的には、対応する領域が一致するクラスに従って、各局所領域に特徴ベクトルを割り当てます。画像分類のためのいくつかのアーキテクチャを備えた 3 つの一般的なベンチマーク データセットでこの方法を評価し、このアプローチがベースライン アーキテクチャのパフォーマンスを大幅に向上させることを一貫して示しています。
Convolution blocks serve as local feature extractors and are the key to success of the neural networks. To make local semantic feature embedding rather explicit, we reformulate convolution blocks as feature selection according to the best matching kernel. In this manner, we show that typical ResNet blocks indeed perform local feature embedding via template matching once batch normalization (BN) followed by a rectified linear unit (ReLU) is interpreted as arg-max optimizer. Following this perspective, we tailor a residual block that explicitly forces semantically meaningful local feature embedding through using label information. Specifically, we assign a feature vector to each local region according to the classes that the corresponding region matches. We evaluate our method on three popular benchmark datasets with several architectures for image classification and consistently show that our approach substantially improves the performance of the baseline architectures.