Channel DropBlock: きめの細かい視覚的分類のための改善された正則化方法
Channel DropBlock: An Improved Regularization Method for Fine-Grained Visual Classification
ファイングレインビジュアル分類 (FGVC) タスクで同じスーパーカテゴリ (たとえば、鳥) からオブジェクトのサブカテゴリを分類することは、複数の識別機能のマイニングに大きく依存しています。既存のアプローチは、主にこの問題に対処するために、識別部分を特定するアテンション メカニズムや、高度にパラメータ化された特徴を弱く監視された方法で抽出する特徴エンコーディング アプローチを導入しています。この作業では、この問題に対処するために、Channel DropBlock (CDB) という名前の軽量で効果的な正則化メソッドを 2 つの代替相関メトリックと組み合わせて提案します。重要なアイデアは、トレーニング中に相関チャネルのグループをランダムにマスクして、共適応から特徴を破壊し、特徴表現を強化することです。 3 つのベンチマーク FGVC データセットに関する広範な実験は、CDB がパフォーマンスを効果的に改善することを示しています。
Classifying the sub-categories of an object from the same super-category (e.g., bird) in a fine-grained visual classification (FGVC) task highly relies on mining multiple discriminative features. Existing approaches mainly tackle this problem by introducing attention mechanisms to locate the discriminative parts or feature encoding approaches to extract the highly parameterized features in a weakly-supervised fashion. In this work, we propose a lightweight yet effective regularization method named Channel DropBlock (CDB), in combination with two alternative correlation metrics, to address this problem. The key idea is to randomly mask out a group of correlated channels during training to destruct features from co-adaptations and thus enhance feature representations. Extensive experiments on three benchmark FGVC datasets show that CDB effectively improves the performance.
updated: Mon Jun 07 2021 09:03:02 GMT+0000 (UTC)
published: Mon Jun 07 2021 09:03:02 GMT+0000 (UTC)
