arXiv reaDer
閉塞顔認識のための局所性を意識したチャネルワイズドロップアウト
Locality-aware Channel-wise Dropout for Occluded Face Recognition
制約のないシナリオでは、特に顔が部分的に遮られている場合、顔認識は依然として困難な作業です。オクルージョンに対するロバスト性を向上させるために、トレーニング画像を人工オクルージョンで補強することが有用なアプローチとして証明されています。ただし、これらの人工的なオクルージョンは通常、黒い長方形、またはサングラス、スカーフ、電話などのいくつかのオブジェクトテンプレートを追加することによって生成されます。これは、現実的なオクルージョンを十分にシミュレートできません。この論文では、オクルージョンが本質的にニューロンのグループに損傷を与えるという議論に基づいて、ニューロンのグループの活性化をいくつかの精巧に選択されたチャネルにドロップすることによる、斬新でエレガントなオクルージョンシミュレーション方法を提案します。具体的には、最初に空間正則化を使用して、各特徴チャネルがローカルおよび異なる顔領域に応答するように促します。このように、ローカル領域でのオクルージョンによって影響を受けるアクティベーションは、単一の機能チャネルに配置される可能性が高くなります。次に、ローカリティを意識したチャネルワイズドロップアウト(LCD)は、フィーチャチャネル全体をドロップアウトすることによってオクルージョンをシミュレートするように設計されています。さらに、いくつかの特徴チャネルをランダムにドロップアウトすることにより、私たちの方法はより広い領域のオクルージョンをうまくシミュレートすることができます。提案されたLCDは、後続のレイヤーがオクルージョンによって引き起こされるクラス内の特徴の分散を最小限に抑えるように促し、オクルージョンに対する堅牢性を向上させることができます。さらに、チャネルごとの注意ベクトルを学習して特徴チャネルを再重み付けすることにより、補助的な空間注意モジュールを設計します。これにより、非閉塞領域の寄与が改善されます。さまざまなベンチマークでの広範な実験により、提案された方法が最先端の方法よりも優れており、顕著な改善が見られます。
Face recognition remains a challenging task in unconstrained scenarios, especially when faces are partially occluded. To improve the robustness against occlusion, augmenting the training images with artificial occlusions has been proved as a useful approach. However, these artificial occlusions are commonly generated by adding a black rectangle or several object templates including sunglasses, scarfs and phones, which cannot well simulate the realistic occlusions. In this paper, based on the argument that the occlusion essentially damages a group of neurons, we propose a novel and elegant occlusion-simulation method via dropping the activations of a group of neurons in some elaborately selected channel. Specifically, we first employ a spatial regularization to encourage each feature channel to respond to local and different face regions. In this way, the activations affected by an occlusion in a local region are more likely to be located in a single feature channel. Then, the locality-aware channel-wise dropout (LCD) is designed to simulate the occlusion by dropping out the entire feature channel. Furthermore, by randomly dropping out several feature channels, our method can well simulate the occlusion of larger area. The proposed LCD can encourage its succeeding layers to minimize the intra-class feature variance caused by occlusions, thus leading to improved robustness against occlusion. In addition, we design an auxiliary spatial attention module by learning a channel-wise attention vector to reweight the feature channels, which improves the contributions of non-occluded regions. Extensive experiments on various benchmarks show that the proposed method outperforms state-of-the-art methods with a remarkable improvement.
updated: Tue Jul 20 2021 05:53:14 GMT+0000 (UTC)
published: Tue Jul 20 2021 05:53:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト