arXiv reaDer
特権プーリング:監視された注意によるサンプル効率の向上
Privileged Pooling: Better Sample Efficiency Through Supervised Attention
トレーニングデータのキーポイント注釈の形式で特権情報を使用して、小規模および/または偏ったトレーニングセットから強力なモデルを学習する教師あり画像分類のスキームを提案します。私たちの主な動機は、生物多様性モデリングなどの生態学的アプリケーションのための動物種の認識です。これは、希少種による長い尾の種の分布や、カメラトラップの繰り返しのシーン背景などの強いデータセットバイアスのために困難です。これらの課題に対抗するために、重要なオブジェクト部分を強調するキーポイント注釈を介して監視される視覚的注意メカニズムを提案します。新しい特権プーリング操作として実装されたこの特権情報は、トレーニング中にのみ必要であり、モデルが識別力のある領域に焦点を合わせるのに役立ちます。 3つの異なる動物種データセットを使用した実験で、特権プーリングを使用した深いネットワークが小さなトレーニングセットをより効率的に使用し、より一般化できることを示します。
We propose a scheme for supervised image classification that uses privileged information, in the form of keypoint annotations for the training data, to learn strong models from small and/or biased training sets. Our main motivation is the recognition of animal species for ecological applications such as biodiversity modelling, which is challenging because of long-tailed species distributions due to rare species, and strong dataset biases such as repetitive scene background in camera traps. To counteract these challenges, we propose a visual attention mechanism that is supervised via keypoint annotations that highlight important object parts. This privileged information, implemented as a novel privileged pooling operation, is only required during training and helps the model to focus on regions that are discriminative. In experiments with three different animal species datasets, we show that deep networks with privileged pooling can use small training sets more efficiently and generalize better.
updated: Wed Mar 17 2021 09:55:21 GMT+0000 (UTC)
published: Fri Mar 20 2020 10:03:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト