arXiv reaDer
ドライバーの足の活動分類のための強制的な空間的注意
Forced Spatial Attention for Driver Foot Activity Classification
  このホワイトペーパーでは、シーン内の顕著なオブジェクトの空間位置に関連付けられた画像分類タスクを確実に解決するための簡単なソリューションを提供します。シーン内のオブジェクトの変換に対して不変であるように設計された従来の画像分類アプローチとは異なり、対象オブジェクトが画像内のどこに位置するかに関して出力クラスが異なるタスクに焦点を合わせます。画像分類タスクのこのバリアントを処理するために、標準のクロスエントロピー(分類)損失をドメイン依存の強制空間注意(FSA)損失で増強することを提案します。目的の出力クラス。この損失関数の有用性を示すために、ドライバーの足のアクティビティ分類のタスクを検討します。各アクティビティは、ドライバーの足がシーンのどこにあるかと強く相関しています。提案された損失関数を使用してトレーニングを行うと、非常に大きなデータセットの必要性を排除しながら、精度が大幅に向上し、一般化が向上し、ノイズに対する堅牢性が向上します。
This paper provides a simple solution for reliably solving image classification tasks tied to spatial locations of salient objects in the scene. Unlike conventional image classification approaches that are designed to be invariant to translations of objects in the scene, we focus on tasks where the output classes vary with respect to where an object of interest is situated within an image. To handle this variant of the image classification task, we propose augmenting the standard cross-entropy (classification) loss with a domain dependent Forced Spatial Attention (FSA) loss, which in essence compels the network to attend to specific regions in the image associated with the desired output class. To demonstrate the utility of this loss function, we consider the task of driver foot activity classification - where each activity is strongly correlated with where the driver's foot is in the scene. Training with our proposed loss function results in significantly improved accuracies, better generalization, and robustness against noise, while obviating the need for very large datasets.
updated: Sun Oct 20 2019 20:53:43 GMT+0000 (UTC)
published: Sat Jul 27 2019 01:36:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト