arXiv reaDer
U-CAM:不確実性ベースのクラスアクティベーションマップを使用した視覚的説明
U-CAM: Visual Explanation using Uncertainty based Class Activation Maps
  ディープラーニングモデルの理解と説明は必須のタスクです。これに向けて、視覚的注意マップも提供する勾配ベースの確実性推定値を取得する方法を提案します。特に、視覚的な質問応答タスクを解決します。これらの推定に勾配を使用することでさらに改善する最新の確率的深層学習法を取り入れています。これらには2つの利点があります。a)誤分類されたサンプルとよりよく相関する確実性推定値の取得における改善、およびb)人間の注意領域との相関に関して最新の結果を提供する注意マップの改善。改善されたアテンションマップにより、視覚的な質問応答のさまざまな方法が一貫して改善されます。したがって、提案された手法は、深層学習モデルの改善された確実性推定値と説明を取得するためのレシピと考えることができます。すべての標準ベンチマークに関する視覚的な質問応答タスクの詳細な実証分析と、最先端の方法との比較を提供します。
Understanding and explaining deep learning models is an imperative task. Towards this, we propose a method that obtains gradient-based certainty estimates that also provide visual attention maps. Particularly, we solve for visual question answering task. We incorporate modern probabilistic deep learning methods that we further improve by using the gradients for these estimates. These have two-fold benefits: a) improvement in obtaining the certainty estimates that correlate better with misclassified samples and b) improved attention maps that provide state-of-the-art results in terms of correlation with human attention regions. The improved attention maps result in consistent improvement for various methods for visual question answering. Therefore, the proposed technique can be thought of as a recipe for obtaining improved certainty estimates and explanation for deep learning models. We provide detailed empirical analysis for the visual question answering task on all standard benchmarks and comparison with state of the art methods.
updated: Thu Oct 17 2019 07:20:32 GMT+0000 (UTC)
published: Sat Aug 17 2019 14:39:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト