Grad-CAM ++:ディープコンボリューショナルネットワークの視覚的説明の改善
Grad-CAM++: Improved Visual Explanations for Deep Convolutional Networks
過去10年間、コンボリューショナルニューラルネットワーク(CNN)モデルは、複雑な視覚問題の解決に非常に成功してきました。ただし、これらの深いモデルは、内部機能の理解の欠如を考慮して「ブラックボックス」メソッドとして認識されます。説明可能なディープラーニングモデルの開発に最近大きな関心が寄せられており、このホワイトペーパーはこの方向への取り組みです。 Grad-CAMと呼ばれる最近提案された方法に基づいて、CNNモデル予測の視覚的説明をより良く提供できる一般化された方法を提案します。 、最新技術と比較した場合。特定のクラススコアに関する最後の畳み込み層の特徴マップの正の偏導関数の重み付き組み合わせを重みとして使用して、対応するクラスラベルの視覚的な説明を生成する、提案された方法の数学的な導出を提供します。標準データセットに関する主観的および客観的な広範な実験と評価により、Grad-CAM ++は、分類、画像キャプション生成、3Dアクション認識を含む複数のタスクにわたって、特定のCNNアーキテクチャの有望な人間が解釈可能な視覚的説明を提供することが示されました;知識の蒸留などの新しい設定でも同様です。
Over the last decade, Convolutional Neural Network (CNN) models have been highly successful in solving complex vision problems. However, these deep models are perceived as "black box" methods considering the lack of understanding of their internal functioning. There has been a significant recent interest in developing explainable deep learning models, and this paper is an effort in this direction. Building on a recently proposed method called Grad-CAM, we propose a generalized method called Grad-CAM++ that can provide better visual explanations of CNN model predictions, in terms of better object localization as well as explaining occurrences of multiple object instances in a single image, when compared to state-of-the-art. We provide a mathematical derivation for the proposed method, which uses a weighted combination of the positive partial derivatives of the last convolutional layer feature maps with respect to a specific class score as weights to generate a visual explanation for the corresponding class label. Our extensive experiments and evaluations, both subjective and objective, on standard datasets showed that Grad-CAM++ provides promising human-interpretable visual explanations for a given CNN architecture across multiple tasks including classification, image caption generation and 3D action recognition; as well as in new settings such as knowledge distillation.
updated: Fri Nov 09 2018 19:21:05 GMT+0000 (UTC)
published: Mon Oct 30 2017 16:55:43 GMT+0000 (UTC)
