arXiv reaDer
比較勾配と敵対的活性化を分析することによる相対的な断面伝搬を伴うディープニューラルネットワークの解釈
Interpreting Deep Neural Networks with Relative Sectional Propagation by Analyzing Comparative Gradients and Hostile Activations
ディープニューラルネットワーク(DNN)の明確な透明性は、複雑な内部構造と深い階層に沿った非線形変換によって妨げられます。この論文では、クラス識別属性と明確な客観性の特性を備えた出力予測を完全に分解するための新しい属性方法である相対断面伝搬(RSP)を提案します。 DNNを分解する際のトレードオフ関係である、バックプロパゲーションベースのアトリビューション方法のいくつかの欠点を注意深く再検討します。敵対的要因を、標的の帰属を見つけることを妨げる要素として定義し、活性化されたニューロンの抑制されていない性質を克服するために識別可能な方法でそれを伝播します。その結果、各属性を重要度に合わせて維持しながら、ターゲット(正)および敵対(負)の属性の双極関連性スコアを割り当てることができます。また、チャネル属性マップへの競合するユニットを排除することにより、後方伝播中にターゲットの関連性スコアと敵意帰属の間のギャップの減少を防ぐためのパージ手法を紹介します。したがって、私たちの方法は、従来の帰属方法と比較して、より明確なクラス識別性と活性化ニューロンの詳細な解明により、DNNの予測を分解することを可能にします。検証済みの実験環境で、評価の結果を報告します:(i)ポインティングゲーム、(ii)mIoU、および(iii)PASCAL VOC 2007、MS COCO 2014、およびImageNetデータセットを使用したモデル感度。結果は、私たちの方法が、独特で直感的な視覚化を含む、既存の後方分解方法よりも優れていることを示しています。
The clear transparency of Deep Neural Networks (DNNs) is hampered by complex internal structures and nonlinear transformations along deep hierarchies. In this paper, we propose a new attribution method, Relative Sectional Propagation (RSP), for fully decomposing the output predictions with the characteristics of class-discriminative attributions and clear objectness. We carefully revisit some shortcomings of backpropagation-based attribution methods, which are trade-off relations in decomposing DNNs. We define hostile factor as an element that interferes with finding the attributions of the target and propagate it in a distinguishable way to overcome the non-suppressed nature of activated neurons. As a result, it is possible to assign the bi-polar relevance scores of the target (positive) and hostile (negative) attributions while maintaining each attribution aligned with the importance. We also present the purging techniques to prevent the decrement of the gap between the relevance scores of the target and hostile attributions during backward propagation by eliminating the conflicting units to channel attribution map. Therefore, our method makes it possible to decompose the predictions of DNNs with clearer class-discriminativeness and detailed elucidations of activation neurons compared to the conventional attribution methods. In a verified experimental environment, we report the results of the assessments: (i) Pointing Game, (ii) mIoU, and (iii) Model Sensitivity with PASCAL VOC 2007, MS COCO 2014, and ImageNet datasets. The results demonstrate that our method outperforms existing backward decomposition methods, including distinctive and intuitive visualizations.
updated: Sat Dec 12 2020 10:49:00 GMT+0000 (UTC)
published: Mon Dec 07 2020 03:11:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト