arXiv reaDer
LAP:畳み込みニューラルネットワークにおける忠実な解釈と知識注入のための注意ベースのモジュール
LAP: An Attention-Based Module for Faithful Interpretation and Knowledge Injection in Convolutional Neural Networks
深い畳み込みニューラルネットワークの最先端のパフォーマンスにもかかわらず、それらは目に見えない状況でバイアスや誤動作の影響を受けやすくなっています。彼らの推論の背後にある複雑な計算は、信頼を築くのに十分に人間が理解できるものではありません。外部の説明者の方法は、人間が理解できる方法でネットワークの決定を解釈しようとしましたが、それらの仮定と単純化のために誤謬で非難されています。一方、モデルの固有の自己解釈可能性は、前述の誤謬に対してより堅牢ですが、すでにトレーニングされたモデルには適用できません。この作業では、ローカルアテンションプーリング(LAP)と呼ばれる新しいアテンションベースのプーリングレイヤーを提案します。これは、モデルのパフォーマンスを向上させながら、自己解釈可能性と知識注入の可能性を実現します。さらに、トレーニングのプロセスを強化するために、いくつかの弱く監視された知識注入方法論が提供されます。 Imagenetを含む3つの異なるデータセットでいくつかのLAP拡張モデルを評価することにより、私たちの主張を検証しました。提案されたフレームワークは、一般的に使用されているホワイトボックスの説明方法よりも、人間が理解しやすく、モデルに忠実な解釈を提供します。
Despite the state-of-the-art performance of deep convolutional neural networks, they are susceptible to bias and malfunction in unseen situations. The complex computation behind their reasoning is not sufficiently human-understandable to develop trust. External explainer methods have tried to interpret the network decisions in a human-understandable way, but they are accused of fallacies due to their assumptions and simplifications. On the other side, the inherent self-interpretability of models, while being more robust to the mentioned fallacies, cannot be applied to the already trained models. In this work, we propose a new attention-based pooling layer, called Local Attention Pooling (LAP), that accomplishes self-interpretability and the possibility for knowledge injection while improving the model's performance. Moreover, several weakly-supervised knowledge injection methodologies are provided to enhance the process of training. We verified our claims by evaluating several LAP-extended models on three different datasets, including Imagenet. The proposed framework offers more valid human-understandable and more faithful-to-the-model interpretations than the commonly used white-box explainer methods.
updated: Mon Nov 21 2022 16:36:57 GMT+0000 (UTC)
published: Thu Jan 27 2022 21:10:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト