arXiv reaDer
注意の視覚化を超えた変圧器の解釈可能性
Transformer Interpretability Beyond Attention Visualization
自己注意技術、特にトランスフォーマーは、テキスト処理の分野を支配しており、コンピュータービジョン分類タスクでますます人気が高まっています。特定の分類につながった画像の部分を視覚化するために、既存の方法は、取得された注意マップに依存するか、注意グラフに沿ったヒューリスティックな伝播を採用します。この作業では、Transformerネットワークの関連性を計算する新しい方法を提案します。このメソッドは、Deep Taylor Decompositionの原則に基づいてローカルの関連性を割り当て、これらの関連性スコアをレイヤー全体に伝播します。この伝播には、既存の方法に挑戦するアテンションレイヤーとスキップ接続が含まれます。私たちのソリューションは、レイヤー全体の全体的な関連性を維持することが示されている特定の定式化に基づいています。私たちは、ごく最近のビジュアルTransformerネットワークとテキスト分類の問題でこの方法をベンチマークし、既存の説明可能性の方法よりも明らかに有利であることを示しています。
Self-attention techniques, and specifically Transformers, are dominating the field of text processing and are becoming increasingly popular in computer vision classification tasks. In order to visualize the parts of the image that led to a certain classification, existing methods either rely on the obtained attention maps or employ heuristic propagation along the attention graph. In this work, we propose a novel way to compute relevancy for Transformer networks. The method assigns local relevance based on the Deep Taylor Decomposition principle and then propagates these relevancy scores through the layers. This propagation involves attention layers and skip connections, which challenge existing methods. Our solution is based on a specific formulation that is shown to maintain the total relevancy across layers. We benchmark our method on very recent visual Transformer networks, as well as on a text classification problem, and demonstrate a clear advantage over the existing explainability methods.
updated: Mon Apr 05 2021 11:19:28 GMT+0000 (UTC)
published: Thu Dec 17 2020 18:56:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト