近年、ニューラルネットワークを説明するための特徴帰属法が豊富に開発されています。特にコンピュータビジョンの分野では、ピクセル属性を提供する顕著性マップを生成するための多くの方法が存在します。しかし、それらの説明はしばしば互いに矛盾しており、どの説明を信頼するかは明確ではありません。この問題の自然な解決策は、複数の説明を集約することです。モデルの決定に対する忠実度が個々の説明よりも高い新しい説明を生成することを目的として、さまざまなピクセルベースの集計スキームを提示して比較します。ベイズ最適化の分野の手法を使用して、個々の説明間の分散を集計プロセスに組み込みます。さらに、アンサンブルの集約に対する複数の正規化手法の影響を分析します。
In recent years, an abundance of feature attribution methods for explaining neural networks have been developed. Especially in the field of computer vision, many methods for generating saliency maps providing pixel attributions exist. However, their explanations often contradict each other and it is not clear which explanation to trust. A natural solution to this problem is the aggregation of multiple explanations. We present and compare different pixel-based aggregation schemes with the goal of generating a new explanation, whose fidelity to the model's decision is higher than each individual explanation. Using methods from the field of Bayesian Optimization, we incorporate the variance between the individual explanations into the aggregation process. Additionally, we analyze the effect of multiple normalization techniques on ensemble aggregation.