arXiv reaDer
ブラックボックスモデルでの画像分類のための望ましくないピクセルの解釈
Interpreting Undesirable Pixels for Image Classification on Black-Box Models
 ブラックボックスモデルを解釈するために、説明方法を開発するための研究が近年進められています。ほとんどの研究では、分類器の予測に不可欠な入力ピクセルを特定しようとしました。このアプローチは、ブラックボックスモデルの特性を分析するのに意味がありますが、予測を妨げるピクセルを調査することも重要です。この問題に対処するために、本論文では、望ましくない領域を視覚化して、画像をターゲットクラスとして分類する説明方法を提案します。具体的には、望ましくない領域の概念を2つの用語に分割します。(1)ブラックボックスモデルがターゲットクラスの固有の特性を特定することを妨げるターゲットクラスの要因、および(2)非ターゲットクラスの要因他のクラスとして分類される画像の重要な領域。このような望ましくない領域をヒートマップ上で視覚化して、提案された方法を定性的に検証します。さらに、ImageNetで定量的な結果を提供するための評価指標を提示します。
In an effort to interpret black-box models, researches for developing explanation methods have proceeded in recent years. Most studies have tried to identify input pixels that are crucial to the prediction of a classifier. While this approach is meaningful to analyse the characteristic of blackbox models, it is also important to investigate pixels that interfere with the prediction. To tackle this issue, in this paper, we propose an explanation method that visualizes undesirable regions to classify an image as a target class. To be specific, we divide the concept of undesirable regions into two terms: (1) factors for a target class, which hinder that black-box models identify intrinsic characteristics of a target class and (2) factors for non-target classes that are important regions for an image to be classified as other classes. We visualize such undesirable regions on heatmaps to qualitatively validate the proposed method. Furthermore, we present an evaluation metric to provide quantitative results on ImageNet.
updated: Mon Dec 16 2019 11:04:15 GMT+0000 (UTC)
published: Fri Sep 27 2019 00:25:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト