arXiv reaDer
視覚探索のためのモデルにとらわれない説明可能性
Model-Agnostic Explainability for Visual Search
2つの画像が似ている理由は何ですか?画像の類似性、検索、検索のためのモデルにとらわれない説明を生成するための新しいアプローチを提案します。特に、クラスアクティベーションマップ(CAM)、加法シャープレイ説明(SHAP)、およびローカルで解釈可能なモデルにとらわれない説明(LIME)を、画像検索と検索のドメインに拡張します。これらのアプローチは、ブラックボックスとグレーボックスのモデルの内省を可能にし、エラーを診断し、モデルの類似性判断の背後にある理論的根拠を理解するのに役立ちます。さらに、これらのアプローチを拡張して、クエリと取得された画像ピクセル間の完全なペアワイズ対応を抽出します。これを「共同解釈」と呼びます。正式には、共同検索の解釈がハーサニの配当の予測から生じること、およびこのアプローチがシャープレイ値とシャープレイ-テイラー指数を一般化することを示します。 Shapley-Taylorインデックスを推定するための高速カーネルベースの方法を紹介し、これらのゲーム理論的測定が画像類似性アーキテクチャのより一貫した説明をもたらすことを経験的に示します。
What makes two images similar? We propose new approaches to generate model-agnostic explanations for image similarity, search, and retrieval. In particular, we extend Class Activation Maps (CAMs), Additive Shapley Explanations (SHAP), and Locally Interpretable Model-Agnostic Explanations (LIME) to the domain of image retrieval and search. These approaches enable black and grey-box model introspection and can help diagnose errors and understand the rationale behind a model's similarity judgments. Furthermore, we extend these approaches to extract a full pairwise correspondence between the query and retrieved image pixels, an approach we call "joint interpretations". Formally, we show joint search interpretations arise from projecting Harsanyi dividends, and that this approach generalizes Shapley Values and The Shapley-Taylor indices. We introduce a fast kernel-based method for estimating Shapley-Taylor indices and empirically show that these game-theoretic measures yield more consistent explanations for image similarity architectures.
updated: Sun Feb 28 2021 01:24:15 GMT+0000 (UTC)
published: Sun Feb 28 2021 01:24:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト