arXiv reaDer
変分オートエンコーダーの視覚的説明に向けて
Towards Visually Explaining Variational Autoencoders
 畳み込みニューラルネットワーク(CNN)モデルの解釈可能性における最近の進歩により、モデル予測の視覚化と理解において目覚しい進歩がもたらされました。特に、勾配ベースの視覚的注意方法は、視覚的説明のための手段として視覚的注意マップを使用する最近の努力を推進しています。ただし、重要な問題は、これらの方法が分類および分類タスク、および生成モデルの説明への拡張などのために設計されていることです。変分オートエンコーダー(VAE)は簡単ではありません。この作業では、この重要なギャップを埋めるための一歩を踏み出し、勾配ベースの注意によってVAEを視覚的に説明する最初の手法を提案します。学習した潜在空間から視覚的注意を生成する方法を提示し、そのような注意の説明がVAE予測を説明する以上の役割を果たすことを示します。これらのアテンションマップを使用して画像の異常を特定し、MVTec-ADデータセットの最新のパフォーマンスを実証する方法を示します。また、Dspritesデータセットで示されているように、それらをモデルトレーニングに注入して、VAEを改善して潜在空間のもつれを改善する学習に役立てることができます。
Recent advances in Convolutional Neural Network (CNN) model interpretability have led to impressive progress in visualizing and understanding model predictions. In particular, gradient-based visual attention methods have driven much recent effort in using visual attention maps as a means for visual explanations. A key problem, however, is these methods are designed for classification and categorization tasks, and their extension to explaining generative models, e.g. variational autoencoders (VAE) is not trivial. In this work, we take a step towards bridging this crucial gap, proposing the first technique to visually explain VAEs by means of gradient-based attention. We present methods to generate visual attention from the learned latent space, and also demonstrate such attention explanations serve more than just explaining VAE predictions. We show how these attention maps can be used to localize anomalies in images, demonstrating state-of-the-art performance on the MVTec-AD dataset. We also show how they can be infused into model training, helping bootstrap the VAE into learning improved latent space disentanglement, demonstrated on the Dsprites dataset.
updated: Tue Apr 14 2020 16:52:49 GMT+0000 (UTC)
published: Mon Nov 18 2019 01:05:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト