これはそのように見える: 解釈可能な画像認識のための深層学習
This Looks Like That: Deep Learning for Interpretable Image Recognition
難しい画像分類の課題に直面したとき、我々はしばしば、画像を分解し、あるクラスまたは別のクラスの典型的な側面を指摘することで、自分たちの推論を説明する。それぞれのクラスの証拠が積み重なることで、最終的な判断ができるようになる。この研究では、同様の方法で推論を行う深層ネットワークアーキテクチャ、prototypical part network (ProtoPNet)を紹介する。このモデルは、鳥類学者や医師などが難解な画像分類タスクを解決する方法を人々に説明するのと質的に似た方法で推論する。このネットワークは、画像の部分的なアノテーションを行わずに、画像レベルのラベルのみを学習に使用する。CUB-200-2011データセットとStanford Carsデータセットで我々の手法を実証する。我々の実験では、ProtoPNetは類似した非-解釈可能な相手と同等の精度を達成できることが示されており、複数のProtoPNetをより大きなネットワークに組み合わせることで、最も性能の高い深層モデルと同等の精度を達成できることが示された。さらに、ProtoPNetは、他の解釈可能なディープモデルにはない解釈可能性のレベルを提供する。
When we are faced with challenging image classification tasks, we often explain our reasoning by dissecting the image, and pointing out prototypical aspects of one class or another. The mounting evidence for each of the classes helps us make our final decision. In this work, we introduce a deep network architecture -- prototypical part network (ProtoPNet), that reasons in a similar way: the network dissects the image by finding prototypical parts, and combines evidence from the prototypes to make a final classification. The model thus reasons in a way that is qualitatively similar to the way ornithologists, physicians, and others would explain to people on how to solve challenging image classification tasks. The network uses only image-level labels for training without any annotations for parts of images. We demonstrate our method on the CUB-200-2011 dataset and the Stanford Cars dataset. Our experiments show that ProtoPNet can achieve comparable accuracy with its analogous non-interpretable counterpart, and when several ProtoPNets are combined into a larger network, it can achieve an accuracy that is on par with some of the best-performing deep models. Moreover, ProtoPNet provides a level of interpretability that is absent in other interpretable deep models.
updated: Sat Dec 28 2019 20:12:11 GMT+0000 (UTC)
published: Wed Jun 27 2018 17:18:03 GMT+0000 (UTC)
