説明可能なAIは、信頼性や透明性に対する需要が高いドメインでのブラックボックス機械学習アプローチの重要なコンポーネントであることが明らかになっています。例としては、医療アシスタントシステムや、透明性を基盤とする欧州連合の一般データ保護規則に関連するアプリケーションがあります。このような要求には、分類子の決定の背後にある理論的根拠を監査する機能が必要です。視覚化は説明の事実上の標準ですが、多くの点で表現力の点で不足しています。視覚的特徴のさまざまな属性の兆候(たとえば、目を開いているか閉じているか)を区別できず、 、および機能間の関係。別の方法は、より表現力豊かなシンボリックサロゲートモデルです。ただし、これらにはシンボリック入力が必要であり、ほとんどのコンピュータービジョンタスクではすぐに利用できません。このホワイトペーパーでは、これを克服する方法を調査します。ネットワークによって学習された固有の機能を使用して、フィードフォワード畳み込みディープニューラルネットワーク(DNN)の理論的根拠のグローバルで表現力豊かな口頭の説明を構築します。機能のセマンティクスは、人間が理解できる一連の視覚的概念でトレーニングされた概念分析アプローチによってマイニングされます。説明は、帰納論理プログラミング(ILP)メソッドによって検出され、1次ルールとして提示されます。私たちの説明が元のブラックボックスモデルに忠実であることを示します。実験のコードはhttps://github.com/mc-lovin-mlem/concept-embeddings-and-ilp/tree/ki2020で入手できます。
Explainable AI has emerged to be a key component for black-box machine learning approaches in domains with a high demand for reliability or transparency. Examples are medical assistant systems, and applications concerned with the General Data Protection Regulation of the European Union, which features transparency as a cornerstone. Such demands require the ability to audit the rationale behind a classifier's decision. While visualizations are the de facto standard of explanations, they come short in terms of expressiveness in many ways: They cannot distinguish between different attribute manifestations of visual features (e.g. eye open vs. closed), and they cannot accurately describe the influence of absence of, and relations between features. An alternative would be more expressive symbolic surrogate models. However, these require symbolic inputs, which are not readily available in most computer vision tasks. In this paper we investigate how to overcome this: We use inherent features learned by the network to build a global, expressive, verbal explanation of the rationale of a feed-forward convolutional deep neural network (DNN). The semantics of the features are mined by a concept analysis approach trained on a set of human understandable visual concepts. The explanation is found by an Inductive Logic Programming (ILP) method and presented as first-order rules. We show that our explanation is faithful to the original black-box model. The code for our experiments is available at https://github.com/mc-lovin-mlem/concept-embeddings-and-ilp/tree/ki2020.