表現力の高いディープニューラルネットワーク(DNN)は、多くのタスクで最先端のパフォーマンスを実現しています。ただし、それらの分散機能表現は意味的に解釈するのが困難です。この作業では、人間が解釈可能なセマンティックの概念が特徴空間のベクトルに関連付けられています。関連付けプロセスは、最適化問題として数学的に定式化されます。最適なソリューションから得られたセマンティックベクトルは、ディープニューラルネットワークをグローバルおよびローカルに解釈するために適用されます。グローバルな解釈は、DNNが学習した知識を理解するのに役立ちます。ローカルな行動の解釈は、DNNが下した個々の決定をよりよく理解するのに役立ちます。実証実験は、特定されたセマンティクスを使用して既存のDNNを解釈する方法を示しています。
Deep neural networks (DNNs) with high expressiveness have achieved state-of-the-art performance in many tasks. However, their distributed feature representations are difficult to interpret semantically. In this work, human-interpretable semantic concepts are associated with vectors in feature space. The association process is mathematically formulated as an optimization problem. The semantic vectors obtained from the optimal solution are applied to interpret deep neural networks globally and locally. The global interpretations are useful to understand the knowledge learned by DNNs. The interpretation of local behaviors can help to understand individual decisions made by DNNs better. The empirical experiments demonstrate how to use identified semantics to interpret the existing DNNs.