画像上の効果的な深層畳み込みニューラルネットワーク(CNN)の背後にある決定ロジックを解釈することは、深層学習モデルの成功を補完します。ただし、既存の方法では、個々の画像または少数の画像に関する特定の決定ロジックしか解釈できません。人間の理解と一般化能力を促進するには、類似した画像の大規模なグループでCNNの共通の意思決定ロジックを解釈する代表的な解釈を開発することが重要です。これにより、共通のセマンティクスデータが多くの密接に関連する予測に寄与することが明らかになります。この論文では、多数の類似画像の非常に代表的な解釈を生成するための新しい教師なしアプローチを開発します。代表的な解釈を共クラスタリング問題として見つける問題を定式化し、CNNの線形決定境界のサンプルに基づいて劣モジュラコスト劣モジュラカバー問題に変換します。また、視覚化と類似性のランク付け方法についても説明します。私たちの広範な実験は、私たちの方法の優れた性能を示しています。
Interpreting the decision logic behind effective deep convolutional neural networks (CNN) on images complements the success of deep learning models. However, the existing methods can only interpret some specific decision logic on individual or a small number of images. To facilitate human understandability and generalization ability, it is important to develop representative interpretations that interpret common decision logics of a CNN on a large group of similar images, which reveal the common semantics data contributes to many closely related predictions. In this paper, we develop a novel unsupervised approach to produce a highly representative interpretation for a large number of similar images. We formulate the problem of finding representative interpretations as a co-clustering problem, and convert it into a submodular cost submodular cover problem based on a sample of the linear decision boundaries of a CNN. We also present a visualization and similarity ranking method. Our extensive experiments demonstrate the excellent performance of our method.