このペーパーは、事前に訓練されたディープニューラルネットワーク間の知識の一貫性を分析することを目的としています。異なるファジネスレベルでのニューラルネットワーク間の知識の一貫性の一般的な定義を提案します。タスクに依存しない方法は、各ニューラルネットワークの生の中間層の特徴から、一貫した知識を表す特徴コンポーネントを解くように設計されています。汎用ツールとして、この方法はさまざまなアプリケーションに広く使用できます。予備実験では、ニューラルネットワークの表現を診断するツールとして知識の一貫性を使用しました。知識の一貫性は、知識の蒸留やネットワーク圧縮などの既存の深層学習手法の成功を説明する新しい洞察を提供します。さらに重要なことに、知識の一貫性を使用して、事前に訓練されたネットワークを改善し、パフォーマンスを向上させることもできます。
This paper aims to analyze knowledge consistency between pre-trained deep neural networks. We propose a generic definition for knowledge consistency between neural networks at different fuzziness levels. A task-agnostic method is designed to disentangle feature components, which represent the consistent knowledge, from raw intermediate-layer features of each neural network. As a generic tool, our method can be broadly used for different applications. In preliminary experiments, we have used knowledge consistency as a tool to diagnose representations of neural networks. Knowledge consistency provides new insights to explain the success of existing deep-learning techniques, such as knowledge distillation and network compression. More crucially, knowledge consistency can also be used to refine pre-trained networks and boost performance.