arXiv reaDer
解釈可能なニューラルネットワークの分離
Interpretable Neural Network Decoupling
たたみ込みニューラルネットワーク(CNN)の驚くべきパフォーマンスは、解釈不可能な膨大な数のパラメーターと絡み合っており、それがボトルネックとなって、その潜在能力を最大限に活用することを制限しています。ネットワークの解釈に向けて、これまでの取り組みは主に単一フィルター分析に頼っていましたが、フィルター間の関係は無視されていました。この論文では、計算経路の調査という観点からネットワークを解釈するための新しいアーキテクチャ分離手法を提案します。具体的には、ネットワークアーキテクチャをベクトルでエンコードするために、各層に新しいアーキテクチャ制御モジュールを導入します。ベクトルと入力画像の間の相互情報を最大化することにより、モジュールは特定のフィルターを選択して各入力に固有の計算パスを抽出するようにトレーニングされます。さらに、分離されたネットワークの解釈可能性とコンパクトさを改善するために、各層の出力は、スパース正則化の制約とアーキテクチャエンコーディングベクトルを合わせるためにエンコードされます。従来のピクセルレベルまたはフィルターレベルのネットワーク解釈方法とは異なり、パスレベル分析を提案して、フィルターとセマンティックの概念の組み合わせの関係を調査します。これは、分離されたネットワークの動作原理を解釈するのにより適しています。広範な実験は、分離されたネットワークがいくつかのアプリケーション、つまりネットワークの解釈、ネットワークの加速、および敵対的なサンプルの検出を実現することを示しています。
The remarkable performance of convolutional neural networks (CNNs) is entangled with their huge number of uninterpretable parameters, which has become the bottleneck limiting the exploitation of their full potential. Towards network interpretation, previous endeavors mainly resort to the single filter analysis, which however ignores the relationship between filters. In this paper, we propose a novel architecture decoupling method to interpret the network from a perspective of investigating its calculation paths. More specifically, we introduce a novel architecture controlling module in each layer to encode the network architecture by a vector. By maximizing the mutual information between the vectors and input images, the module is trained to select specific filters to distill a unique calculation path for each input. Furthermore, to improve the interpretability and compactness of the decoupled network, the output of each layer is encoded to align the architecture encoding vector with the constraint of sparsity regularization. Unlike conventional pixel-level or filter-level network interpretation methods, we propose a path-level analysis to explore the relationship between the combination of filter and semantic concepts, which is more suitable to interpret the working rationale of the decoupled network. Extensive experiments show that the decoupled network achieves several applications, i.e., network interpretation, network acceleration, and adversarial samples detection.
updated: Tue Aug 25 2020 13:22:34 GMT+0000 (UTC)
published: Tue Jun 04 2019 02:40:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト