arXiv reaDer
ディープニューラルネットワークにおける集約層の分布を理解する
Understanding the Distributions of Aggregation Layers in Deep Neural Networks
集約のプロセスは、ほとんどすべてのディープネットモデルに遍在しています。これは、深い特徴をよりコンパクトな表現に統合するための重要なメカニズムとして機能すると同時に、過剰適合に対するロバスト性を高め、深いネットに空間的不変性を提供します。特に、グローバルアグリゲーションレイヤーがDNNの出力レイヤーに近接しているということは、アグリゲートされた機能がディープネットのパフォーマンスに直接影響を与えることを意味します。この関係のより良い理解は、情報理論的方法を使用して得ることができます。ただし、これには、集約レイヤーのアクティブ化の分布に関する知識が必要です。これを達成するために、我々は、深い特徴の集約に関与する層の出力値の確率分布を分析的にモデル化するための新しい数学的定式化を提案します。重要な結果は、DNN内の出力ノードのKL発散を分析的に予測する能力です。また、さまざまな分類タスクとデータセットにわたる経験的観測に対して、理論的予測を実験的に検証します。
The process of aggregation is ubiquitous in almost all deep nets models. It functions as an important mechanism for consolidating deep features into a more compact representation, whilst increasing robustness to overfitting and providing spatial invariance in deep nets. In particular, the proximity of global aggregation layers to the output layers of DNNs mean that aggregated features have a direct influence on the performance of a deep net. A better understanding of this relationship can be obtained using information theoretic methods. However, this requires the knowledge of the distributions of the activations of aggregation layers. To achieve this, we propose a novel mathematical formulation for analytically modelling the probability distributions of output values of layers involved with deep feature aggregation. An important outcome is our ability to analytically predict the KL-divergence of output nodes in a DNN. We also experimentally verify our theoretical predictions against empirical observations across a range of different classification tasks and datasets.
updated: Fri Jul 09 2021 14:23:57 GMT+0000 (UTC)
published: Fri Jul 09 2021 14:23:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト