arXiv reaDer
目に見える以上のグローバルプーリング:位置情報はCNNでチャネルごとにエンコードされます
Global Pooling, More than Meets the Eye: Position Information is Encoded Channel-Wise in CNNs
この論文では、畳み込みニューラルネットワーク(CNN)の3D(空間チャネル)テンソルの空間次元をグローバルプーリングを介してベクトルに折りたたむと、すべての空間情報が削除されるという一般的な仮定に異議を唱えます。具体的には、位置情報がチャネル次元の順序に基づいてエンコードされているのに対し、セマンティック情報はほとんどエンコードされていないことを示します。このデモンストレーションに続いて、これらの調査結果を2つのアプリケーションに適用することにより、これらの調査結果が実際に与える影響を示します。まず、CNNの出力の並進不変性を改善する、シンプルでありながら効果的なデータ拡張戦略と損失関数を提案します。第二に、潜在的表現のどのチャネルが(i)全体的な位置情報のエンコードまたは(ii)領域固有の位置の原因であるかを効率的に決定する方法を提案します。最初に、セマンティックセグメンテーションが予測を行うために全体的な位置チャネルに大きく依存していることを示します。次に、「地域固有の」攻撃を実行し、入力の特定の部分でネットワークのパフォーマンスを低下させる可能性があることを初めて示します。私たちの発見と実証されたアプリケーションは、CNNの特性の理解に関係する研究分野に役立つと信じています。
In this paper, we challenge the common assumption that collapsing the spatial dimensions of a 3D (spatial-channel) tensor in a convolutional neural network (CNN) into a vector via global pooling removes all spatial information. Specifically, we demonstrate that positional information is encoded based on the ordering of the channel dimensions, while semantic information is largely not. Following this demonstration, we show the real world impact of these findings by applying them to two applications. First, we propose a simple yet effective data augmentation strategy and loss function which improves the translation invariance of a CNN's output. Second, we propose a method to efficiently determine which channels in the latent representation are responsible for (i) encoding overall position information or (ii) region-specific positions. We first show that semantic segmentation has a significant reliance on the overall position channels to make predictions. We then show for the first time that it is possible to perform a `region-specific' attack, and degrade a network's performance in a particular part of the input. We believe our findings and demonstrated applications will benefit research areas concerned with understanding the characteristics of CNNs.
updated: Tue Aug 17 2021 21:27:30 GMT+0000 (UTC)
published: Tue Aug 17 2021 21:27:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト