arXiv reaDer
KerCNNs: biologically inspired lateral connections for classification of corrupted images
  多くのコンピュータービジョンタスクの最先端は、Convolutional Neural Networks(CNN)で表されます。階層構造と局所特徴抽出は霊長類の視覚システムの構造に触発されていますが、そのようなアーキテクチャの横方向の接続の欠如は、分析と生物学的オブジェクト処理を区別します。幾何学的制約のない学習された再帰カーネルの形で、CNNを畳み込み型の繰り返し横方向の接続で強化するというアイデアが近年実用化されました。現在の作業では、CNNのフィードフォワードフィルター間の相関の概念をエンコードする生物学的にもっともらしいラテラルカーネルを紹介します。各層で、関連するカーネルは活性化空間の遷移カーネルとして機能します。ラテラルカーネルはフィルターに関して定義されるため、フィードフォワード構造に基づいて水平接続のジオメトリを評価するためのパラメーターなしのアプローチを提供します。次に、KerCNNと呼ばれるこの新しいアーキテクチャを、グローバルな形状解析とパターン補完に関連する一般化タスクでテストします。基本的な画像分類を実行するためのトレーニングが完了すると、破損したテスト画像でネットワークが評価されます。調べられた画像の摂動は、ローカルフィーチャを介して画像の認識を損なうように設計されているため、コンテキスト情報の統合が必要です。 KerCNNはCNNよりもはるかに安定しており、このような劣化に対してCNNを繰り返し使用するため、困難な条件下でのオブジェクト認識を強化するこの生物学的に着想を得たアプローチが検証されます。
The state of the art in many computer vision tasks is represented by Convolutional Neural Networks (CNNs). Although their hierarchical organization and local feature extraction are inspired by the structure of primate visual systems, the lack of lateral connections in such architectures critically distinguishes their analysis from biological object processing. The idea of enriching CNNs with recurrent lateral connections of convolutional type has been put into practice in recent years, in the form of learned recurrent kernels with no geometrical constraints. In the present work, we introduce biologically plausible lateral kernels encoding a notion of correlation between the feedforward filters of a CNN: at each layer, the associated kernel acts as a transition kernel on the space of activations. The lateral kernels are defined in terms of the filters, thus providing a parameter-free approach to assess the geometry of horizontal connections based on the feedforward structure. We then test this new architecture, which we call KerCNN, on a generalization task related to global shape analysis and pattern completion: once trained for performing basic image classification, the network is evaluated on corrupted testing images. The image perturbations examined are designed to undermine the recognition of the images via local features, thus requiring an integration of context information - which in biological vision is critically linked to lateral connectivity. Our KerCNNs turn out to be far more stable than CNNs and recurrent CNNs to such degradations, thus validating this biologically inspired approach to reinforce object recognition under challenging conditions.
updated: Fri Oct 18 2019 10:31:06 GMT+0000 (UTC)
published: Fri Oct 18 2019 10:31:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト