Self-Denoising Neural Networks for Few Shot Learning
この論文では、少数のショット学習のための新しいアーキテクチャを紹介します。これは、わずか1つまたは5つのラベル付きの例からニューラルネットワークを教えるタスクです。ノイズ除去オートエンコーダが真のデータ多様体に近づくように機能を改良するというAlaineet alの理論的結果に触発されて、既存のニューラルアーキテクチャの複数の段階でノイズを追加すると同時に、この追加されたノイズに対してロバストであることを学習する新しいトレーニングスキームを提示します。自己ノイズ除去ニューラルネットワーク(SDNN)と呼ばれるこのアーキテクチャは、最新の畳み込みニューラルアーキテクチャのほとんどに簡単に適用でき、既存の多くの数ショット学習手法の補足として使用できます。 SDNNは、miniImageNet、tiered-ImageNet、およびCIFAR-FSの少数のショット学習データセットでWide-ResNetアーキテクチャを使用して、少数のショット画像認識の以前の最先端の方法よりも優れていることを経験的に示しています。また、SDNNアーキテクチャの構築を経験的に正当化するために、一連のアブレーション実験を実行します。最後に、SDNNは、ActEV SDLサプライズアクティビティチャレンジの実験を使用して、ビデオでの人間の行動の検出のタスクでいくつかのショットのパフォーマンスを改善することさえ示しています。
In this paper, we introduce a new architecture for few shot learning, the task of teaching a neural network from as few as one or five labeled examples. Inspired by the theoretical results of Alaine et al that Denoising Autoencoders refine features to lie closer to the true data manifold, we present a new training scheme that adds noise at multiple stages of an existing neural architecture while simultaneously learning to be robust to this added noise. This architecture, which we call a Self-Denoising Neural Network (SDNN), can be applied easily to most modern convolutional neural architectures, and can be used as a supplement to many existing few-shot learning techniques. We empirically show that SDNNs out-perform previous state-of-the-art methods for few shot image recognition using the Wide-ResNet architecture on the miniImageNet, tiered-ImageNet, and CIFAR-FS few shot learning datasets. We also perform a series of ablation experiments to empirically justify the construction of the SDNN architecture. Finally, we show that SDNNs even improve few shot performance on the task of human action detection in video using experiments on the ActEV SDL Surprise Activities challenge.
