arXiv reaDer
文字認識のためのプーリング層のメタ学習
Meta-learning of Pooling Layers for Character Recognition
畳み込みニューラルネットワークベースの文字認識では、プーリングレイヤーが次元削減と変形補正に重要な役割を果たします。ただし、それらのカーネル形状とプーリング操作は経験的に事前に決定されています。通常、固定サイズの正方形のカーネル形状と最大プーリング操作が使用されます。この論文では、層をプールするためのメタ学習フレームワークを提案します。フレームワークの一部として、カーネル形状とプーリング操作が2つのパラメーターを使用してトレーニング可能であり、それによって入力データの柔軟なプーリングを可能にするパラメーター化されたプーリングレイヤーが提案されます。また、パラメータ化されたプーリング層のメタ学習アルゴリズムを提案します。これにより、複数のタスクにわたって適切なプーリング層を取得できます。実験では、提案されたメタ学習フレームワークを文字認識タスクに適用しました。結果は、文字認識タスク全体に適したプーリングレイヤーがメタ学習を介して取得され、取得されたプーリングレイヤーが、数ショットの文字認識タスクとノイズの多い画像認識タスクの両方でモデルのパフォーマンスを向上させたことを示しています。
In convolutional neural network-based character recognition, pooling layers play an important role in dimensionality reduction and deformation compensation. However, their kernel shapes and pooling operations are empirically predetermined; typically, a fixed-size square kernel shape and max pooling operation are used. In this paper, we propose a meta-learning framework for pooling layers. As part of our framework, a parameterized pooling layer is proposed in which the kernel shape and pooling operation are trainable using two parameters, thereby allowing flexible pooling of the input data. We also propose a meta-learning algorithm for the parameterized pooling layer, which allows us to acquire a suitable pooling layer across multiple tasks. In the experiment, we applied the proposed meta-learning framework to character recognition tasks. The results demonstrate that a pooling layer that is suitable across character recognition tasks was obtained via meta-learning, and the obtained pooling layer improved the performance of the model in both few-shot character recognition and noisy image recognition tasks.
updated: Mon Jul 12 2021 05:16:13 GMT+0000 (UTC)
published: Wed Mar 17 2021 09:25:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト