arXiv reaDer
クラス増分学習のための適応型集約ネットワーク
Adaptive Aggregation Networks for Class-Incremental Learning
クラス増分学習(CIL)は、クラスの数が段階的に増加する分類モデルを学習することを目的としています。 CILに固有の問題は、古いクラスと新しいクラスの学習の間の安定性と可塑性のジレンマです。つまり、高可塑性モデルは古いクラスを簡単に忘れますが、高安定性モデルは新しいクラスを学習するのに弱いです。この問題を軽減するために、Adaptive Aggregation Networks(AANets)と呼ばれる新しいネットワークアーキテクチャを提案します。このアーキテクチャでは、各残余レベルで2種類の残余ブロックを明示的に構築します(ResNetをベースラインアーキテクチャとします)。安定ブロックとプラスチックブロックです。これらの2つのブロックからの出力フィーチャマップを集約し、その結果を次のレベルのブロックにフィードします。これら2種類のブロックのバランスをとるために、つまり安定性と可塑性のバランスを動的にとるために、集計の重みを調整します。 3つのCILベンチマーク(CIFAR-100、ImageNet-Subset、およびImageNet)で広範な実験を実施し、多くの既存のCILメソッドをAANetsのアーキテクチャに直接組み込んでパフォーマンスを向上できることを示しています。
Class-Incremental Learning (CIL) aims to learn a classification model with the number of classes increasing phase-by-phase. An inherent problem in CIL is the stability-plasticity dilemma between the learning of old and new classes, i.e., high-plasticity models easily forget old classes, but high-stability models are weak to learn new classes. We alleviate this issue by proposing a novel network architecture called Adaptive Aggregation Networks (AANets), in which we explicitly build two types of residual blocks at each residual level (taking ResNet as the baseline architecture): a stable block and a plastic block. We aggregate the output feature maps from these two blocks and then feed the results to the next-level blocks. We adapt the aggregation weights in order to balance these two types of blocks, i.e., to balance stability and plasticity, dynamically. We conduct extensive experiments on three CIL benchmarks: CIFAR-100, ImageNet-Subset, and ImageNet, and show that many existing CIL methods can be straightforwardly incorporated into the architecture of AANets to boost their performances.
updated: Mon Mar 29 2021 22:09:07 GMT+0000 (UTC)
published: Sat Oct 10 2020 18:24:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト