バッチ正規化(BN)は、さまざまなコンピュータービジョンタスクでニューラルネットワークモデルをトレーニングするために不可欠なレイヤーです。これは、ほとんど議論のない継続的な学習シナリオで広く使用されていますが、特に模範的な記憶ベースのクラス増分学習(CIL)には、BNを慎重に適用する必要があることがわかります。最初に、BN層の正規化で得られた経験的平均と分散が、現在のタスクに大きく偏っていることを分析します。トレーニングフェーズとテストフェーズでの重大な問題に取り組むために、タスクバランスバッチ正規化(TBBN)を提案します。現在のタスクと以前のタスクの間で不均衡な各ミニバッチが与えられると、TBBNは最初にバッチを再形成して繰り返し、ほぼタスクバランスのとれた平均と分散を計算します。次に、BNのアフィン変換パラメーターが再形成された特徴マップから学習されると、現在のタスクに対するバイアスが少なくなることを示します。 CIFAR-100およびImageNet-100データセットを使用した広範なCIL実験に基づいて、TBBNが既存のエグザンプラベースのCILアルゴリズムのほとんどに簡単に適用でき、前のタスクの忘却を減らすことでパフォーマンスを向上させることを示します。
Batch Normalization (BN) is an essential layer for training neural network models in various computer vision tasks. It has been widely used in continual learning scenarios with little discussion, but we find that BN should be carefully applied, particularly for the exemplar memory based class incremental learning (CIL). We first analyze that the empirical mean and variance obtained for normalization in a BN layer become highly biased toward the current task. To tackle its significant problems in training and test phases, we propose Task-Balanced Batch Normalization (TBBN). Given each mini-batch imbalanced between the current and previous tasks, TBBN first reshapes and repeats the batch, calculating near task-balanced mean and variance. Second, we show that when the affine transformation parameters of BN are learned from a reshaped feature map, they become less-biased toward the current task. Based on our extensive CIL experiments with CIFAR-100 and ImageNet-100 datasets, we demonstrate that our TBBN is easily applicable to most of existing exemplar-based CIL algorithms, improving their performance by decreasing the forgetting on the previous tasks.