arXiv reaDer
模範ベースのクラス増分学習のためのバッチ正規化の再調整
Rebalancing Batch Normalization for Exemplar-based Class-Incremental Learning
バッチ正規化 (BN) とその変形は、さまざまなコンピューター ビジョン タスクのニューラル ネットワークについて広く研究されてきましたが、継続的な学習における BN の効果を研究することに専念した研究は比較的少ないものです。そのために、BN 用の新しい更新パッチを開発します。特に、模範ベースのクラス増分学習 (CIL) 用に調整されています。 CIL における BN の主な問題は、ミニバッチ内の現在のタスクと過去のタスクの間のトレーニング データの不均衡です。これにより、BN の経験的な平均と分散、および学習可能なアフィン変換パラメーターが現在のタスクに大きく偏っています。過去のタスクの忘却に。最近の BN バリアントの 1 つは、単一のエポックでトレーニングが行われる「オンライン」CIL 用に開発されましたが、モデルが次のようにトレーニングされる「オフライン」CIL では、それらの方法が必ずしも利益をもたらすとは限らないことを示します。不均衡なトレーニング データの複数のエポック。彼らの方法が効果的でない主な理由は、特に BN のアフィン変換パラメーターを学習するための勾配を計算する際に、データの不均衡の問題に完全に対処していないことにあります。したがって、Task-Balanced BN (TBBN) と呼ばれる新しいハイパーパラメーターのないバリアントは、トレーニング中に再形成と繰り返し操作の両方を使用して水平方向に連結されたタスク バランス バッチを作成することにより、不均衡の問題をより正確に解決するために提案されています。 CIFAR-100、ImageNet-100、および 5 つの異なるタスク データセットのクラス増分学習に関する実験に基づいて、推論時間でバニラ BN とまったく同じように機能する TBBN が、ほとんどの既存の模範に簡単に適用できることを示します。ベースのオフライン CIL アルゴリズムであり、一貫して他の BN バリアントよりも優れています。
Batch Normalization (BN) and its variants has been extensively studied for neural nets in various computer vision tasks, but relatively little work has been dedicated to studying the effect of BN in continual learning. To that end, we develop a new update patch for BN, particularly tailored for the exemplar-based class-incremental learning (CIL). The main issue of BN in CIL is the imbalance of training data between current and past tasks in a mini-batch, which makes the empirical mean and variance as well as the learnable affine transformation parameters of BN heavily biased toward the current task -- contributing to the forgetting of past tasks. While one of the recent BN variants has been developed for "online" CIL, in which the training is done with a single epoch, we show that their method does not necessarily bring gains for "offline" CIL, in which a model is trained with multiple epochs on the imbalanced training data. The main reason for the ineffectiveness of their method lies in not fully addressing the data imbalance issue, especially in computing the gradients for learning the affine transformation parameters of BN. Accordingly, our new hyperparameter-free variant, dubbed as Task-Balanced BN (TBBN), is proposed to more correctly resolve the imbalance issue by making a horizontally-concatenated task-balanced batch using both reshape and repeat operations during training. Based on our experiments on class incremental learning of CIFAR-100, ImageNet-100, and five dissimilar task datasets, we demonstrate that our TBBN, which works exactly the same as the vanilla BN in the inference time, is easily applicable to most existing exemplar-based offline CIL algorithms and consistently outperforms other BN variants.
updated: Tue Apr 18 2023 00:36:17 GMT+0000 (UTC)
published: Sat Jan 29 2022 11:03:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト