arXiv reaDer
テスト時のバッチ正規化
Test-time Batch Normalization
ディープニューラルネットワークは、トレーニングとテストの間でデータ分布のシフトに悩まされることが多く、バッチ統計はシフトを反映していることが観察されます。この論文では、テスト時間の分布シフトを緩和することを目的として、トレーニングプロセスのバッチ正規化(BN)を再検討し、テスト時間の最適化に役立つ2つの重要な洞察を明らかにします。 ii)堅牢な最適化と推論のためにデータセットレベルの統計を使用する。 2つの洞察に基づいて、エントロピー損失を最小限に抑えることでテスト中に最適化される、新しいテスト時のBNレイヤー設計であるGpreBNを提案します。分散シフトを伴う2つの一般的な設定、つまりドメインの一般化と堅牢性のタスクで、この方法の有効性を検証します。当社のGpreBNは、テスト時間のパフォーマンスを大幅に向上させ、最先端の結果を実現します。
Deep neural networks often suffer the data distribution shift between training and testing, and the batch statistics are observed to reflect the shift. In this paper, targeting of alleviating distribution shift in test time, we revisit the batch normalization (BN) in the training process and reveals two key insights benefiting test-time optimization: (i) preserving the same gradient backpropagation form as training, and (ii) using dataset-level statistics for robust optimization and inference. Based on the two insights, we propose a novel test-time BN layer design, GpreBN, which is optimized during testing by minimizing Entropy loss. We verify the effectiveness of our method on two typical settings with distribution shift, i.e., domain generalization and robustness tasks. Our GpreBN significantly improves the test-time performance and achieves the state of the art results.
updated: Fri May 20 2022 14:33:39 GMT+0000 (UTC)
published: Fri May 20 2022 14:33:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト