arXiv reaDer
より強力な分類器のためのミックスアップの力を明らかにする
Unveiling the Power of Mixup for Stronger Classifiers
ミックスアップベースのデータ拡張は、ディープニューラルネットワークの正規化装置として大きな成功を収めています。ただし、既存の方法は、意図的に手作りされた混合ポリシーに依存しており、混合サンプルとラベル間のセマンティックマッチングを無視またはオーバーセルします。初期の方法は、以前の仮定に基づいて、ランダム線形補間によって決定境界を滑らかにしようとしますが、他の方法は、オフラインの顕著性の最適化によってクラス関連の情報を最大化することに焦点を当てています。その結果、ラベルの不一致の問題は十分に対処されていません。さらに、混合トレーニングの最適化の安定性は、ラベルの不一致によって常に問題になります。これらの課題に対処するために、まず教師あり分類の混合を2つのサブタスク、混合サンプルの生成と分類として再定式化し、次に革新的な混合フレームワークである自動混合(AutoMix)を提案します。具体的には、クロスアテンションメカニズムを備えた学習可能な軽量ミックスブロック(MB)が、対応する混合ラベルの直接監視下でサンプルのペア間の公正な関係をモデル化することによって混合サンプルを生成するために提案されます。さらに、提案されたMomentum Pipeline(MP)は、トレーニングの安定性を高め、MixBlockをエンドツーエンドで完全にトレーニングすることに加えて収束を加速します。 5つの一般的な分類ベンチマークに関する広範な実験は、提案されたアプローチが一貫して主要な方法を大幅に上回っていることを示しています。
Mixup-based data augmentations have achieved great success as regularizers for deep neural networks. However, existing methods rely on deliberately handcrafted mixup policies, which ignore or oversell the semantic matching between mixed samples and labels. Driven by their prior assumptions, early methods attempt to smooth decision boundaries by random linear interpolation while others focus on maximizing class-related information via offline saliency optimization. As a result, the issue of label mismatch has not been well addressed. Additionally, the optimization stability of mixup training is constantly troubled by the label mismatch. To address these challenges, we first reformulate mixup for supervised classification as two sub-tasks, mixup sample generation and classification, then propose Automatic Mixup (AutoMix), a revolutionary mixup framework. Specifically, a learnable lightweight Mix Block (MB) with a cross-attention mechanism is proposed to generate a mixed sample by modeling a fair relationship between the pair of samples under direct supervision of the corresponding mixed label. Moreover, the proposed Momentum Pipeline (MP) enhances training stability and accelerates convergence on top of making the Mix Block fully trained end-to-end. Extensive experiments on five popular classification benchmarks show that the proposed approach consistently outperforms leading methods by a large margin.
updated: Tue Oct 12 2021 17:09:40 GMT+0000 (UTC)
published: Wed Mar 24 2021 07:21:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト