arXiv reaDer
機能の弱体化: 分類のための隣接データ拡張
Feature Weaken: Vicinal Data Augmentation for Classification
ディープ ラーニングは通常、大規模なデータ サンプルのトレーニングに依存してパフォーマンスを向上させます。ただし、トレーニング データに基づくオーバー フィッティングは常に問題となります。学者は、一般化を継続的に改善するために、機能の削除や機能の混合などのさまざまな戦略を提案しています。同じ目的のために、データ拡張方法と見なすことができる新しいトレーニング方法、Feature Weaken を破壊的に提案します。 Feature Weaken は、元のサンプルの特徴を弱めることにより、モデル トレーニング用に同じコサイン類似度を持つ近傍データ分布を構築します。特に、Feature Weaken は、サンプルの空間分布を変更し、サンプル境界を調整し、逆伝播の勾配最適化値を減らします。この作業は、モデルの分類パフォーマンスと一般化を改善するだけでなく、モデルのトレーニングを安定させ、モデルの収束を加速することもできます。 5 つの一般的な画像分類データセットを使用した古典的な深層畳み込みニューラル モデルと、4 つの一般的なテキスト分類データセットを使用した Bert モデルで広範な実験を行います。従来のモデルや、Dropout、Mixup、Cutout、CutMix などの一般化の改善方法と比較して、Feature Weaken は優れた互換性とパフォーマンスを示します。また、敵対的サンプルを使用してロバスト性実験を実行しました。結果は、Feature Weaken がモデルのロバスト性を改善するのに効果的であることを示しています。
Deep learning usually relies on training large-scale data samples to achieve better performance. However, over-fitting based on training data always remains a problem. Scholars have proposed various strategies, such as feature dropping and feature mixing, to improve the generalization continuously. For the same purpose, we subversively propose a novel training method, Feature Weaken, which can be regarded as a data augmentation method. Feature Weaken constructs the vicinal data distribution with the same cosine similarity for model training by weakening features of the original samples. In especially, Feature Weaken changes the spatial distribution of samples, adjusts sample boundaries, and reduces the gradient optimization value of back-propagation. This work can not only improve the classification performance and generalization of the model, but also stabilize the model training and accelerate the model convergence. We conduct extensive experiments on classical deep convolution neural models with five common image classification datasets and the Bert model with four common text classification datasets. Compared with the classical models or the generalization improvement methods, such as Dropout, Mixup, Cutout, and CutMix, Feature Weaken shows good compatibility and performance. We also use adversarial samples to perform the robustness experiments, and the results show that Feature Weaken is effective in improving the robustness of the model.
updated: Sun Nov 20 2022 11:00:23 GMT+0000 (UTC)
published: Sun Nov 20 2022 11:00:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト