arXiv reaDer
CutMix: 局在化可能な特徴を持つ強力な分類器を訓練するための正則化戦略
CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features
畳み込みニューラルネットワーク分類器の性能を向上させるために、領域ドロップアウト戦略が提案されている。これは、物体の識別性の低い部分(例えば、人物の頭部ではなく脚など)にモデルを誘導するのに有効であり、それによってネットワークの一般化が進み、物体の定位能力が向上することが証明されている。一方、領域ドロップアウトのための現在の方法は、黒画素またはランダムノイズのいずれかのパッチを重ね合わせることによって、訓練画像上の有益な画素を除去している。このような除去は、学習中の情報損失や非効率を招くため、好ましくない。そこで、我々はCutMix拡張戦略を提案する。学習画像の間にパッチを切り貼りし、そのパッチの面積に比例して正解ラベルも混合する。CutMixは、トレーニングピクセルを効率的に利用し、領域ドロップアウトの正則化効果を維持することで、CIFARとImageNetの分類タスク、およびImageNetの弱教師付き定位タスクにおいて、一貫して最先端の拡張戦略を上回る性能を発揮する。さらに、これまでの増強手法とは異なり、CutMixで学習したImageNet分類器を事前学習モデルとして使用すると、Pascal検出とMS-COCO画像キャプションのベンチマークで一貫して性能が向上する。また、CutMixが入力破損に対するモデルのロバスト性と分布外検出性能を向上させることも示している。ソースコードと事前学習済みモデルは から入手可能。
Regional dropout strategies have been proposed to enhance the performance of convolutional neural network classifiers. They have proved to be effective for guiding the model to attend on less discriminative parts of objects (e.g. leg as opposed to head of a person), thereby letting the network generalize better and have better object localization capabilities. On the other hand, current methods for regional dropout remove informative pixels on training images by overlaying a patch of either black pixels or random noise. Such removal is not desirable because it leads to information loss and inefficiency during training. We therefore propose the CutMix augmentation strategy: patches are cut and pasted among training images where the ground truth labels are also mixed proportionally to the area of the patches. By making efficient use of training pixels and retaining the regularization effect of regional dropout, CutMix consistently outperforms the state-of-the-art augmentation strategies on CIFAR and ImageNet classification tasks, as well as on the ImageNet weakly-supervised localization task. Moreover, unlike previous augmentation methods, our CutMix-trained ImageNet classifier, when used as a pretrained model, results in consistent performance gains in Pascal detection and MS-COCO image captioning benchmarks. We also show that CutMix improves the model robustness against input corruptions and its out-of-distribution detection performances. Source code and pretrained models are available at .
updated: Wed Aug 07 2019 07:15:29 GMT+0000 (UTC)
published: Mon May 13 2019 08:10:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト