畳み込みニューラルネットワーク(CNN)の問題は、適切な堅牢性を取得するために大規模なデータセットが必要になることです。小さなデータセットでは、過剰適合する傾向があります。 CNNのこの欠点を克服するために、多くの方法が提案されています。追加のサンプルを簡単に収集できない場合、一般的なアプローチは、拡張手法を使用して既存のデータからより多くのデータポイントを生成することです。画像分類では、多くの拡張アプローチが単純な画像操作アルゴリズムを利用します。この作業では、14の拡張アプローチを組み合わせて生成された画像を追加することにより、データレベルでアンサンブルを構築します。そのうちの3つは、ここで初めて提案されます。これらの新しい方法は、フーリエ変換(FT)、ラドン変換(RT)、および離散コサイン変換(DCT)に基づいています。事前トレーニングされたResNet50ネットワークは、各拡張方法から派生した画像を含むトレーニングセットで微調整されます。これらのネットワークといくつかの融合は、11のベンチマークにわたって評価および比較されます。結果は、さまざまなデータ拡張方法を組み合わせてデータレベルでアンサンブルを構築すると、最先端の方法と競合するだけでなく、文献で報告されている最良のアプローチを超えることが多い分類器が生成されることを示しています。
A problem with Convolutional Neural Networks (CNNs) is that they require large datasets to obtain adequate robustness; on small datasets, they are prone to overfitting. Many methods have been proposed to overcome this shortcoming with CNNs. In cases where additional samples cannot easily be collected, a common approach is to generate more data points from existing data using an augmentation technique. In image classification, many augmentation approaches utilize simple image manipulation algorithms. In this work, we build ensembles on the data level by adding images generated by combining fourteen augmentation approaches, three of which are proposed here for the first time. These novel methods are based on the Fourier Transform (FT), the Radon Transform (RT) and the Discrete Cosine Transform (DCT). Pretrained ResNet50 networks are finetuned on training sets that include images derived from each augmentation method. These networks and several fusions are evaluated and compared across eleven benchmarks. Results show that building ensembles on the data level by combining different data augmentation methods produce classifiers that not only compete competitively against the state-of-the-art but often surpass the best approaches reported in the literature.