ディープ畳み込みニューラルネットワーク(CNN)は、最先端の汎用エンドツーエンド画像分類システムであると広く考えられています。ただし、トレーニングデータが限られている場合はパフォーマンスが低下することが知られているため、データ拡張戦略が必要であり、この方法では計算コストが高くなり、常に効果的であるとは限りません。機械学習で通常行われるようにデータ拡張戦略を使用して不変性をエンコードするのではなく、ここでは、ラドン累積分布変換(R-CDT)の特定の数学的特性を利用して、スライスされたワッサースタイン空間で最も近い部分空間分類モデルを数学的に拡張することを提案します。最近導入された画像変換。特定のタイプの学習問題について、私たちの数学的ソリューションは、分類の精度と計算の複雑さの点で、深いCNNによるデータ拡張よりも優れており、限られたトレーニングデータ設定の下で特に効果的であることを示します。この方法は、単純で、効果的で、計算効率が高く、反復性がなく、パラメーターを調整する必要がありません。このメソッドを実装するPythonコードは、https://github.com/rohdelab/mathematical_augmentationで入手できます。私たちのメソッドは、https://github.com/rohdelab/PyTransKitで入手できるソフトウェアパッケージPyTransKitの一部として統合されています。
Deep convolutional neural networks (CNNs) are broadly considered to be state-of-the-art generic end-to-end image classification systems. However, they are known to underperform when training data are limited and thus require data augmentation strategies that render the method computationally expensive and not always effective. Rather than using a data augmentation strategy to encode invariances as typically done in machine learning, here we propose to mathematically augment a nearest subspace classification model in sliced-Wasserstein space by exploiting certain mathematical properties of the Radon Cumulative Distribution Transform (R-CDT), a recently introduced image transform. We demonstrate that for a particular type of learning problem, our mathematical solution has advantages over data augmentation with deep CNNs in terms of classification accuracy and computational complexity, and is particularly effective under a limited training data setting. The method is simple, effective, computationally efficient, non-iterative, and requires no parameters to be tuned. Python code implementing our method is available at https://github.com/rohdelab/mathematical_augmentation. Our method is integrated as a part of the software package PyTransKit, which is available at https://github.com/rohdelab/PyTransKit.