分類のための深層表現学習の特性を分析するための簡単なモデルを提供する、スパース散乱深層畳み込みニューラルネットワークを導入します。分類器を使用して単一の辞書行列を学習すると、ImageNet 2012データセットでAlexNetよりも高い分類精度が得られます。ネットワークは、最初に、平行移動や小さな変形などの幾何学的変換による変動を線形化する散乱変換を適用します。スパースℓ^ 1辞書コーディングは、クラス内のばらつきを低減し、線形空間の和集合上の射影によるクラス分離を維持します。これは、指数収束を備えたホモトピーアルゴリズムを使用して、深い畳み込みネットワークに実装されます。収束証明は、アリスタを含む一般的なフレームワークで提供されます。分類結果はImageNetで分析されます。
We introduce a sparse scattering deep convolutional neural network, which provides a simple model to analyze properties of deep representation learning for classification. Learning a single dictionary matrix with a classifier yields a higher classification accuracy than AlexNet over the ImageNet 2012 dataset. The network first applies a scattering transform that linearizes variabilities due to geometric transformations such as translations and small deformations. A sparse ℓ^1 dictionary coding reduces intra-class variability while preserving class separation through projections over unions of linear spaces. It is implemented in a deep convolutional network with a homotopy algorithm having an exponential convergence. A convergence proof is given in a general framework that includes ALISTA. Classification results are analyzed on ImageNet.