この作業では、幅広い監視度の下で安定したパフォーマンスを提供する堅牢な学習システムの設計を調査します。実例として画像分類問題を選択し、表現学習、特徴学習、意思決定学習の3つの学習モジュールで構成されるモジュール化されたシステムの設計に焦点を当てます。さまざまなトレーニングサンプル数に対して設計が堅牢になるように、各モジュールを調整する方法について説明します。これらのアイデアに基づいて、学習システムの2つのファミリを提案します。 1つは指向性勾配の古典的なヒストグラム(HOG)機能を採用し、もう1つは連続部分空間学習(SSL)機能を使用します。 MNISTおよびFashion-MNISTデータセットについて、エンドツーエンドで最適化されたニューラルネットワークであるLeNet-5に対してパフォーマンスをテストします。画像クラスごとのトレーニングサンプルの数は、非常に弱い監視条件(つまり、クラスごとに1つのラベル付けされたサンプル)から強い監視条件(つまり、クラスごとに4096のラベル付けされたサンプル)になり、その間に徐々に遷移します(つまり、2 ^ n、 n = 0、1、\ cdots、12)。実験結果は、モジュール化された学習システムの2つのファミリーがLeNet-5よりも堅牢なパフォーマンスを持っていることを示しています。これらは両方とも、小さいnの場合はLeNet-5を大幅に上回り、大きいnの場合はLeNet-5と同等のパフォーマンスを示します。
The design of robust learning systems that offer stable performance under a wide range of supervision degrees is investigated in this work. We choose the image classification problem as an illustrative example and focus on the design of modularized systems that consist of three learning modules: representation learning, feature learning and decision learning. We discuss ways to adjust each module so that the design is robust with respect to different training sample numbers. Based on these ideas, we propose two families of learning systems. One adopts the classical histogram of oriented gradients (HOG) features while the other uses successive-subspace-learning (SSL) features. We test their performance against LeNet-5, which is an end-to-end optimized neural network, for MNIST and Fashion-MNIST datasets. The number of training samples per image class goes from the extremely weak supervision condition (i.e., 1 labeled sample per class) to the strong supervision condition (i.e., 4096 labeled sample per class) with gradual transition in between (i.e., 2^n, n=0, 1, \cdots, 12). Experimental results show that the two families of modularized learning systems have more robust performance than LeNet-5. They both outperform LeNet-5 by a large margin for small n and have performance comparable with that of LeNet-5 for large n.