既存の認識アルゴリズムのほとんどは、すべてのカテゴリが事前にわかっているクローズドセットシナリオ用に提案されています。ただし、実際には、認識は本質的に未解決の問題です。 「既知」と呼ばれる既知のカテゴリがあり、「不明」と呼ばれる未知のカテゴリがさらにあります。事前にすべてのカテゴリを列挙することは決して不可能です。そのため、これらの未知のものに対して十分なトレーニングサンプルを準備することは実行不可能です。クローズドセットの認識方法を適用すると、当然ながら不可視のカテゴリエラーが発生します。この問題に対処するために、オープンセット認識タスク用のプロトタイプベースのオープンディープネットワーク(P-ODN)を提案します。具体的には、プロトタイプ学習をオープンセット認識に導入します。プロトタイプとプロトタイプ半径は、CNNネットワークをガイドしてより差別的な機能を引き出すために共同でトレーニングされます。次に、P-ODNは、フィーチャとプロトタイプ間の距離メトリックに基づくマルチクラストリプレットしきい値法を適用することにより、未知を検出します。前のプロセスで新しいカテゴリとして検出された未知のものに手動でラベルを付けます。新しいカテゴリの予測変数が分類層に追加され、ディープニューラルネットワークを「開いて」、新しいカテゴリが動的に組み込まれます。新しい予測子の重みは、距離ベースのアルゴリズムを適用して学習した知識を転送することにより、絶妙に初期化されます。その結果、この初期化方法は微調整プロセスを高速化し、新しい予測変数のトレーニングに必要なサンプルを削減します。広範な実験により、P-ODNは未知のものを効果的に検出でき、新しいカテゴリを認識するために人間の介入を必要とするサンプルはほとんどありません。現実の世界のシナリオでは、この方法により、UCF11、UCF50、UCF101、およびHMDB51データセットで最先端のパフォーマンスが実現します。
Most of the existing recognition algorithms are proposed for closed set scenarios, where all categories are known beforehand. However, in practice, recognition is essentially an open set problem. There are categories we know called "knowns", and there are more we do not know called "unknowns". Enumerating all categories beforehand is never possible, consequently it is infeasible to prepare sufficient training samples for those unknowns. Applying closed set recognition methods will naturally lead to unseen-category errors. To address this problem, we propose the prototype based Open Deep Network (P-ODN) for open set recognition tasks. Specifically, we introduce prototype learning into open set recognition. Prototypes and prototype radiuses are trained jointly to guide a CNN network to derive more discriminative features. Then P-ODN detects the unknowns by applying a multi-class triplet thresholding method based on the distance metric between features and prototypes. Manual labeling the unknowns which are detected in the previous process as new categories. Predictors for new categories are added to the classification layer to "open" the deep neural networks to incorporate new categories dynamically. The weights of new predictors are initialized exquisitely by applying a distances based algorithm to transfer the learned knowledge. Consequently, this initialization method speed up the fine-tuning process and reduce the samples needed to train new predictors. Extensive experiments show that P-ODN can effectively detect unknowns and needs only few samples with human intervention to recognize a new category. In the real world scenarios, our method achieves state-of-the-art performance on the UCF11, UCF50, UCF101 and HMDB51 datasets.