arXiv reaDer
確率マトリックスの観点からの新規カテゴリの発見
Novel Categories Discovery from probability matrix perspective
Novel Categories Discovery (NCD) は、部分クラス空間の注釈付きデータを使用して、クラス セマンティクスに基づいて既知のカテゴリを分類し、新しいカテゴリをクラスタリングするというオープンワールドの問題に取り組みます。従来の擬似ラベルや再トレーニングとは異なり、新しいデータ確率行列の観点から NCD を調査します。 NCD の新規データ サンプリングと提供された新規クラスのマルチヌーイ (カテゴリカル) 分布との関係を活用し、クラス分布を学習することで意味論ベースの新規データ クラスタリングを暗黙的に達成するという仮説を立てます。インスタンスごとの情報制約を適用しながら、確率行列特徴の一次 (平均) 統計と二次 (共分散) 統計に対する新しい制約を提案します。特に、経験的特徴の平均と共分散を提供されたマルチヌーイ分布と照合することにより、モンテカルロの新しいデータ サンプリングの大規模バッチの下でニューロンの分布 (活性化パターン) を調整します。同時に、エントロピーを最小限に抑え、各インスタンスの予測の一貫性を強化します。私たちの単純なアプローチは、ラベルのないクラス間の意味論的な類似性を提供する意味論ベースの新しいデータ クラスタリングを首尾よく実現します。私たちは、画像およびビデオモダリティにおけるアプローチの識別能力を実証します。さらに、より良い洞察を提供するために、データ、ネットワーク、フレームワーク コンポーネントに関する広範なアブレーション研究を実施しています。私たちのアプローチは、ラベル付きデータの分類精度 ~94%、~93%、~85% を維持しながら、Cifar10、UCF101、および MPSC-ARL データセットの新しいカテゴリに対してクラスタリング精度 ~90%、~84%、~72% を達成します。外部クラスタリングを一切使用せずに、最先端のアプローチと一致します。
Novel Categories Discovery (NCD) tackles the open-world problem of classifying known and clustering novel categories based on the class semantics using partial class space annotated data. Unlike traditional pseudo-label and retraining, we investigate NCD from the novel data probability matrix perspective. We leverage the connection between NCD novel data sampling with provided novel class Multinoulli (categorical) distribution and hypothesize to implicitly achieve semantic-based novel data clustering by learning their class distribution. We propose novel constraints on first-order (mean) and second-order (covariance) statistics of probability matrix features while applying instance-wise information constraints. In particular, we align the neuron distribution (activation patterns) under a large batch of Monte-Carlo novel data sampling by matching their empirical features mean and covariance with the provided Multinoulli-distribution. Simultaneously, we minimize entropy and enforce prediction consistency for each instance. Our simple approach successfully realizes semantic-based novel data clustering provided the semantic similarity between label-unlabeled classes. We demonstrate the discriminative capacity of our approaches in image and video modalities. Moreover, we perform extensive ablation studies regarding data, networks, and our framework components to provide better insights. Our approach maintains ~94%, ~93%, and ~85%, classification accuracy in labeled data while achieving ~90%, ~84%, and ~72% clustering accuracy for novel categories for Cifar10, UCF101, and MPSC-ARL datasets that matches state-of-the-art approaches without any external clustering.
updated: Fri Jul 07 2023 22:30:24 GMT+0000 (UTC)
published: Fri Jul 07 2023 22:30:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト