arXiv reaDer
一般化されたカテゴリ発見のためのパラメトリック分類: ベースライン調査
Parametric Classification for Generalized Category Discovery: A Baseline Study
Generalized Category Discovery (GCD) は、ラベル付けされたサンプルから学習した知識を使用して、ラベル付けされていないデータセットで新しいカテゴリを発見することを目的としています。以前の研究では、パラメトリック分類器は見られるカテゴリに過剰適合する傾向があると主張し、半教師あり k-means で形成されたノンパラメトリック分類器を使用して承認されました。ただし、この研究では、パラメトリック分類器の失敗を調査し、高品質の監視が利用可能な場合の以前の設計選択の有効性を検証し、信頼できない疑似ラベルを重要な問題として特定します。 2 つの予測バイアスが存在することを示します。分類子は、見られるクラスをより頻繁に予測する傾向があり、見られるカテゴリと新しいカテゴリ間で不均衡な分布を生成します。これらの調査結果に基づいて、エントロピー正則化の恩恵を受け、複数の GCD ベンチマークで最先端のパフォーマンスを達成し、未知のクラス数に対して強力なロバスト性を示す、シンプルでありながら効果的なパラメトリック分類方法を提案します。調査と提案された単純なフレームワークが、この分野の将来の研究を促進するための強力なベースラインとして役立つことを願っています.コードは https://github.com/CVMI-Lab/SimGCD で入手できます。
Generalized Category Discovery (GCD) aims to discover novel categories in unlabelled datasets using knowledge learned from labelled samples. Previous studies argued that parametric classifiers are prone to overfitting to seen categories, and endorsed using a non-parametric classifier formed with semi-supervised k-means. However, in this study, we investigate the failure of parametric classifiers, verify the effectiveness of previous design choices when high-quality supervision is available, and identify unreliable pseudo-labels as a key problem. We demonstrate that two prediction biases exist: the classifier tends to predict seen classes more often, and produces an imbalanced distribution across seen and novel categories. Based on these findings, we propose a simple yet effective parametric classification method that benefits from entropy regularisation, achieves state-of-the-art performance on multiple GCD benchmarks and shows strong robustness to unknown class numbers. We hope the investigation and proposed simple framework can serve as a strong baseline to facilitate future studies in this field. Our code is available at: https://github.com/CVMI-Lab/SimGCD.
updated: Wed Mar 15 2023 19:40:53 GMT+0000 (UTC)
published: Mon Nov 21 2022 18:47:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト