arXiv reaDer
一般化されたカテゴリの発見
Generalized Category Discovery
この論文では、非常に一般的な画像認識設定を検討します。この設定では、ラベル付きおよびラベルなしの画像セットが与えられた場合、タスクはラベルなしセット内のすべての画像を分類することです。ここで、ラベルのない画像は、ラベルの付いたクラスまたは新しいクラスからのものである可能性があります。既存の認識方法は、既知のクラスまたは未知のクラスからのみ発生するラベルのないインスタンスや、事前に既知の未知のクラスの数など、いくつかの制限的な仮定を行うため、この設定を処理できません。より制約のない設定に対処し、「一般化されたカテゴリの検出」という名前を付けて、これらすべての仮定に挑戦します。まず、新しいカテゴリの発見から最先端のアルゴリズムを採用し、それらをこのタスクに適合させることによって、強力なベースラインを確立します。次に、このオープンワールド設定で対照的な表現学習を備えたビジョントランスフォーマーの使用を提案します。次に、シンプルでありながら効果的な半教師ありk-means法を導入して、ラベルのないデータを自動的に表示クラスと非表示クラスにクラスター化し、ベースラインを大幅に上回ります。最後に、ラベルなしデータのクラス数を推定するための新しいアプローチも提案します。最近のセマンティックシフトベンチマークスイートを活用して、一般的なオブジェクト分類のためのパブリックデータセットと、きめ細かいデータセットに対するアプローチを徹底的に評価します。 https://www.robots.ox.ac.uk/~vgg/research/gcdのプロジェクトページ
In this paper, we consider a highly general image recognition setting wherein, given a labelled and unlabelled set of images, the task is to categorize all images in the unlabelled set. Here, the unlabelled images may come from labelled classes or from novel ones. Existing recognition methods are not able to deal with this setting, because they make several restrictive assumptions, such as the unlabelled instances only coming from known - or unknown - classes, and the number of unknown classes being known a-priori. We address the more unconstrained setting, naming it 'Generalized Category Discovery', and challenge all these assumptions. We first establish strong baselines by taking state-of-the-art algorithms from novel category discovery and adapting them for this task. Next, we propose the use of vision transformers with contrastive representation learning for this open-world setting. We then introduce a simple yet effective semi-supervised k-means method to cluster the unlabelled data into seen and unseen classes automatically, substantially outperforming the baselines. Finally, we also propose a new approach to estimate the number of classes in the unlabelled data. We thoroughly evaluate our approach on public datasets for generic object classification and on fine-grained datasets, leveraging the recent Semantic Shift Benchmark suite. Project page at https://www.robots.ox.ac.uk/~vgg/research/gcd
updated: Sun Jun 19 2022 00:20:49 GMT+0000 (UTC)
published: Fri Jan 07 2022 18:58:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト