arXiv reaDer
オープンワールドの半教師あり学習
Open-World Semi-Supervised Learning
教師ありおよび半教師あり学習方法は、従来、ラベルなしのテストデータには、ラベル付きのトレーニングデータで以前に遭遇したクラスのみが含まれるという仮定に基づいて、クローズドワールド設定用に設計されてきました。ただし、現実の世界は本質的にオープンで動的であるため、テストデータやモデルの展開中に、これまでに見られなかった新しいクラスが表示される場合があります。ここでは、モデルが以前に見たクラスを認識し、ラベル付けされたデータセットでは見られなかった新しいクラスを発見する必要がある、新しいオープンワールドの半教師あり学習設定を紹介します。この問題に取り組むために、データの分類とクラスター化を同時に行うことを学習するアプローチであるORCAを提案します。 ORCAは、ラベルのないデータセットから以前に表示されたクラスに例を分類するか、類似した例をグループ化することによって新しいクラスを形成します。 ORCAの重要なアイデアは、見られたクラス/クラスターと新しいクラス/クラスターの間の分散の不均衡によって引き起こされるバイアスを効果的に回避する不確実性ベースの適応マージンを導入することです。 ORCAが新しいクラスを正確に検出し、CIFARやImageNetなどのベンチマーク画像分類データセットで以前に見たクラスにサンプルを割り当てることを示します。驚くべきことに、より困難なタスクを解決したにもかかわらず、ORCAは、見たクラスの半教師ありメソッドや、新しいクラスの新しいクラス検出メソッドよりも優れており、ImageNetデータセットの見たクラスと新しいクラスで7%と151%の改善を達成しました。
Supervised and semi-supervised learning methods have been traditionally designed for the closed-world setting based on the assumption that unlabeled test data contains only classes previously encountered in the labeled training data. However, the real world is inherently open and dynamic, and thus novel, previously unseen classes may appear in the test data or during the model deployment. Here, we introduce a new open-world semi-supervised learning setting in which the model is required to recognize previously seen classes, as well as to discover novel classes never seen in the labeled dataset. To tackle the problem, we propose ORCA, an approach that learns to simultaneously classify and cluster the data. ORCA classifies examples from the unlabeled dataset to previously seen classes, or forms a novel class by grouping similar examples together. The key idea in ORCA is in introducing uncertainty based adaptive margin that effectively circumvents the bias caused by the imbalance of variance between seen and novel classes/clusters. We demonstrate that ORCA accurately discovers novel classes and assigns samples to previously seen classes on benchmark image classification datasets, including CIFAR and ImageNet. Remarkably, despite solving the harder task ORCA outperforms semi-supervised methods on seen classes, as well as novel class discovery methods on novel classes, achieving 7% and 151% improvements on seen and novel classes in the ImageNet dataset.
updated: Sat Feb 06 2021 07:11:07 GMT+0000 (UTC)
published: Sat Feb 06 2021 07:11:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト