arXiv reaDer
オープンワールドの半教師あり学習
Open-World Semi-Supervised Learning
実世界の設定で半教師あり学習を適用することの基本的な制限は、ラベルのないテストデータには、ラベルの付いたトレーニングデータで以前に遭遇したクラスのみが含まれるという仮定です。ただし、この仮定は、新しいクラスに属するインスタンスがテスト時に表示される可能性がある、実際のデータにはほとんど当てはまりません。ここでは、新しいクラスがラベルのないテストデータに表示される可能性があるという概念を形式化する、新しいオープンワールドの半教師あり学習設定を紹介します。この新しい設定の目標は、ラベル付きデータとラベルなしデータの間のクラス分布の不一致を解決することです。テスト時に、すべての入力インスタンスを既存のクラスの1つに分類するか、新しい非表示クラスを初期化する必要があります。この困難な問題に取り組むために、ORCAを提案します。これは、不確実性適応マージンメカニズムを導入して、新しいクラスよりも速く見たクラスの識別機能を学習することによって引き起こされる見たクラスへのバイアスを回避するエンドツーエンドの深層学習アプローチです。このようにして、ORCAは、新規クラスに関して見られるクラス内分散間のギャップを減らします。画像分類データセットと単一セル注釈データセットでの実験は、ORCAが一貫して代替ベースラインを上回り、ImageNetデータセットの新しいクラスで25%の改善、96%の改善を達成していることを示しています。
A fundamental limitation of applying semi-supervised learning in real-world settings is the assumption that unlabeled test data contains only classes previously encountered in the labeled training data. However, this assumption rarely holds for data in-the-wild, where instances belonging to novel classes may appear at testing time. Here, we introduce a novel open-world semi-supervised learning setting that formalizes the notion that novel classes may appear in the unlabeled test data. In this novel setting, the goal is to solve the class distribution mismatch between labeled and unlabeled data, where at the test time every input instance either needs to be classified into one of the existing classes or a new unseen class needs to be initialized. To tackle this challenging problem, we propose ORCA, an end-to-end deep learning approach that introduces uncertainty adaptive margin mechanism to circumvent the bias towards seen classes caused by learning discriminative features for seen classes faster than for the novel classes. In this way, ORCA reduces the gap between intra-class variance of seen with respect to novel classes. Experiments on image classification datasets and a single-cell annotation dataset demonstrate that ORCA consistently outperforms alternative baselines, achieving 25% improvement on seen and 96% improvement on novel classes of the ImageNet dataset.
updated: Tue Jan 25 2022 23:13:10 GMT+0000 (UTC)
published: Sat Feb 06 2021 07:11:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト