arXiv reaDer
弱い適応学習-弱いアノテーターでクロスドメインデータの不足に対処する
Weak Adaptation Learning -- Addressing Cross-domain Data Insufficiency with Weak Annotator
データの量と質は、データ駆動型の学習方法にとって重要な要素です。一部のターゲット問題ドメインでは、利用可能なデータサンプルが多くないため、学習プロセスが大幅に妨げられる可能性があります。同様のドメインからのデータを活用してドメインの適応を支援することもできますが、それらのソースドメイン自体の高品質のラベル付きデータを取得することは困難またはコストがかかる可能性があります。ターゲットドメインの分類問題に対するデータ不足に関するこのような課題に対処するために、同様のソースドメインからのラベルなしデータを活用する弱い適応学習(WAL)アプローチ、タスク固有のヒューリスティックに基づいてラベルを生成する低コストの弱いアノテーターを提案します。 、ラベル付けルール、またはその他の方法(不正確ではありますが)、およびターゲットドメイン内の少量のラベル付けされたデータ。私たちのアプローチは、最初にデータ量と弱いアノテーターのパフォーマンスに関して訓練された分類器の誤差限界について理論的分析を行い、次に誤差限界を下げることによって正確な分類器を学習するための多段階弱適応学習法を導入します。私たちの実験は、ターゲットドメインのラベル付きデータが制限され、ソースドメインのラベルなしデータが限られている正確な分類器を学習する際のアプローチの有効性を示しています。
Data quantity and quality are crucial factors for data-driven learning methods. In some target problem domains, there are not many data samples available, which could significantly hinder the learning process. While data from similar domains may be leveraged to help through domain adaptation, obtaining high-quality labeled data for those source domains themselves could be difficult or costly. To address such challenges on data insufficiency for classification problem in a target domain, we propose a weak adaptation learning (WAL) approach that leverages unlabeled data from a similar source domain, a low-cost weak annotator that produces labels based on task-specific heuristics, labeling rules, or other methods (albeit with inaccuracy), and a small amount of labeled data in the target domain. Our approach first conducts a theoretical analysis on the error bound of the trained classifier with respect to the data quantity and the performance of the weak annotator, and then introduces a multi-stage weak adaptation learning method to learn an accurate classifier by lowering the error bound. Our experiments demonstrate the effectiveness of our approach in learning an accurate classifier with limited labeled data in the target domain and unlabeled data in the source domain.
updated: Tue Sep 21 2021 10:21:57 GMT+0000 (UTC)
published: Mon Feb 15 2021 06:19:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト