arXiv reaDer
Cold PAWS: 教師なしクラスの検出と半教師あり学習のコールドスタート問題への対処
Cold PAWS: Unsupervised class discovery and addressing the cold-start problem for semi-supervised learning
多くの機械学習アプリケーションでは、データセットのラベル付けは困難で時間のかかる作業となる可能性があります。コンピュータービジョンの分野では、半教師あり学習技術が非常に少ないラベルで高い精度を達成できることが研究で示されていますが、データセット内の画像をラベル付けのために選択する方法についてはほとんど注目されていません。この論文では、コールドスタートとして知られる、ラベル付けする情報画像サブセットを最初に選択するというこの課題に対処する、十分に確立された自己教師あり学習、クラスタリング、および多様体学習技術に基づく新しいアプローチを提案します。または教師なしの選択的ラベリング問題。 CIFAR10、Imagenette、DeepWeeds、EuroSAT など、いくつかの公的に利用可能なデータセットを使用してアプローチをテストし、ラベル選択戦略を使用した場合、ランダム サンプリングと比較して、教師あり学習戦略と半教師あり学習戦略の両方でパフォーマンスが向上することを観察しました。また、文献にある他の方法と比較して、はるかに単純なアプローチを考慮したデータセットで優れたパフォーマンスが得られます。
In many machine learning applications, labeling datasets can be an arduous and time-consuming task. Although research has shown that semi-supervised learning techniques can achieve high accuracy with very few labels within the field of computer vision, little attention has been given to how images within a dataset should be selected for labeling. In this paper, we propose a novel approach based on well-established self-supervised learning, clustering, and manifold learning techniques that address this challenge of selecting an informative image subset to label in the first instance, which is known as the cold-start or unsupervised selective labelling problem. We test our approach using several publicly available datasets, namely CIFAR10, Imagenette, DeepWeeds, and EuroSAT, and observe improved performance with both supervised and semi-supervised learning strategies when our label selection strategy is used, in comparison to random sampling. We also obtain superior performance for the datasets considered with a much simpler approach compared to other methods in the literature.
updated: Tue Jun 06 2023 07:31:15 GMT+0000 (UTC)
published: Wed May 17 2023 09:17:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト