arXiv reaDer
FUSSL: ファジーで不確かな自己教師あり学習
FUSSL: Fuzzy Uncertain Self Supervised Learning
自己教師あり学習 (SSL) は、ラベル付けの手間をかけずに、ラベルのないデータの力を活用するための非常に成功した手法になりました。多くの開発されたアプローチは、比較的成功している監視付きの代替手段よりも優れたパフォーマンスを発揮することを目標に進化しています。 SSL の主な問題の 1 つは、さまざまな設定でのアプローチの堅牢性です。このホワイト ペーパーでは、単一監視信号の使用に起因する SSL の基本的な制限を初めて認識しました。この制限に対処するために、不確実性表現の力を活用して、仮定やアプローチに関係なく、SSL ベースライン用の堅牢で一般的な標準の階層型学習/トレーニング プロトコルを考案します。基本的に、情報のボトルネック原理を使用して、特徴学習を 2 段階のトレーニング手順に分解し、それぞれに個別の監視信号を使用します。この二重監視アプローチは、2 つの重要なステップで捉えられます。1) データ拡張に対する不変性の適用、および 2) ファジー疑似ラベル付け (ハードおよびソフト アノテーションの両方)。クロスクラス/クラスター機能学習を可能にするこのシンプルでありながら効果的なプロトコルは、最初のトレーニング フェーズとして不変性強制によるデータ拡張によるモデルのアンサンブルの初期トレーニングを介してインスタンス化され、次にファジー ラベルを元のサンプルに割り当てます。トレーニングの第 2 段階。二重監督による複数の代替シナリオを検討し、最近のベースラインに対するアプローチの有効性を評価します。これには、幾何学的、対照的、非対照的、およびハード/ソフト ホワイトニング (冗長性削減) ベースラインを含む 4 つの異なる SSL パラダイムが含まれます。複数の設定の下での広範な実験は、提案されたトレーニング プロトコルが、それぞれの基本的な原則とは無関係に、以前のベースラインのパフォーマンスを一貫して改善することを示しています。
Self supervised learning (SSL) has become a very successful technique to harness the power of unlabeled data, with no annotation effort. A number of developed approaches are evolving with the goal of outperforming supervised alternatives, which have been relatively successful. One main issue in SSL is robustness of the approaches under different settings. In this paper, for the first time, we recognize the fundamental limits of SSL coming from the use of a single-supervisory signal. To address this limitation, we leverage the power of uncertainty representation to devise a robust and general standard hierarchical learning/training protocol for any SSL baseline, regardless of their assumptions and approaches. Essentially, using the information bottleneck principle, we decompose feature learning into a two-stage training procedure, each with a distinct supervision signal. This double supervision approach is captured in two key steps: 1) invariance enforcement to data augmentation, and 2) fuzzy pseudo labeling (both hard and soft annotation). This simple, yet, effective protocol which enables cross-class/cluster feature learning, is instantiated via an initial training of an ensemble of models through invariance enforcement to data augmentation as first training phase, and then assigning fuzzy labels to the original samples for the second training phase. We consider multiple alternative scenarios with double supervision and evaluate the effectiveness of our approach on recent baselines, covering four different SSL paradigms, including geometrical, contrastive, non-contrastive, and hard/soft whitening (redundancy reduction) baselines. Extensive experiments under multiple settings show that the proposed training protocol consistently improves the performance of the former baselines, independent of their respective underlying principles.
updated: Fri Oct 28 2022 01:06:10 GMT+0000 (UTC)
published: Fri Oct 28 2022 01:06:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト