arXiv reaDer
MAST: 一般化可能な自己教師あり事前分布のためのマスクされた増強部分空間トレーニング
MAST: Masked Augmentation Subspace Training for Generalizable Self-Supervised Priors
最近の自己教師あり学習 (SSL) メソッドは、さまざまなデータ拡張に対して不変な特徴表現を学習することができ、その後、関心のある下流のタスクに転送できます。ただし、ダウンストリーム タスクが異なれば、最適なパフォーマンスを得るために必要な不変性も異なるため、SSL の拡張の最適な選択はターゲット タスクによって異なります。この論文では、事前にタスク情報を知らなくても、さまざまなダウンストリーム タスク (オブジェクトの分類、検出、インスタンスのセグメンテーションなど) で一般化する自己教師あり機能を学習することを目的としています。 Masked Augmentation Subspace Training (または MAST) によってこれを行い、因数分解された方法でさまざまなデータ拡張からの事前分布を単一の特徴空間にエンコードします。具体的には、特徴空間を別々のサブスペースに解きほぐし、それぞれが特定の拡張に対する不変性をモデル化するために関連する特徴次元を選択する学習可能なマスクによって誘導されます。サブスペース全体で一意の機能と共有機能の両方を使用して、さまざまな拡張から一般化可能な事前確率を共同でキャプチャする際の MAST の成功を示します。さらに、MAST が不確実性モデリングの恩恵を受けて、各部分空間で類似性の不一致を引き起こす可能性のある強力な増強からのあいまいなサンプルを再重み付けすることを示します。実験では、MAST がさまざまなダウンストリーム タスクの一般化を一貫して向上させる一方で、SSL 中はタスクに依存せず効率的であることが示されています。また、さまざまなオーグメンテーションがどのように関連しているか、不確実性が学習の難しさをどのように反映しているかについて、興味深い洞察も提供します。
Recent Self-Supervised Learning (SSL) methods are able to learn feature representations that are invariant to different data augmentations, which can then be transferred to downstream tasks of interest. However, different downstream tasks require different invariances for their best performance, so the optimal choice of augmentations for SSL depends on the target task. In this paper, we aim to learn self-supervised features that generalize well across a variety of downstream tasks (e.g., object classification, detection and instance segmentation) without knowing any task information beforehand. We do so by Masked Augmentation Subspace Training (or MAST) to encode in the single feature space the priors from different data augmentations in a factorized way. Specifically, we disentangle the feature space into separate subspaces, each induced by a learnable mask that selects relevant feature dimensions to model invariance to a specific augmentation. We show the success of MAST in jointly capturing generalizable priors from different augmentations, using both unique and shared features across the subspaces. We further show that MAST benefits from uncertainty modeling to reweight ambiguous samples from strong augmentations that may cause similarity mismatch in each subspace. Experiments demonstrate that MAST consistently improves generalization on various downstream tasks, while being task-agnostic and efficient during SSL. We also provide interesting insights about how different augmentations are related and how uncertainty reflects learning difficulty.
updated: Tue Mar 07 2023 06:38:48 GMT+0000 (UTC)
published: Tue Mar 07 2023 06:38:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト