arXiv reaDer
インスタンスと分散視覚表現を学習するための極端なマスキング
Extreme Masking for Learning Instance and Distributed Visual Representations
このホワイトペーパーでは、個々のトークンの分散表現と全体的なインスタンス表現を同時に学習するためのスケーラブルなアプローチを紹介します。分散トークンを表すために自己注意ブロックを使用し、続いて全体的なインスタンスを集約するために相互注意ブロックを使用します。このアプローチの中核は、監視用のデータ拡張として非常に大きなトークンマスキング(75%〜90%)を使用することです。 ExtreMAという名前のモデルは、単純なBYOLアプローチに従います。このアプローチでは、マスクされていないサブセットからのインスタンス表現が、インタクトな入力からそれを予測するようにトレーニングされます。学習では、モデルが不変性を促進するのではなく、インスタンス内の有益な変動をキャプチャする必要があります。この論文は3つの貢献をしています:1)ランダムマスキングは、一般化可能な注意表現を学習するための強力で計算効率の高いデータ拡張です。 2)インスタンスごとに複数のサンプリングを使用すると、極端なマスキングにより、学習が大幅にスピードアップし、より多くのデータが必要になります。 3)分散表現は、マスクされたモデリングのトークンごとの監視とは異なり、インスタンスの監視のみから学習できます。
The paper presents a scalable approach for learning distributed representations over individual tokens and a holistic instance representation simultaneously. We use self-attention blocks to represent distributed tokens, followed by cross-attention blocks to aggregate the holistic instance. The core of the approach is the use of extremely large token masking (75%-90%) as the data augmentation for supervision. Our model, named ExtreMA, follows the plain BYOL approach where the instance representation from the unmasked subset is trained to predict that from the intact input. Learning requires the model to capture informative variations in an instance, instead of encouraging invariances. The paper makes three contributions: 1) Random masking is a strong and computationally efficient data augmentation for learning generalizable attention representations. 2) With multiple sampling per instance, extreme masking greatly speeds up learning and hungers for more data. 3) Distributed representations can be learned from the instance supervision alone, unlike per-token supervisions in masked modeling.
updated: Thu Jun 09 2022 17:59:43 GMT+0000 (UTC)
published: Thu Jun 09 2022 17:59:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト