arXiv reaDer
マスクされたオートエンコーダーのターゲット表現の調査
Exploring Target Representations for Masked Autoencoders
マスクされたオートエンコーダーは、自己教師あり視覚表現学習の一般的なトレーニング パラダイムになりました。これらのモデルは、入力の一部をランダムにマスクし、ターゲット表現に従ってマスクされた部分を再構築します。この論文では、最初に、異なるターゲットは同様に動作するモデルを導出する傾向があるため、適切な表現を学習するためにターゲット表現を慎重に選択する必要がないことを示します。この観察に基づいて、多段マスク蒸留パイプラインを提案し、ランダムに初期化されたモデルを教師として使用して、ターゲット表現を慎重に設計する努力をしなくても、大容量モデルを効果的にトレーニングできるようにします。興味深いことに、私たちはさらに、より大きな能力を持つ教師を使用することを検討し、優れた伝達能力を持つ蒸留された生徒を獲得しています。分類、転移学習、オブジェクト検出、およびセマンティック セグメンテーションのさまざまなタスクで、ブートストラップされた教師 (dBOT) を使用してマスクされた知識の蒸留を実行する提案された方法は、以前の自己教師あり方法よりも重要なマージンで優れています。私たちの調査結果と提案された方法が、マスクされたオートエンコーダーの事前トレーニングにおけるターゲット表現の役割を人々が再考するきっかけになることを願っています。
Masked autoencoders have become popular training paradigms for self-supervised visual representation learning. These models randomly mask a portion of the input and reconstruct the masked portion according to the target representations. In this paper, we first show that a careful choice of the target representation is unnecessary for learning good representations, since different targets tend to derive similarly behaved models. Driven by this observation, we propose a multi-stage masked distillation pipeline and use a randomly initialized model as the teacher, enabling us to effectively train high-capacity models without any efforts to carefully design target representations. Interestingly, we further explore using teachers of larger capacity, obtaining distilled students with remarkable transferring ability. On different tasks of classification, transfer learning, object detection, and semantic segmentation, the proposed method to perform masked knowledge distillation with bootstrapped teachers (dBOT) outperforms previous self-supervised methods by nontrivial margins. We hope our findings, as well as the proposed method, could motivate people to rethink the roles of target representations in pre-training masked autoencoders.
updated: Thu Sep 08 2022 16:55:19 GMT+0000 (UTC)
published: Thu Sep 08 2022 16:55:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト