arXiv reaDer
マルチモーダル変分推論としての自己監視表現学習
Self-Supervised Representation Learning as Multimodal Variational Inference
この論文では、最近の自己監視学習(SSL)手法であるSimSiamの確率的拡張を提案します。提案された拡張機能は、SimSiamを拡張ビューの生成モデルと見なし、変分推論の観点から学習することにより、SimSiamの不確実性を認識させます。 SimSiamは、同じ画像のさまざまな拡張ビューの画像表現間の類似性を最大化することにより、モデルをトレーニングします。増強プロセスは時々曖昧な画像を生成し、それらの表現は潜在的に不確実性を持っています。深い変分推論などで不確実性を意識した機械学習の使用が一般的になりつつありますが、SimSiamやその他のSSLメソッドは不確実性を十分に認識しておらず、拡張されたあいまいな画像の使用に制限があります。私たちの主な貢献は2つあります。最初に、非対照的なSSLとマルチモーダル変分推論の間の理論的な関係を明らかにします。次に、変分推論SimSiam(VI-SimSiam)と呼ばれる新しいSSLを紹介します。これは、球形の後方分布を含むことによって不確実性を組み込んでいます。実験結果は、表現の不確実性をうまく推定することにより、VI-SimSiamがImageNetteやImageWoofなどのいくつかのデータセットの分類タスクでSimSiamよりも優れていることを示しています。
In this paper, we propose a probabilistic extension of the recent self-supervised learning (SSL) method, SimSiam. The proposed extension makes SimSiam uncertainty-aware by considering SimSiam as a generative model of augmented views and learning it in terms of variational inference. SimSiam trains a model by maximizing the similarity between image representations of different augmented views of the same image. The augmentation process sometimes produces ambiguous images, and their representations potentially have uncertainty. Although the use of uncertainty-aware machine learning becoming common, such as in deep variational inference, SimSiam and other SSL methods are insufficiently uncertainty-aware, leading to limitations in the use of augmented ambiguous images. Our main contributions are twofold: Firstly, we clarify the theoretical relationship between non-contrastive SSL and multimodal variational inference. Secondly, we introduce a novel SSL called variational inference SimSiam (VI-SimSiam), which incorporates uncertainty by involving spherical posterior distributions. The experiment results show that VI-SimSiam outperforms SimSiam in classification tasks in several datasets, such as ImageNette and ImageWoof by successfully estimating the representation uncertainty.
updated: Mon May 23 2022 08:22:26 GMT+0000 (UTC)
published: Tue Mar 22 2022 03:17:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト