arXiv reaDer
マルチモーダル自己教師あり表現学習の分類法
Taxonomy of multimodal self-supervised representation learning
複数のソースからの感覚入力は、堅牢で一貫性のある人間の知覚にとって非常に重要です。さまざまな情報源が補完的な説明要素を提供し、それらが共有する要素に基づいて結合されます。このシステムは、強力な教師なし表現学習アルゴリズムの設計を動機付けました。この論文では、単一のフレームワークの下でマルチモーダル自己教師あり学習に関する最近の研究を統合します。ほとんどの自己教師あり方法がモデルコンポーネントのセット間の類似性メトリックを最適化することを観察して、このプロセスを編成するためのすべての合理的な方法の分類法を提案します。マルチモーダルMNISTとマルチモーダル脳イメージングデータセットの2つのバージョンで、(1)マルチモーダル対照学習がそのユニモーダル対応物よりも大きな利点があること、(2)複数の対照目的の特定の構成がダウンストリームタスクのパフォーマンスにとって重要であることを経験的に示します( 3)表現間の類似性を最大化すると、ニューラルネットワークに正則化効果があり、ダウンストリームパフォーマンスの低下につながる場合がありますが、それでもマルチモーダル関係が明らかになる可能性があります。その結果、線形評価プロトコルのさまざまなデータセットで、CCAまたは変分混合MMVAEに基づく以前の教師なしエンコーダ-デコーダ方式よりも優れています。
Sensory input from multiple sources is crucial for robust and coherent human perception. Different sources contribute complementary explanatory factors and get combined based on factors they share. This system motivated the design of powerful unsupervised representation-learning algorithms. In this paper, we unify recent work on multimodal self-supervised learning under a single framework. Observing that most self-supervised methods optimize similarity metrics between a set of model components, we propose a taxonomy of all reasonable ways to organize this process. We empirically show on two versions of multimodal MNIST and a multimodal brain imaging dataset that (1) multimodal contrastive learning has significant benefits over its unimodal counterpart, (2) the specific composition of multiple contrastive objectives is critical to performance on a downstream task, (3) maximization of the similarity between representations has a regularizing effect on a neural network, which sometimes can lead to reduced downstream performance but still can reveal multimodal relations. Consequently, we outperform previous unsupervised encoder-decoder methods based on CCA or variational mixtures MMVAE on various datasets on linear evaluation protocol.
updated: Fri Dec 25 2020 20:28:13 GMT+0000 (UTC)
published: Fri Dec 25 2020 20:28:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト