arXiv reaDer
データ拡張による自己教師あり学習は、明らかにコンテンツをスタイルから分離する
Self-Supervised Learning with Data Augmentations Provably Isolates Content from Style
自己教師あり表現学習は、多くの分野で目覚ましい成功を収めています。一般的な方法は、データのセマンティクスを不変のままにすることを目的とした手作りの変換を介してデータ拡張を実行することです。私たちは、このアプローチの経験的成功を理論的観点から理解しようとしています。潜在表現の分割を、拡張に対して不変であると想定されるコンテンツ コンポーネントと、変更が許可されるスタイル コンポーネントに仮定することにより、拡張プロセスを潜在変数モデルとして定式化します。もつれ解消と独立成分分析に関するこれまでの研究とは異なり、潜在空間における自明ではない統計的依存性と因果的依存性の両方を考慮しています。観察のビューのペアに基づいて潜在的表現の識別可能性を研究し、生成および識別の両方の設定で可逆マッピングまで不変コンテンツ パーティションを識別できる十分条件を証明します。従属潜在変数を使用した数値シミュレーションは、私たちの理論と一致していることがわかります。最後に、実際に実行されたデータ拡張の効果を研究するために使用する、豊富な因果関係を持つ高次元で視覚的に複雑な画像のデータセットである Causal3DIdent を紹介します。
Self-supervised representation learning has shown remarkable success in a number of domains. A common practice is to perform data augmentation via hand-crafted transformations intended to leave the semantics of the data invariant. We seek to understand the empirical success of this approach from a theoretical perspective. We formulate the augmentation process as a latent variable model by postulating a partition of the latent representation into a content component, which is assumed invariant to augmentation, and a style component, which is allowed to change. Unlike prior work on disentanglement and independent component analysis, we allow for both nontrivial statistical and causal dependencies in the latent space. We study the identifiability of the latent representation based on pairs of views of the observations and prove sufficient conditions that allow us to identify the invariant content partition up to an invertible mapping in both generative and discriminative settings. We find numerical simulations with dependent latent variables are consistent with our theory. Lastly, we introduce Causal3DIdent, a dataset of high-dimensional, visually complex images with rich causal dependencies, which we use to study the effect of data augmentations performed in practice.
updated: Thu Oct 28 2021 08:53:02 GMT+0000 (UTC)
published: Tue Jun 08 2021 18:18:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト