arXiv reaDer
自動エンコードなしの教師なし解きほぐし:落とし穴と将来の方向性
Unsupervised Disentanglement without Autoencoding: Pitfalls and Future Directions
解きほぐされた視覚表現は、主に、Variational AutoEncoders(VAE)などの生成モデルで研究されてきました。以前の研究は、解きほぐされた表現学習のための生成方法に焦点を合わせていましたが、生成モデルの現在の制限のため、これらのアプローチは大きなデータセットに拡張できません。代わりに、対照的な学習を使用した正則化手法を検討します。これにより、大規模なデータセットやダウンストリームアプリケーションに十分強力な解きほぐされた表現が得られる可能性があります。ただし、タスクのパフォーマンスにはトレードオフがあり、最適化と初期化の感度が原因で、教師なし解きほぐしを実現するのは難しいことがわかりました。ダウンストリームタスクとの解きほぐしを評価し、使用される各正則化の長所と短所を分析し、将来の方向性について話し合います。
Disentangled visual representations have largely been studied with generative models such as Variational AutoEncoders (VAEs). While prior work has focused on generative methods for disentangled representation learning, these approaches do not scale to large datasets due to current limitations of generative models. Instead, we explore regularization methods with contrastive learning, which could result in disentangled representations that are powerful enough for large scale datasets and downstream applications. However, we find that unsupervised disentanglement is difficult to achieve due to optimization and initialization sensitivity, with trade-offs in task performance. We evaluate disentanglement with downstream tasks, analyze the benefits and disadvantages of each regularization used, and discuss future directions.
updated: Sat Aug 14 2021 21:06:42 GMT+0000 (UTC)
published: Sat Aug 14 2021 21:06:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト