arXiv reaDer
不変の因果メカニズムによる表現学習
Representation Learning via Invariant Causal Mechanisms
自己教師あり学習は、ラベルのないデータのみを使用して表現を事前トレーニングすることにより、コストのかかる教師あり信号への依存を減らす戦略として登場しました。これらの方法は、ヒューリスティックプロキシ分類タスクとデータ拡張を組み合わせて大きな成功を収めていますが、この成功についての理論的な理解は限られています。この論文では、因果的フレームワークを使用して、自己教師あり表現学習を分析します。事前トレーニング中に使用されるプロキシ分類器の明示的な不変性制約を通じて、データ拡張をより効果的に利用する方法を示します。これに基づいて、新しい自己教師あり目的である不変因果メカニズムによる表現学習(ReLIC)を提案します。これは、不変正則化によって拡張全体のプロキシターゲットの不変予測を強制し、一般化の保証を向上させます。さらに、因果関係を使用して、特定の種類の自己教師あり方法である対照学習を一般化し、これらの方法の成功についての代替の理論的説明を提供します。経験的に、ReLICは、ImageNetでの堅牢性と配布外の一般化の点で競合するメソッドを大幅に上回っていますが、57ゲーム中51ゲームで人間レベルを超えるパフォーマンスを達成するAtariでこれらのメソッドを大幅に上回っています。
Self-supervised learning has emerged as a strategy to reduce the reliance on costly supervised signal by pretraining representations only using unlabeled data. These methods combine heuristic proxy classification tasks with data augmentations and have achieved significant success, but our theoretical understanding of this success remains limited. In this paper we analyze self-supervised representation learning using a causal framework. We show how data augmentations can be more effectively utilized through explicit invariance constraints on the proxy classifiers employed during pretraining. Based on this, we propose a novel self-supervised objective, Representation Learning via Invariant Causal Mechanisms (ReLIC), that enforces invariant prediction of proxy targets across augmentations through an invariance regularizer which yields improved generalization guarantees. Further, using causality we generalize contrastive learning, a particular kind of self-supervised method, and provide an alternative theoretical explanation for the success of these methods. Empirically, ReLIC significantly outperforms competing methods in terms of robustness and out-of-distribution generalization on ImageNet, while also significantly outperforming these methods on Atari achieving above human-level performance on 51 out of 57 games.
updated: Thu Oct 15 2020 17:53:37 GMT+0000 (UTC)
published: Thu Oct 15 2020 17:53:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト