arXiv reaDer
自己監視ありおよび監視ありの方法は、同様の視覚的表現を学習しますか?
Do Self-Supervised and Supervised Methods Learn Similar Visual Representations?
視覚的な自己監視型深層学習のための最近の多くの手法の成功にもかかわらず、最終的に学習される表現についての調査は限られています。神経表現の比較における最近の進歩を活用することにより、対照的な自己監視アルゴリズムを一般的なアーキテクチャの単純な画像データの監視と比較することにより、この方向を探求します。メソッドは、異なる手段を通じて同様の中間表現を学習し、表現は最後の数層で急速に発散することがわかります。この相違を調査し、これらのレイヤーが明確な学習目標に強く適合していることを発見しました。また、対照的な目的は、中間層の教師あり目的に暗黙的に適合しますが、その逆は当てはまりません。私たちの仕事は、学習した中間表現の重要性を特に強調し、補助的なタスク設計のための重要な質問を提起します。
Despite the success of a number of recent techniques for visual self-supervised deep learning, there has been limited investigation into the representations that are ultimately learned. By leveraging recent advances in the comparison of neural representations, we explore in this direction by comparing a contrastive self-supervised algorithm to supervision for simple image data in a common architecture. We find that the methods learn similar intermediate representations through dissimilar means, and that the representations diverge rapidly in the final few layers. We investigate this divergence, finding that these layers strongly fit to their distinct learning objectives. We also find that the contrastive objective implicitly fits the supervised objective in intermediate layers, but that the reverse is not true. Our work particularly highlights the importance of the learned intermediate representations, and raises critical questions for auxiliary task design.
updated: Thu Dec 02 2021 18:45:58 GMT+0000 (UTC)
published: Fri Oct 01 2021 16:51:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト