arXiv reaDer
HCSC:階層的対照選択的コーディング
HCSC: Hierarchical Contrastive Selective Coding
階層的なセマンティック構造は、画像データセットに自然に存在します。このデータセットでは、いくつかの意味的に関連する画像クラスターを、より粗いセマンティクスを持つより大きなクラスターにさらに統合できます。このような構造を画像表現でキャプチャすると、さまざまなダウンストリームタスクのセマンティックを理解するのに非常に役立ちます。既存の対照表現学習法は、そのような重要なモデル機能を欠いています。さらに、これらの方法で使用される負のペアは、意味的に区別されることが保証されていないため、学習された画像表現の構造的正確性がさらに妨げられる可能性があります。これらの制限に取り組むために、Hierarchical Contrastive Selective Coding(HCSC)と呼ばれる新しい対照学習フレームワークを提案します。このフレームワークでは、一連の階層プロトタイプが構築され、動的に更新されて、潜在空間のデータの基礎となる階層セマンティック構造を表します。画像表現をそのような意味構造によりよく適合させるために、我々は、精巧なペア選択スキームを介して、従来のインスタンスワイズおよびプロトタイプの対照学習を採用し、さらに改善します。このスキームは、同様のセマンティクスを持つより多様なポジティブペアと、真に異なるセマンティクスを持つより正確なネガティブペアを選択しようとします。広範なダウンストリームタスクで、最先端の対照的な方法よりもHCSCの優れたパフォーマンスを検証し、主要なモデルコンポーネントの有効性を豊富な分析研究によって証明します。私たちは秒で包括的なモデル動物園を構築します。 D.ソースコードとモデルの重みはhttps://github.com/gyfastas/HCSCで入手できます。
Hierarchical semantic structures naturally exist in an image dataset, in which several semantically relevant image clusters can be further integrated into a larger cluster with coarser-grained semantics. Capturing such structures with image representations can greatly benefit the semantic understanding on various downstream tasks. Existing contrastive representation learning methods lack such an important model capability. In addition, the negative pairs used in these methods are not guaranteed to be semantically distinct, which could further hamper the structural correctness of learned image representations. To tackle these limitations, we propose a novel contrastive learning framework called Hierarchical Contrastive Selective Coding (HCSC). In this framework, a set of hierarchical prototypes are constructed and also dynamically updated to represent the hierarchical semantic structures underlying the data in the latent space. To make image representations better fit such semantic structures, we employ and further improve conventional instance-wise and prototypical contrastive learning via an elaborate pair selection scheme. This scheme seeks to select more diverse positive pairs with similar semantics and more precise negative pairs with truly distinct semantics. On extensive downstream tasks, we verify the superior performance of HCSC over state-of-the-art contrastive methods, and the effectiveness of major model components is proved by plentiful analytical studies. We build a comprehensive model zoo in Sec. D. Our source code and model weights are available at https://github.com/gyfastas/HCSC
updated: Tue Mar 22 2022 01:35:01 GMT+0000 (UTC)
published: Tue Feb 01 2022 15:04:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト