最近、教師なし表現学習(URL)は、さまざまなシナリオで目覚ましい進歩を遂げました。ただし、ほとんどのメソッドは、特定のデータ文字またはタスクの仮定に基づいて特別に設計されています。多様体の仮定に基づいて、ほとんどのURL問題は、与えられた高次元データの最適な低次元表現を求める埋め込み問題と見なされます。埋め込みプロセスをデータ構造モデリングと低次元埋め込みの2つのステップに分割し、GenURLと呼ばれる一般的な類似性ベースのフレームワークを提案します。具体的には、特徴空間上のグラフ距離と事前定義されたグラフを適応的に組み合わせることによってデータ構造をモデル化する一般的な方法を提供し、次に低次元の埋め込みを学習するためのロバストな損失関数を提案します。特定の口実タスクと組み合わせることで、GenURLをさまざまなURLタスクに統一された方法で適応させ、教師なし視覚表現学習、教師なし知識蒸留、グラフ埋め込み、次元削減などの最先端のパフォーマンスを実現できます。さらに、損失関数のアブレーション研究とGenURLの基本的なハイパーパラメータ設定は、さまざまなタスクのデータ文字を示しています。
Recently unsupervised representation learning (URL) has achieved remarkable progress in various scenarios. However, most methods are specifically designed based on specific data characters or task assumptions. Based on the manifold assumption, we regard most URL problems as an embedding problem that seeks an optimal low-dimensional representation of the given high-dimensional data. We split the embedding process into two steps, data structural modeling and low-dimensional embedding, and propose a general similarity-based framework called GenURL. Specifically, we provide a general method to model data structures by adaptively combining graph distances on the feature space and predefined graphs, then propose robust loss functions to learn the low-dimensional embedding. Combining with a specific pretext task, we can adapt GenURL to various URL tasks in a unified manner and achieve state-of-the-art performance, including self-supervised visual representation learning, unsupervised knowledge distillation, graph embeddings, and dimension reduction. Moreover, ablation studies of loss functions and basic hyper-parameter settings in GenURL illustrate the data characters of various tasks.