arXiv reaDer
画像クラスタリングの前の単一名詞
The Single-Noun Prior for Image Clustering
自己監視クラスタリング手法は、近年精度の向上を達成していますが、教師あり分類手法ほどのパフォーマンスはまだ得られていません。これは、自己監視機能が最近、いくつかの重要なタスクで監視あり機能のパフォーマンスを上回った機能学習の状況とは対照的です。パフォーマンスのギャップは、監督なしで、人間にとって意味的なクラスの違いに対応する機能を指定することが難しいためであると仮定します。パフォーマンスのギャップを減らすために、「単一名詞」の事前定義を導入します。これは、セマンティッククラスターが人間が単一名詞でラベル付けする概念に対応する傾向があることを示しています。画像と文を共通の空間にマッピングする事前トレーニング済みのネットワークを利用することにより、制約付き最適化タスクを取得する前にこれを課します。私たちの定式化が施設の場所の問題の特殊なケースであることを示し、この最適化タスクを大規模に解決するためのシンプルでありながら効果的なアプローチを紹介します。一般的に報告されているいくつかの画像クラスタリングデータセットでアプローチをテストし、既存の最良のアプローチよりも大幅な精度の向上を実現します。
Self-supervised clustering methods have achieved increasing accuracy in recent years but do not yet perform as well as supervised classification methods. This contrasts with the situation for feature learning, where self-supervised features have recently surpassed the performance of supervised features on several important tasks. We hypothesize that the performance gap is due to the difficulty of specifying, without supervision, which features correspond to class differences that are semantic to humans. To reduce the performance gap, we introduce the "single-noun" prior - which states that semantic clusters tend to correspond to concepts that humans label by a single-noun. By utilizing a pre-trained network that maps images and sentences into a common space, we impose this prior obtaining a constrained optimization task. We show that our formulation is a special case of the facility location problem, and introduce a simple-yet-effective approach for solving this optimization task at scale. We test our approach on several commonly reported image clustering datasets and obtain significant accuracy gains over the best existing approaches.
updated: Thu Apr 08 2021 17:54:37 GMT+0000 (UTC)
published: Thu Apr 08 2021 17:54:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト