arXiv reaDer
CLAMP: 言語と動物のポーズを結び付けるための即時ベースの対照学習
CLAMP: Prompt-based Contrastive Learning for Connecting Language and Animal Pose
動物の姿勢推定は、トレーニング データが限られており、種内および種間の差異が大きいため、既存の画像ベースの方法では困難です。視覚言語研究の進歩を動機として、事前に訓練された言語モデル(例:CLIP)がテキスト内の動物のキーポイントを記述するための豊富な事前知識を提供することにより、動物の姿勢推定を容易にできることを提案します。しかし、動物のポーズに関するテキストベースの説明とキーポイントベースの視覚的特徴との間には大きなギャップがある可能性があるため、事前トレーニングされた言語モデルと動物の視覚的キーポイントとの間に効果的な接続を構築することは自明ではないことがわかりました。この問題に対処するために、言語と動物のポーズ (CLAMP) を効果的に結び付けるための新しいプロンプトベースの対照学習スキームを導入します。 CLAMP は、ネットワーク トレーニング中にテキスト プロンプトを動物のキーポイントに適応させることでギャップを埋めようとします。適応は空間認識プロセスと特徴認識プロセスに分解され、それに対応して 2 つの新しい対照的な損失が考案されます。実際には、CLAMP により、最初のクロスモーダル動物姿勢推定パラダイムが可能になります。実験結果は、私たちの方法が教師あり、少数ショット、ゼロショット設定の下で最先端のパフォーマンスを達成し、画像ベースの方法を大幅に上回るパフォーマンスを示していることを示しています。
Animal pose estimation is challenging for existing image-based methods because of limited training data and large intra- and inter-species variances. Motivated by the progress of visual-language research, we propose that pre-trained language models (e.g., CLIP) can facilitate animal pose estimation by providing rich prior knowledge for describing animal keypoints in text. However, we found that building effective connections between pre-trained language models and visual animal keypoints is non-trivial since the gap between text-based descriptions and keypoint-based visual features about animal pose can be significant. To address this issue, we introduce a novel prompt-based Contrastive learning scheme for connecting Language and AniMal Pose (CLAMP) effectively. The CLAMP attempts to bridge the gap by adapting the text prompts to the animal keypoints during network training. The adaptation is decomposed into spatial-aware and feature-aware processes, and two novel contrastive losses are devised correspondingly. In practice, the CLAMP enables the first cross-modal animal pose estimation paradigm. Experimental results show that our method achieves state-of-the-art performance under the supervised, few-shot, and zero-shot settings, outperforming image-based methods by a large margin.
updated: Mon Jun 26 2023 00:46:10 GMT+0000 (UTC)
published: Thu Jun 23 2022 14:51:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト