arXiv reaDer
UniHCP: 人間中心の認識のための統一モデル
UniHCP: A Unified Model for Human-Centric Perceptions
人間中心の知覚 (ポーズ推定、人間の解析、歩行者の検出、人物の再識別など) は、視覚モデルの産業用アプリケーションで重要な役割を果たします。特定の人間中心のタスクには、焦点を当てるべき独自の関連するセマンティックな側面がありますが、それらは人体の同じ基本的なセマンティック構造も共有しています。ただし、そのような均一性を利用して、人間中心のタスクの一般的な提案モデルを設計しようとした研究はほとんどありません。この作業では、幅広い人間中心のタスクを再検討し、最小限の方法でそれらを統合します。私たちは、人間中心の知覚のための統合モデルである UniHCP を提案します。これは、単純化されたエンド ツー エンドの方法で、単純なビジョン トランスフォーマー アーキテクチャを使用して、幅広い人間中心のタスクを統合します。 33 の人間中心のデータセットに対する大規模な共同トレーニングにより、UniHCP は直接評価することで、いくつかのドメイン内およびダウンストリーム タスクで強力なベースラインを上回ることができます。特定のタスクに適応すると、UniHCP は幅広い人間中心のタスクで新しい SOTA を達成します。たとえば、CIHP で人間による解析で 69.8 mIoU、属性予測で PA-100K で 86.18 mA、ReID で Market1501 で 90.3 mAP、85.8 などです。歩行者検出のための CrowdHuman 上の JI は、各タスクに合わせて調整された特殊なモデルよりも優れたパフォーマンスを発揮します。
Human-centric perceptions (e.g., pose estimation, human parsing, pedestrian detection, person re-identification, etc.) play a key role in industrial applications of visual models. While specific human-centric tasks have their own relevant semantic aspect to focus on, they also share the same underlying semantic structure of the human body. However, few works have attempted to exploit such homogeneity and design a general-propose model for human-centric tasks. In this work, we revisit a broad range of human-centric tasks and unify them in a minimalist manner. We propose UniHCP, a Unified Model for Human-Centric Perceptions, which unifies a wide range of human-centric tasks in a simplified end-to-end manner with the plain vision transformer architecture. With large-scale joint training on 33 human-centric datasets, UniHCP can outperform strong baselines on several in-domain and downstream tasks by direct evaluation. When adapted to a specific task, UniHCP achieves new SOTAs on a wide range of human-centric tasks, e.g., 69.8 mIoU on CIHP for human parsing, 86.18 mA on PA-100K for attribute prediction, 90.3 mAP on Market1501 for ReID, and 85.8 JI on CrowdHuman for pedestrian detection, performing better than specialized models tailored for each task.
updated: Mon Mar 06 2023 07:10:07 GMT+0000 (UTC)
published: Mon Mar 06 2023 07:10:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト