arXiv reaDer
UPAR: 統合された歩行者属性認識と人物検索
UPAR: Unified Pedestrian Attribute Recognition and Person Retrieval
歩行者のソフト バイオメトリック属性を認識することは、ビデオ監視やファッション検索に不可欠です。最近の研究では、単一のデータセットで有望な結果が示されています。それにもかかわらず、現在のデータセットの強いバイアスとさまざまな属性のために、さまざまな属性分布、視点、さまざまな照明、および低解像度の下でのこれらの方法の一般化能力はほとんど理解されていません。このギャップを埋め、体系的な調査をサポートするために、UPAR (Unified Person Attribute Recognition Dataset) を提示します。これは、PA100K、PETA、RAPv2、Market1501 の 4 つの有名な人物属性認識データセットに基づいています。データセット全体で 12 の属性カテゴリにわたって 40 の重要なバイナリ属性を調和させるために、3,3M の追加の注釈を提供することにより、これらのデータセットを統合します。これにより、一般化可能な歩行者属性認識と属性ベースの人物検索に関する研究が初めて可能になります。画像の分布、歩行者のポーズ、スケール、およびオクルージョンが大きく異なるため、既存のアプローチは精度と効率の両方の点で大きな課題となっています。さらに、正規化方法の徹底的な分析に基づいて、PAR および属性ベースの個人検索の強力なベースラインを開発します。当社のモデルは、PA100k、PETA、RAPv2、Market1501-Attributes、および UPAR のクロスドメインおよび専門化設定で最先端のパフォーマンスを実現します。 UPAR と当社の強力なベースラインが人工知能コミュニティに貢献し、大規模で一般化可能な属性認識システムの研究を促進すると確信しています。
Recognizing soft-biometric pedestrian attributes is essential in video surveillance and fashion retrieval. Recent works show promising results on single datasets. Nevertheless, the generalization ability of these methods under different attribute distributions, viewpoints, varying illumination, and low resolutions remains rarely understood due to strong biases and varying attributes in current datasets. To close this gap and support a systematic investigation, we present UPAR, the Unified Person Attribute Recognition Dataset. It is based on four well-known person attribute recognition datasets: PA100K, PETA, RAPv2, and Market1501. We unify those datasets by providing 3,3M additional annotations to harmonize 40 important binary attributes over 12 attribute categories across the datasets. We thus enable research on generalizable pedestrian attribute recognition as well as attribute-based person retrieval for the first time. Due to the vast variance of the image distribution, pedestrian pose, scale, and occlusion, existing approaches are greatly challenged both in terms of accuracy and efficiency. Furthermore, we develop a strong baseline for PAR and attribute-based person retrieval based on a thorough analysis of regularization methods. Our models achieve state-of-the-art performance in cross-domain and specialization settings on PA100k, PETA, RAPv2, Market1501-Attributes, and UPAR. We believe UPAR and our strong baseline will contribute to the artificial intelligence community and promote research on large-scale, generalizable attribute recognition systems.
updated: Tue Sep 06 2022 14:20:56 GMT+0000 (UTC)
published: Tue Sep 06 2022 14:20:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト