arXiv reaDer
ポイントセットとセンターベースのオフセットによる単一段階のマルチヒューマン解析
Single-stage Multi-human Parsing via Point Sets and Center-based Offsets
この作品は、複数人の解析問題を研究しています。トップダウンまたはボトムアップの 2 段階パラダイムに従う既存の方法は、通常、高価な計算コストを伴います。代わりに、高性能なシングル ステージ マルチヒューマン解析 (SMP) ディープ アーキテクチャを提示します。これは、マルチヒューマン解析の問題を 2 つのきめの細かいサブ問題、つまり人体と部位の位置を特定する問題に分離します。 SMP は、重心位置のポイント フィーチャを利用してセグメンテーションを取得し、人体の重心からパーツの重心までの一連のオフセットを生成することで、グループ化プロセスなしで人体とパーツのマッチングを実行します。 SMP アーキテクチャ内で、生成されたマスク アテンションを通じてインスタンスのグローバルな特徴を抽出する Refined Feature Retain モジュールと、トレーニング可能なプラグイン モジュールとして Mask of Interest Reclassify モジュールを提案し、予測されたセグメンテーションで分類結果を絞り込みます。 MHPv2.0 データセットでの広範な実験により、提案された方法の最高の有効性と効率が実証され、最先端の方法を AP50p で 2.1%、APvolp で 1.0%、PCP50 で 1.2% 上回っています。特に、提案された方法では、必要なトレーニング エポックが少なくなり、モデル アーキテクチャも複雑になりません。さらなる研究を促進するために、ソース コード、事前トレーニング済みのモデル、およびオンライン デモをリリースします。
This work studies the multi-human parsing problem. Existing methods, either following top-down or bottom-up two-stage paradigms, usually involve expensive computational costs. We instead present a high-performance Single-stage Multi-human Parsing (SMP) deep architecture that decouples the multi-human parsing problem into two fine-grained sub-problems, i.e., locating the human body and parts. SMP leverages the point features in the barycenter positions to obtain their segmentation and then generates a series of offsets from the barycenter of the human body to the barycenters of parts, thus performing human body and parts matching without the grouping process. Within the SMP architecture, we propose a Refined Feature Retain module to extract the global feature of instances through generated mask attention and a Mask of Interest Reclassify module as a trainable plug-in module to refine the classification results with the predicted segmentation. Extensive experiments on the MHPv2.0 dataset demonstrate the best effectiveness and efficiency of the proposed method, surpassing the state-of-the-art method by 2.1% in AP50p, 1.0% in APvolp, and 1.2% in PCP50. In particular, the proposed method requires fewer training epochs and a less complex model architecture. We will release our source codes, pretrained models, and online demos to facilitate further studies.
updated: Sat Apr 22 2023 09:30:50 GMT+0000 (UTC)
published: Sat Apr 22 2023 09:30:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト