arXiv reaDer
人間の構文解析のための品質を意識したネットワーク
Quality-Aware Network for Human Parsing
ネットワーク出力の品質をどのように推定するかは重要な問題であり、現在、人間の構文解析の分野で効果的な解決策はありません。この問題を解決するために、本研究では、出力確率マップに基づく統計的手法を提案し、ピクセルスコアと呼ばれるピクセル品質情報を計算します。さらに、Quality-Aware Module(QAM)は、さまざまな品質情報を融合するために提案されています。その目的は、人間の解析結果の品質を推定することです。 QAMを簡潔で効果的なネットワーク設計と組み合わせて、人間の構文解析用のQuality-Aware Network(QANet)を提案します。 QAMとQANetの優位性の恩恵を受けて、CIHP、MHP-v2、Pascal-Person-Part、LIPを含む3つの複数および1つの単一の人間解析ベンチマークで最高のパフォーマンスを達成します。 QAMは、トレーニングと推論の時間を増やすことなく、複数の人間による解析タスクでAP ^ r基準を10ポイント以上改善します。 QAMは、インスタンスのセグメンテーションなど、高品質の見積もりを使用して他のタスクに拡張できます。具体的には、QAMはCOCOおよびLVISv1.0データセットでマスクR-CNNを最大1%mAP改善します。提案されたQAMとQANetに基づいて、システム全体がCVPR2019 COCO DensePoseチャレンジで1位、CVPR2020LIPチャレンジのトラック1と2で1位を獲得しました。コードとモデルはhttps://github.com/soeaver/QANetで入手できます。
How to estimate the quality of the network output is an important issue, and currently there is no effective solution in the field of human parsing. In order to solve this problem, this work proposes a statistical method based on the output probability map to calculate the pixel quality information, which is called pixel score. In addition, the Quality-Aware Module (QAM) is proposed to fuse the different quality information, the purpose of which is to estimate the quality of human parsing results. We combine QAM with a concise and effective network design to propose Quality-Aware Network (QANet) for human parsing. Benefiting from the superiority of QAM and QANet, we achieve the best performance on three multiple and one single human parsing benchmarks, including CIHP, MHP-v2, Pascal-Person-Part and LIP. Without increasing the training and inference time, QAM improves the AP^r criterion by more than 10 points in the multiple human parsing task. QAM can be extended to other tasks with good quality estimation, e.g. instance segmentation. Specifically, QAM improves Mask R-CNN by ~1% mAP on COCO and LVISv1.0 datasets. Based on the proposed QAM and QANet, our overall system wins 1st place in CVPR2019 COCO DensePose Challenge, and 1st place in Track 1 & 2 of CVPR2020 LIP Challenge. Code and models are available at https://github.com/soeaver/QANet.
updated: Wed Mar 10 2021 11:17:40 GMT+0000 (UTC)
published: Wed Mar 10 2021 11:17:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト