arXiv reaDer
顔解析のための循環的自己調整を伴う分離マルチタスク学習
Decoupled Multi-task Learning with Cyclical Self-Regulation for Face Parsing
このホワイトペーパーでは、顔の解析における既存の最先端の方法によって生成される典型的な障害のケース(たとえば、空間的な不整合や境界の混乱)の背後にある固有の要因を調査します。これらの問題に取り組むために、我々は、顔の構文解析のための循環的自己調整(DML-CSR)を備えた新しい分離マルチタスク学習を提案します。具体的には、DML-CSRは、顔の解析、バイナリエッジ、およびカテゴリエッジ検出で構成されるマルチタスクモデルを設計します。これらのタスクは、相互に高レベルの相互作用がなく、低レベルのエンコーダの重みのみを共有し、推論段階でネットワーク全体から補助モジュールを分離できるようにします。空間的な不整合に対処するために、動的な双対グラフ畳み込みネットワークを開発して、余分なプーリング操作を使用せずにグローバルなコンテキスト情報をキャプチャします。単一および複数の顔のシナリオの両方で境界の混乱を処理するために、バイナリおよびカテゴリのエッジ検出を利用して、一般的な幾何学的構造と人間の顔のきめ細かい意味的手がかりを共同で取得します。さらに、ノイズの多いラベルがトレーニング中にモデルの一般化を低下させるのを防ぐために、周期的な自己調整が提案され、いくつかのモデルインスタンスを自己アンサンブルして新しいモデルを取得し、結果のモデルを使用して、反復を交互に繰り返して後続のモデルを自己蒸留します。実験は、私たちの方法が、Helen、CelebAMask-HQ、およびLapaデータセットで新しい最先端のパフォーマンスを達成することを示しています。ソースコードはhttps://github.com/deepinsight/insightface/tree/master/parsing/dml_csrで入手できます。
This paper probes intrinsic factors behind typical failure cases (e.g. spatial inconsistency and boundary confusion) produced by the existing state-of-the-art method in face parsing. To tackle these problems, we propose a novel Decoupled Multi-task Learning with Cyclical Self-Regulation (DML-CSR) for face parsing. Specifically, DML-CSR designs a multi-task model which comprises face parsing, binary edge, and category edge detection. These tasks only share low-level encoder weights without high-level interactions between each other, enabling to decouple auxiliary modules from the whole network at the inference stage. To address spatial inconsistency, we develop a dynamic dual graph convolutional network to capture global contextual information without using any extra pooling operation. To handle boundary confusion in both single and multiple face scenarios, we exploit binary and category edge detection to jointly obtain generic geometric structure and fine-grained semantic clues of human faces. Besides, to prevent noisy labels from degrading model generalization during training, cyclical self-regulation is proposed to self-ensemble several model instances to get a new model and the resulting model then is used to self-distill subsequent models, through alternating iterations. Experiments show that our method achieves the new state-of-the-art performance on the Helen, CelebAMask-HQ, and Lapa datasets. The source code is available at https://github.com/deepinsight/insightface/tree/master/parsing/dml_csr.
updated: Mon Mar 28 2022 02:12:30 GMT+0000 (UTC)
published: Mon Mar 28 2022 02:12:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト