arXiv reaDer
顔セグメンテーションのためのパラメータ効率の良いローカル陰的イメージ関数ネットワーク
Parameter Efficient Local Implicit Image Function Network for Face Segmentation
顔の解析は、人間の顔を含む画像のピクセル単位のラベル付けとして定義されます。ラベルは、目、唇、鼻、髪などの重要な顔の領域を識別するために定義されています。 FP-LIIF。畳み込みエンコーダーとピクセル MLP デコーダーを備えたシンプルなアーキテクチャを提案します。これは、最先端のモデルと比較して 1/26 のパラメーターを使用し、複数のデータセットで最先端のモデルに匹敵するか、それよりも優れています。 CelebAMask-HQやLaPaなど。事前トレーニングは一切使用せず、他の作品と比較して、ネットワークは入力解像度を変更することなく、さまざまな解像度でセグメンテーションを生成することもできます。この作業により、FPS が高くモデルサイズが小さいため、低コンピューティングまたは低帯域幅のデバイスで顔のセグメンテーションを使用できるようになります。
Face parsing is defined as the per-pixel labeling of images containing human faces. The labels are defined to identify key facial regions like eyes, lips, nose, hair, etc. In this work, we make use of the structural consistency of the human face to propose a lightweight face-parsing method using a Local Implicit Function network, FP-LIIF. We propose a simple architecture having a convolutional encoder and a pixel MLP decoder that uses 1/26th number of parameters compared to the state-of-the-art models and yet matches or outperforms state-of-the-art models on multiple datasets, like CelebAMask-HQ and LaPa. We do not use any pretraining, and compared to other works, our network can also generate segmentation at different resolutions without any changes in the input resolution. This work enables the use of facial segmentation on low-compute or low-bandwidth devices because of its higher FPS and smaller model size.
updated: Mon Mar 27 2023 11:50:27 GMT+0000 (UTC)
published: Mon Mar 27 2023 11:50:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト