ExtremeC3Net: Extreme Lightweight Portrait Segmentation Networks using Advanced C3-modules
 軽量で堅牢なポートレートセグメンテーションアルゴリズムの設計は、さまざまな顔のアプリケーションにとって重要なタスクです。ただし、問題はオブジェクトセグメンテーション問題のサブセットと見なされています。明らかに、ポートレートセグメンテーションには独自の要件があります。まず、ポートレートセグメンテーションは多くの現実世界のアプリケーションのプロセス全体の途中で実行されるため、非常に軽量なモデルが必要です。第二に、このドメインには、公平な統計を備えた十分な数の画像を含む公開データセットがありません。問題を解決するために、集中包括的畳み込みブロックに基づいた2分岐アーキテクチャで構成される、非常に軽量な新しいポートレートセグメンテーションモデルを導入します。このメソッドは、最新のポートレートセグメンテーション手法から1%のマージン内で精度を維持しながら、パラメーター数を2.1Mから37.7Kに削減します(約98.2%削減)。 EG1800データセットに関する定性的および定量的分析では、この方法が既存のさまざまな軽量セグメンテーションモデルよりも優れていることを示しています。次に、EG1800データセットの精度を向上させることができる追加のポートレートセグメンテーションデータを作成する簡単な方法を提案します。また、人種、性別、年齢を独自に追加で注釈することにより、パブリックデータセットのバイアスを分析します。拡張データセット、追加の注釈、およびコードはで入手できます。
Designing a lightweight and robust portrait segmentation algorithm is an important task for a wide range of face applications. However, the problem has been considered as a subset of the object segmentation problem. bviously, portrait segmentation has its unique requirements. First, because the portrait segmentation is performed in the middle of a whole process of many realworld applications, it requires extremely lightweight models. Second, there has not been any public datasets in this domain that contain a sufficient number of images with unbiased statistics. To solve the problems, we introduce a new extremely lightweight portrait segmentation model consisting of a two-branched architecture based on the concentrated-comprehensive convolutions block. Our method reduces the number of parameters from 2.1M to 37.7K (around 98.2% reduction), while maintaining the accuracy within a 1% margin from the state-of-the-art portrait segmentation method. In our qualitative and quantitative analysis on the EG1800 dataset, we show that our method outperforms various existing lightweight segmentation models. Second, we propose a simple method to create additional portrait segmentation data which can improve accuracy on the EG1800 dataset. Also, we analyze the bias in public datasets by additionally annotating race, gender, and age on our own. The augmented dataset, the additional annotations and code are available in .
