従来のほとんどのイメージマット方法では、入力として大まかに指定されたトライマップが必要であり、トライマップの未知の領域にあるすべてのピクセルのフラクショナルアルファ値を推定します。この論文では、粗いトライマップからアルファマットを直接推定することは以前の方法の主な制限であると主張します。それらの正確なアルファ値を推定します。 AdaMatting、この問題を2つのサブタスクに解く新しいエンドツーエンドマットフレームワークを提案します:トライマップ適応とアルファ推定。トライマップ適応は、明確な前景、背景、および半透明の画像領域を識別することにより、入力画像のグローバル構造を推測するピクセル単位の分類問題です。アルファ推定は、ブレンドされた各ピクセルの不透明度値を計算する回帰問題です。このメソッドは、これらの2つのサブタスクを単一のディープコンボリューショナルニューラルネットワーク(CNN)内で個別に処理します。広範な実験により、AdaMattingには追加の構造認識とトライマップフォールトトレランスがあることが示されています。この方法は、Adobe Composition-1kデータセットで質的および量的の両方で最先端のパフォーマンスを実現します。また、alphamatting.comのオンライン評価で一般的に使用されているすべてのメトリックの現在の最高のパフォーマンスを発揮する方法でもあります。
Most previous image matting methods require a roughly-specificed trimap as input, and estimate fractional alpha values for all pixels that are in the unknown region of the trimap. In this paper, we argue that directly estimating the alpha matte from a coarse trimap is a major limitation of previous methods, as this practice tries to address two difficult and inherently different problems at the same time: identifying true blending pixels inside the trimap region, and estimate accurate alpha values for them. We propose AdaMatting, a new end-to-end matting framework that disentangles this problem into two sub-tasks: trimap adaptation and alpha estimation. Trimap adaptation is a pixel-wise classification problem that infers the global structure of the input image by identifying definite foreground, background, and semi-transparent image regions. Alpha estimation is a regression problem that calculates the opacity value of each blended pixel. Our method separately handles these two sub-tasks within a single deep convolutional neural network (CNN). Extensive experiments show that AdaMatting has additional structure awareness and trimap fault-tolerance. Our method achieves the state-of-the-art performance on Adobe Composition-1k dataset both qualitatively and quantitatively. It is also the current best-performing method on the alphamatting.com online evaluation for all commonly-used metrics.