arXiv reaDer
MODNet:リアルタイムTrimap-客観的な分解による無料のポートレートマット
MODNet: Real-Time Trimap-Free Portrait Matting via Objective Decomposition
既存のポートレートマット方法では、取得にコストがかかる補助入力が必要になるか、計算コストがかかる複数のステージが必要になるため、リアルタイムアプリケーションにはあまり適していません。この作業では、単一の入力画像を使用してリアルタイムでポートレートマットを作成するための軽量マット客観的分解ネットワーク(MODNet)を紹介します。効率的な設計の背後にある重要なアイデアは、明示的な制約を介して一連のサブ目的を同時に最適化することです。さらに、MODNetには、モデルの効率と堅牢性を向上させるための2つの新しい手法が含まれています。最初に、効率的なAtrous Spatial Pyramid Pooling(e-ASPP)モジュールが導入され、セマンティック推定のためのマルチスケール機能が融合されます。次に、MODNetを実世界のデータに適合させて、トライマップのない方法に共通するドメインシフトの問題に対処するために、自己監視サブオブジェクト整合性(SOC)戦略が提案されます。 MODNetは、エンドツーエンドの方法で簡単にトレーニングできます。同時期の方法よりもはるかに高速で、1080TiGPUで毎秒67フレームで実行されます。実験によると、MODNetは、Adobe Matting Datasetと、私たちが提案した慎重に設計された写真ポートレートマット(PPM-100)ベンチマークの両方で、以前のトライマップフリーの方法を大幅に上回っています。さらに、MODNetは毎日の写真やビデオで驚くべき結果を達成しています。コードとモデルはhttps://github.com/ZHKKKe/MODNetで入手でき、PPM-100ベンチマークはhttps://github.com/ZHKKKe/PPMでリリースされています。
Existing portrait matting methods either require auxiliary inputs that are costly to obtain or involve multiple stages that are computationally expensive, making them less suitable for real-time applications. In this work, we present a light-weight matting objective decomposition network (MODNet) for portrait matting in real-time with a single input image. The key idea behind our efficient design is by optimizing a series of sub-objectives simultaneously via explicit constraints. In addition, MODNet includes two novel techniques for improving model efficiency and robustness. First, an Efficient Atrous Spatial Pyramid Pooling (e-ASPP) module is introduced to fuse multi-scale features for semantic estimation. Second, a self-supervised sub-objectives consistency (SOC) strategy is proposed to adapt MODNet to real-world data to address the domain shift problem common to trimap-free methods. MODNet is easy to be trained in an end-to-end manner. It is much faster than contemporaneous methods and runs at 67 frames per second on a 1080Ti GPU. Experiments show that MODNet outperforms prior trimap-free methods by a large margin on both Adobe Matting Dataset and a carefully designed photographic portrait matting (PPM-100) benchmark proposed by us. Further, MODNet achieves remarkable results on daily photos and videos. Our code and models are available at https://github.com/ZHKKKe/MODNet, and the PPM-100 benchmark is released at https://github.com/ZHKKKe/PPM.
updated: Fri Mar 18 2022 04:49:53 GMT+0000 (UTC)
published: Tue Nov 24 2020 08:38:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト