オブジェクトのセグメンテーションは、画像と対応するオブジェクトマスクの両方で構成される非常に大きなデータセットに対して教師付き学習アプローチを使用することで通常解決される重要な問題です。マスクはピクセルレベルで提供する必要があるため、新しいドメイン用のそのようなデータセットの構築には非常に時間がかかる可能性があります。注釈なしで監視なしの方法で画像からオブジェクトを抽出できる新しいモデルであるReDOを紹介します。データセットの全体的な分布を変更することなく、オブジェクトのテクスチャまたは色を変更することが可能であるべきであるという考えに依存しています。この仮定に従って、私たちのアプローチは、ジェネレーターが入力サンプルによって誘導される敵対的アーキテクチャに基づいています。画像が与えられると、オブジェクトマスクを抽出し、同じ場所に新しいオブジェクトを再描画します。ジェネレーターは、生成された画像の分布が元の画像と一致することを保証する弁別器によって制御されます。さまざまなデータセットでこの方法を試し、抽出されたマスクの品質が良いことを実証します。
Object segmentation is a crucial problem that is usually solved by using supervised learning approaches over very large datasets composed of both images and corresponding object masks. Since the masks have to be provided at pixel level, building such a dataset for any new domain can be very time-consuming. We present ReDO, a new model able to extract objects from images without any annotation in an unsupervised way. It relies on the idea that it should be possible to change the textures or colors of the objects without changing the overall distribution of the dataset. Following this assumption, our approach is based on an adversarial architecture where the generator is guided by an input sample: given an image, it extracts the object mask, then redraws a new object at the same location. The generator is controlled by a discriminator that ensures that the distribution of generated images is aligned to the original one. We experiment with this method on different datasets and demonstrate the good quality of extracted masks.