DatasetGAN: Efficient Labeled Data Factory with Minimal Human Effort
DatasetGANを紹介します。これは、最小限の人的労力で、意味的にセグメント化された高品質の画像の大規模なデータセットを生成する自動手順です。現在のディープネットワークは非常にデータを大量に消費しており、注釈を付けるのに時間がかかる大規模なデータセットのトレーニングの恩恵を受けています。私たちの方法は、現実的な画像を生成するために最近のGANの力に依存しています。 GAN潜在コードをデコードして、画像のセマンティックセグメンテーションを生成する方法を示します。デコーダーのトレーニングには、潜在空間の残りの部分に一般化するためにいくつかのラベル付きの例が必要なだけであり、無限の注釈付きデータセットジェネレーターになります!これらの生成されたデータセットは、実際のデータセットと同じように、コンピュータビジョンアーキテクチャのトレーニングに使用できます。手動でセグメント化する必要がある画像はごくわずかであるため、画像に非常に詳細に注釈を付け、豊富なオブジェクトとパーツのセグメント化を使用してデータセットを生成することが可能になります。私たちのアプローチの力を示すために、34の人間の顔の部分と32の自動車の部分のピクセルレベルのラベルを含む7つの画像セグメンテーションタスクのデータセットを生成しました。私たちのアプローチは、すべての半教師ありベースラインを大幅に上回り、完全に教師ありの方法と同等です。完全に教師ありの方法では、場合によっては、私たちの方法の100倍もの注釈付きデータが必要になります。
We introduce DatasetGAN: an automatic procedure to generate massive datasets of high-quality semantically segmented images requiring minimal human effort. Current deep networks are extremely data-hungry, benefiting from training on large-scale datasets, which are time consuming to annotate. Our method relies on the power of recent GANs to generate realistic images. We show how the GAN latent code can be decoded to produce a semantic segmentation of the image. Training the decoder only needs a few labeled examples to generalize to the rest of the latent space, resulting in an infinite annotated dataset generator! These generated datasets can then be used for training any computer vision architecture just as real datasets are. As only a few images need to be manually segmented, it becomes possible to annotate images in extreme detail and generate datasets with rich object and part segmentations. To showcase the power of our approach, we generated datasets for 7 image segmentation tasks which include pixel-level labels for 34 human face parts, and 32 car parts. Our approach outperforms all semi-supervised baselines significantly and is on par with fully supervised methods, which in some cases require as much as 100x more annotated data as our method.
updated: Tue Apr 13 2021 20:08:29 GMT+0000 (UTC)
published: Tue Apr 13 2021 20:08:29 GMT+0000 (UTC)
