このペーパーは、すべてのオブジェクトインスタンスとスタッフ領域のセグメンテーションマスクとクラスラベルに注釈を付ける必要がある、パノプティックセグメンテーションの画像に注釈を付ける時間を削減することを目的としています。私たちのアプローチは、事前に定義されたセグメントのプールを使用して、順番に画像に注釈を付けるアノテーターと自動アシスタントの間のコラボレーションプロセスとして定式化されています。アノテーターによって実行されるアクションは、強力なコンテキストシグナルとして機能します。アシスタントは、画像の他の部分に独自に注釈を付けることにより、この信号にインテリジェントに反応します。これにより、注釈に必要な作業量が削減されます。 COCOパノプティックデータセットに対して、シミュレーションと人間のアノテーターの両方で徹底的な実験を行います。これらは、私たちのアプローチが[4]の最近の機械支援インターフェースよりも大幅に速く、手動のポリゴン描画よりも2.4倍から5倍速いことを示しています。最後に、このメソッドを使用して、非常に少量の注釈付きデータからブートストラップし、新しいデータセットに効率的に注釈を付けることができることをADE20kに示します。
This paper aims to reduce the time to annotate images for panoptic segmentation, which requires annotating segmentation masks and class labels for all object instances and stuff regions. We formulate our approach as a collaborative process between an annotator and an automated assistant who take turns to jointly annotate an image using a predefined pool of segments. Actions performed by the annotator serve as a strong contextual signal. The assistant intelligently reacts to this signal by annotating other parts of the image on its own, which reduces the amount of work required by the annotator. We perform thorough experiments on the COCO panoptic dataset, both in simulation and with human annotators. These demonstrate that our approach is significantly faster than the recent machine-assisted interface of [4], and 2.4x to 5x faster than manual polygon drawing. Finally, we show on ADE20k that our method can be used to efficiently annotate new datasets, bootstrapping from a very small amount of annotated data.