arXiv reaDer
DASNet: Reducing Pixel-level Annotations for Instance and Semantic Segmentation
 ピクセルレベルの注釈は、人間の労力を必要とし、通常はそのようなトレーニングデータの恩恵を受けるディープネットワークのパフォーマンスを制限します。この作業では、ピクセルレベルのマスクアノテーションの小さなセットとボックスアノテーションの大きなセットで、高品質のインスタンスおよびセマンティックセグメンテーション結果を達成することを目指しています。基本的な考え方は、ピクセルレベルの教師付き学習タスクを簡素化し、マスクアノテーションの必要量を削減するために検出モデルを探索することです。 DASNetという名前のアーキテクチャは、検出、アテンション、およびセグメンテーションの3つのモジュールで構成されています。検出モジュールはオブジェクトのすべてのクラスを検出し、アテンションモジュールはマルチスケールクラス固有の機能を生成し、セグメンテーションモジュールはバイナリマスクを回復します。私たちの方法は、PASCAL VOC 2012データセットの既存の半教師ありアプローチと比較して、大幅に改善されたパフォーマンスを示しています。
Pixel-level annotation demands expensive human efforts and limits the performance of deep networks that usually benefits from more such training data. In this work we aim to achieve high quality instance and semantic segmentation results over a small set of pixel-level mask annotations and a large set of box annotations. The basic idea is exploring detection models to simplify the pixel-level supervised learning task and thus reduce the required amount of mask annotations. Our architecture, named DASNet, consists of three modules: detection, attention, and segmentation. The detection module detects all classes of objects, the attention module generates multi-scale class-specific features, and the segmentation module recovers the binary masks. Our method demonstrates substantially improved performance compared to existing semi-supervised approaches on PASCAL VOC 2012 dataset.
updated: Fri Jan 31 2020 18:07:53 GMT+0000 (UTC)
published: Mon Sep 17 2018 04:23:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト