arXiv reaDer
リージョンおよびボックスレベルのアノテーションを使用した顕著なインスタンスのセグメンテーション
Salient Instance Segmentation with Region and Box-level Annotations
顕著なインスタンスのセグメンテーションは、顕著性の検出領域で広く注目された新しい挑戦的なタスクです。新世代の顕著性検出は、ビデオ監視の強力な理論的および技術的基盤を提供します。既存のデータセットの規模が限られており、マスクアノテーションのコストが高いため、パフォーマンスの高い顕著なインスタンスモデルをトレーニングするには、多くの監視ソースが緊急に必要です。この論文では、面倒なラベリングに頼ることなく、不正確な監視によって新しい顕著なインスタンスセグメンテーションフレームワークをトレーニングすることを目指しています。この目的のために、我々は、既製の顕著なオブジェクト検出データセットからの顕著な領域と境界ボックスの組み合わせによって監視される循環グローバルコンテキスト顕著なインスタンスセグメンテーションネットワーク(CGCNet)を提示します。顕著なインスタンスをより正確に特定するために、関心領域(ROI)の特徴をシーン内のグローバルコンテキストに拡張するグローバル特徴精製レイヤーが提案されています。一方、ラベリング更新スキームは、次の反復のために粗粒度のラベルを更新するために、提案されたフレームワークに組み込まれています。実験結果は、不正確な教師ありアノテーションによってトレーニングされた提案されたエンドツーエンドのフレームワークが、既存の完全に教師ありの顕著なインスタンスセグメンテーション方法と競合する可能性があることを示しています。ベルとホイッスルがない場合、提案された方法は、Dataset1Kのテストセットで58.3%のマスクAPを達成し、主流の最先端の方法を上回ります。
Salient instance segmentation is a new challenging task that received widespread attention in the saliency detection area. The new generation of saliency detection provides a strong theoretical and technical basis for video surveillance. Due to the limited scale of the existing dataset and the high mask annotations cost, plenty of supervision source is urgently needed to train a well-performing salient instance model. In this paper, we aim to train a novel salient instance segmentation framework by an inexact supervision without resorting to laborious labeling. To this end, we present a cyclic global context salient instance segmentation network (CGCNet), which is supervised by the combination of salient regions and bounding boxes from the ready-made salient object detection datasets. To locate salient instance more accurately, a global feature refining layer is proposed that dilates the features of the region of interest (ROI) to the global context in a scene. Meanwhile, a labeling updating scheme is embedded in the proposed framework to update the coarse-grained labels for next iteration. Experiment results demonstrate that the proposed end-to-end framework trained by inexact supervised annotations can be competitive to the existing fully supervised salient instance segmentation methods. Without bells and whistles, our proposed method achieves a mask AP of 58.3% in the test set of Dataset1K that outperforms the mainstream state-of-the-art methods.
updated: Wed Apr 28 2021 07:38:49 GMT+0000 (UTC)
published: Wed Aug 19 2020 03:43:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト