arXiv reaDer
タスク間の一貫性正則化による単一段階のオープンワールド インスタンス セグメンテーション
Single-Stage Open-world Instance Segmentation with Cross-task Consistency Regularization
Open-World インスタンス セグメンテーション (OWIS) は、クラスに依存しないオブジェクト インスタンスを画像からセグメント化することを目的とした新しい研究トピックです。主流のアプローチでは、2 段階のセグメンテーション フレームワークを使用します。このフレームワークでは、最初にオブジェクトの境界ボックスの候補を特定し、次にインスタンスのセグメンテーションを実行します。この作業では、代わりに OWIS の単一段階のフレームワークを推進します。シングル ステージ フレームワークでのエンドツーエンドのトレーニング プロセスは、クラスに依存しないオブジェクト ピクセルのローカリゼーションを直接正則化するのにより便利であると主張します。単一段階のインスタンス セグメンテーション フレームワークに基づいて、前景ピクセルを予測し、インスタンス セグメンテーションとの関係を使用してクロスタスクの一貫性の損失を構築する正則化モデルを提案します。このような一貫性の喪失が、既存の OWIS データセットに共通の問題である不完全なインスタンス アノテーションの問題を軽減できることを示します。また、提案された損失が、一部の画像ですべてのオブジェクト注釈が存在しないという極端なケースと見なすことができる、半教師あり OWIS に対する効果的なソリューションに役立つことも示します。私たちの広範な実験は、提案された方法が完全教師ありおよび半教師ありの設定の両方で印象的な結果を達成することを示しています。 SOTA メソッドと比較して、提案されたメソッドは AP_100 スコアを UVO→UVO 設定で 4.75%、COCO→UVO 設定で 4.05% 大幅に改善します。半教師あり学習の場合、私たちのモデルは 30% のラベル付きデータのみで学習し、50% のラベル付きデータで完全に教師ありのモデルよりも優れています。コードは近日公開予定です。
Open-World Instance Segmentation (OWIS) is an emerging research topic that aims to segment class-agnostic object instances from images. The mainstream approaches use a two-stage segmentation framework, which first locates the candidate object bounding boxes and then performs instance segmentation. In this work, we instead promote a single-stage framework for OWIS. We argue that the end-to-end training process in the single-stage framework can be more convenient for directly regularizing the localization of class-agnostic object pixels. Based on the single-stage instance segmentation framework, we propose a regularization model to predict foreground pixels and use its relation to instance segmentation to construct a cross-task consistency loss. We show that such a consistency loss could alleviate the problem of incomplete instance annotation -- a common problem in the existing OWIS datasets. We also show that the proposed loss lends itself to an effective solution to semi-supervised OWIS that could be considered an extreme case that all object annotations are absent for some images. Our extensive experiments demonstrate that the proposed method achieves impressive results in both fully-supervised and semi-supervised settings. Compared to SOTA methods, the proposed method significantly improves the AP_100 score by 4.75% in UVO→UVO setting and 4.05% in COCO→UVO setting. In the case of semi-supervised learning, our model learned with only 30% labeled data, even outperforms its fully-supervised counterpart with 50% labeled data. The code will be released soon.
updated: Tue Oct 18 2022 15:53:31 GMT+0000 (UTC)
published: Thu Aug 18 2022 18:55:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト