arXiv reaDer
階層的自己監視を使用したインスタンスセグメンテーションにおけるロングテールの教師なし発見
Unsupervised Discovery of the Long-Tail in Instance Segmentation Using Hierarchical Self-Supervision
インスタンスのセグメンテーションは、コンピュータビジョンのアクティブなトピックであり、通常、オブジェクトレベルのマスクで構成される非常に大きなデータセットに対して教師あり学習アプローチを使用することで解決されます。新しいドメインのこのようなデータセットを取得することは、非常に費用と時間がかかる可能性があります。さらに、特定の注釈付きカテゴリでトレーニングされたモデルは、目に見えないオブジェクトにうまく一般化されません。この論文の目的は、マスクされた領域のインスタンス埋め込みを学習することにより、インスタンスのセグメンテーションでロングテールカテゴリの教師なし発見を実行できる方法を提案することです。画像内のオブジェクト間の豊富な関係と階層構造を活用して、マスクの埋め込みを学習するための自己教師あり損失を提案します。ロングテールオブジェクトの追加の注釈なしでCOCOデータセットでトレーニングされたこのモデルは、COCOの一般的なカテゴリよりも斬新できめの細かいオブジェクトを検出できます。モデルは、監視および部分的に監視された方法と比較して、LVISで競争力のある定量的結果を達成することを示します。
Instance segmentation is an active topic in computer vision that is usually solved by using supervised learning approaches over very large datasets composed of object level masks. Obtaining such a dataset for any new domain can be very expensive and time-consuming. In addition, models trained on certain annotated categories do not generalize well to unseen objects. The goal of this paper is to propose a method that can perform unsupervised discovery of long-tail categories in instance segmentation, through learning instance embeddings of masked regions. Leveraging rich relationship and hierarchical structure between objects in the images, we propose self-supervised losses for learning mask embeddings. Trained on COCO dataset without additional annotations of the long-tail objects, our model is able to discover novel and more fine-grained objects than the common categories in COCO. We show that the model achieves competitive quantitative results on LVIS as compared to the supervised and partially supervised methods.
updated: Fri Apr 02 2021 22:05:03 GMT+0000 (UTC)
published: Fri Apr 02 2021 22:05:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト