arXiv reaDer
CIGMO:深い生成フレームワークにおけるカテゴリー不変表現
CIGMO: Categorical invariant representations in a deep generative framework
一般的なオブジェクト画像のデータには、2つの最も一般的な構造があります。(1)特定の形状の各オブジェクトを複数の異なるビューでレンダリングできること、および(2)形状の多様性がはるかに大きくなるようにオブジェクトの形状を分類できることです。カテゴリ内よりもカテゴリ間。既存の深層生成モデルは通常、どちらかの構造をキャプチャできますが、両方をキャプチャすることはできません。この作業では、画像データからカテゴリ、形状、および形態係数を表すことを学習できる、CIGMOと呼ばれる新しい深層生成モデルを紹介します。モデルは、それぞれが特定のカテゴリに特化し、ビュー表現から解き放たれた形状表現の複数のモジュールで構成されており、グループベースの弱教師あり学習方法を使用して学習できます。経験的調査により、私たちのモデルは、ビューの変動が大きいにもかかわらず、オブジェクト形状のカテゴリを効果的に発見でき、最先端の不変クラスタリングアルゴリズムを含むさまざまな以前の方法に定量的に取って代わることができることを示します。さらに、カテゴリスペシャライゼーションを使用したアプローチにより、学習した形状表現を強化して、ワンショットオブジェクトの識別や形状ビューの解きほぐしなどのダウンストリームタスクをより適切に実行できることを示します。
Data of general object images have two most common structures: (1) each object of a given shape can be rendered in multiple different views, and (2) shapes of objects can be categorized in such a way that the diversity of shapes is much larger across categories than within a category. Existing deep generative models can typically capture either structure, but not both. In this work, we introduce a novel deep generative model, called CIGMO, that can learn to represent category, shape, and view factors from image data. The model is comprised of multiple modules of shape representations that are each specialized to a particular category and disentangled from view representation, and can be learned using a group-based weakly supervised learning method. By empirical investigation, we show that our model can effectively discover categories of object shapes despite large view variation and quantitatively supersede various previous methods including the state-of-the-art invariant clustering algorithm. Further, we show that our approach using category-specialization can enhance the learned shape representation to better perform down-stream tasks such as one-shot object identification as well as shape-view disentanglement.
updated: Fri May 27 2022 04:21:22 GMT+0000 (UTC)
published: Fri May 27 2022 04:21:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト