arXiv reaDer
オブジェクト中心の学習における一般化とロバスト性の意味
Generalization and Robustness Implications in Object-Centric Learning
オブジェクト中心の表現学習の背後にある考え方は、自然のシーンは、分散表現ではなく、オブジェクトの構成とそれらの関係としてより適切にモデル化できるということです。この誘導バイアスをニューラルネットワークに注入して、複数のオブジェクトがあるシーンでのダウンストリームタスクの体系的な一般化と学習効率を潜在的に向上させることができます。このホワイトペーパーでは、5つの一般的なマルチオブジェクトデータセットで最先端の教師なしモデルをトレーニングし、セグメンテーションの精度とダウンストリームオブジェクトのプロパティ予測を評価します。さらに、単一のオブジェクトが分布していない設定(たとえば、目に見えない色、テクスチャ、形状がある)、またはシーンのグローバルプロパティが変更されている設定(たとえば、によって)を調査することにより、体系的な一般化と堅牢性を研究します。オクルージョン、トリミング、またはオブジェクトの数の増加。私たちの実験的研究から、オブジェクト中心の表現は、ダウンストリームタスクに一般的に有用であり、特にシフトが単一のオブジェクトに影響を与える場合、データ分布のシフトに対してロバストであることがわかります。
The idea behind object-centric representation learning is that natural scenes can better be modeled as compositions of objects and their relations as opposed to distributed representations. This inductive bias can be injected into neural networks to potentially improve systematic generalization and learning efficiency of downstream tasks in scenes with multiple objects. In this paper, we train state-of-the-art unsupervised models on five common multi-object datasets and evaluate segmentation accuracy and downstream object property prediction. In addition, we study systematic generalization and robustness by investigating the settings where either single objects are out-of-distribution -- e.g., having unseen colors, textures, and shapes -- or global properties of the scene are altered -- e.g., by occlusions, cropping, or increasing the number of objects. From our experimental study, we find object-centric representations to be generally useful for downstream tasks and robust to shifts in the data distribution, especially if shifts affect single objects.
updated: Thu Jul 01 2021 17:51:11 GMT+0000 (UTC)
published: Thu Jul 01 2021 17:51:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト