arXiv reaDer
再帰的ニューラルプログラム:画像文法と部分全体の階層の変分学習
Recursive Neural Programs: Variational Learning of Image Grammars and Part-Whole Hierarchies
人間の視覚には、部分全体の階層に基づく構造化された表現を使用して、オブジェクトとシーンを解析および表現することが含まれます。コンピュータビジョンと機械学習の研究者は最近、カプセルネットワーク、参照フレーム、アクティブな予測コーディングを使用してこの機能をエミュレートしようとしましたが、生成モデルの定式化が不足しています。再帰的ニューラルプログラム(RNP)を紹介します。これは、私たちの知る限り、部分全体の階層学習問題に対処する最初のニューラル生成モデルです。 RNPは、画像を確率的感覚運動プログラムの階層ツリーとしてモデル化し、学習した感覚運動プリミティブを再帰的に再利用して、異なる参照フレーム内の画像をモデル化し、再帰的な画像文法を形成します。 RNPを推論とサンプリング用の構造化変分オートエンコーダー(sVAE)として表現し、MNIST、Omniglot、Fashion-MNISTデータセットのパーツベースの解析、サンプリング、ワンショット転送学習を示し、モデルの表現力を示します。私たちの結果は、RNPがオブジェクトとシーンを構成する直感的で説明可能な方法を提供し、部分全体の階層の観点からオブジェクトの豊富な構成性と直感的な解釈を可能にすることを示しています。
Human vision involves parsing and representing objects and scenes using structured representations based on part-whole hierarchies. Computer vision and machine learning researchers have recently sought to emulate this capability using capsule networks, reference frames and active predictive coding, but a generative model formulation has been lacking. We introduce Recursive Neural Programs (RNPs), which, to our knowledge, is the first neural generative model to address the part-whole hierarchy learning problem. RNPs model images as hierarchical trees of probabilistic sensory-motor programs that recursively reuse learned sensory-motor primitives to model an image within different reference frames, forming recursive image grammars. We express RNPs as structured variational autoencoders (sVAEs) for inference and sampling, and demonstrate parts-based parsing, sampling and one-shot transfer learning for MNIST, Omniglot and Fashion-MNIST datasets, demonstrating the model's expressive power. Our results show that RNPs provide an intuitive and explainable way of composing objects and scenes, allowing rich compositionality and intuitive interpretations of objects in terms of part-whole hierarchies.
updated: Thu Jun 16 2022 22:02:06 GMT+0000 (UTC)
published: Thu Jun 16 2022 22:02:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト