arXiv reaDer
3D 形状認識は、直感的な物理学と合成による分析を統合します
3D Shape Perception Integrates Intuitive Physics and Analysis-by-Synthesis
多くの表面の手がかりが 3 次元形状の知覚をサポートしていますが、これらの機能が欠けている場合でも形状が見えることがあります。典型的な場合と非典型的な場合の両方の知覚を合成による分析、または画像形成の生成モデルでの推論として説明する 3D 形状知覚のフレームワークを提案します。モデルは直感的な物理学を統合して、それが引き起こす変形から形状を推測する方法を説明します。布のドレープのように、他のオブジェクトに。このアカウントをいくつかの代替案と比較した行動および計算研究は、精度と応答時間の両方で人間の観察者に最もよく一致し、困難な識別に関する人間のパフォーマンスと有意に相関する唯一のモデルであることを示しています。私たちの結果は、ボトムアップのディープ ニューラル ネットワーク モデルが人間の形状認識の十分な説明ではないことを示唆しており、マシン ビジョン システムが人間のようなロバスト性をどのように達成できるかを示しています。
Many surface cues support three-dimensional shape perception, but people can sometimes still see shape when these features are missing -- in extreme cases, even when an object is completely occluded, as when covered with a draped cloth. We propose a framework for 3D shape perception that explains perception in both typical and atypical cases as analysis-by-synthesis, or inference in a generative model of image formation: the model integrates intuitive physics to explain how shape can be inferred from deformations it causes to other objects, as in cloth-draping. Behavioral and computational studies comparing this account with several alternatives show that it best matches human observers in both accuracy and response times, and is the only model that correlates significantly with human performance on difficult discriminations. Our results suggest that bottom-up deep neural network models are not fully adequate accounts of human shape perception, and point to how machine vision systems might achieve more human-like robustness.
updated: Mon Jan 09 2023 23:11:41 GMT+0000 (UTC)
published: Mon Jan 09 2023 23:11:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト