arXiv reaDer
材料認識における幾何学と照明の共同の役割
The joint role of geometry and illumination on material recognition
物質を観察し、認識することは、私たちの日常生活の基本的な部分です。通常の表示条件下では、周囲のオブジェクトを簡単に識別し、それらが構成されている素材を認識することができます。それにもかかわらず、オブジェクトの視覚的特性を正確に識別するために行われる根本的な知覚プロセスを理解することは、長年の問題です。この作業では、ジオメトリ、照明、およびそれらの空間周波数の相互作用が、材料認識タスクでの人間のパフォーマンスにどのように影響するかについて、包括的かつ体系的な分析を実行します。大規模な行動実験を実施し、参加者は候補サンプルのプールの中からさまざまな参考資料を認識するよう求められます。さまざまな実験で、刺激の周波数領域の情報を注意深くサンプリングします。私たちの分析から、参照と候補の両方のジオメトリと照明の間の重要な一次相互作用が見つかりました。さらに、単純な画像統計と高次画像ヒストグラムは人間のパフォーマンスと相関しないことがわかります。したがって、材料認識タスクでディープニューラルネットワークをトレーニングすることにより、高度に非線形な統計の高レベルの比較を実行します。私たちの結果は、そのようなモデルが材料を正確に分類できることを示しています。これは、ラベル付けされた近位画像データから材料の外観の意味のある表現を定義できることを示唆しています。最後に、これらの高度に非線形なモデルと人間が、材料認識タスクに同様の高レベルの要因を使用する可能性があるという予備的な証拠を見つけます。
Observing and recognizing materials is a fundamental part of our daily life. Under typical viewing conditions, we are capable of effortlessly identifying the objects that surround us and recognizing the materials they are made of. Nevertheless, understanding the underlying perceptual processes that take place to accurately discern the visual properties of an object is a long-standing problem. In this work, we perform a comprehensive and systematic analysis of how the interplay of geometry, illumination, and their spatial frequencies affects human performance on material recognition tasks. We carry out large-scale behavioral experiments where participants are asked to recognize different reference materials among a pool of candidate samples. In the different experiments, we carefully sample the information in the frequency domain of the stimuli. From our analysis, we find significant first-order interactions between the geometry and the illumination, of both the reference and the candidates. In addition, we observe that simple image statistics and higher-order image histograms do not correlate with human performance. Therefore, we perform a high-level comparison of highly non-linear statistics by training a deep neural network on material recognition tasks. Our results show that such models can accurately classify materials, which suggests that they are capable of defining a meaningful representation of material appearance from labeled proximal image data. Last, we find preliminary evidence that these highly non-linear models and humans may use similar high-level factors for material recognition tasks.
updated: Thu Jan 07 2021 11:29:52 GMT+0000 (UTC)
published: Thu Jan 07 2021 11:29:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト