このホワイトペーパーでは、2Dユークリッド類似度測定のみを使用してオブジェクトビューを以前に表示されたビューと比較する視覚オブジェクト認識システムが、すべての座標情報にアクセスし、内部で任意の3Dモデルを使用できるオブザーバーと同じ認識パフォーマンスを達成できることを証明しています。さらに、このようなシステムは、ベイズ最適3Dモデルベースのシステムよりも多くのトレーニングビューを必要としないことを示しています。コンピュータービジョンシステムを構築する場合、これらの結果は、3Dモデルベースのシステムと比較して、慎重に構築された証拠メカニズムの組み合わせでビューベースまたは外観ベースの手法を使用しても不利ではないことを意味します。人間の視覚に対する計算アプローチについて、彼らは、人間と3Dモデルベースのシステムで達成可能なパフォーマンスを比較するだけでは、3Dオブジェクト認識のビューベースと3Dモデルベースの技術を区別することは不可能であることを示しています。
This paper proves that visual object recognition systems using only 2D Euclidean similarity measurements to compare object views against previously seen views can achieve the same recognition performance as observers having access to all coordinate information and able of using arbitrary 3D models internally. Furthermore, it demonstrates that such systems do not require more training views than Bayes-optimal 3D model-based systems. For building computer vision systems, these results imply that using view-based or appearance-based techniques with carefully constructed combination of evidence mechanisms may not be at a disadvantage relative to 3D model-based systems. For computational approaches to human vision, they show that it is impossible to distinguish view-based and 3D model-based techniques for 3D object recognition solely by comparing the performance achievable by human and 3D model-based systems.}