画像例から学習できる意味論的グラフ表現に基づく物体認識システムを提案する。このグラフは、構造やジオメトリなどのオブジェクトの固有のプロパティに基づいているため、数ピクセルを変更することでだまされる可能性がある現在の機械学習手法よりも堅牢です。現在のメソッドは、オブジェクトの構造とセマンティクスを無視するため、強力ですが壊れやすいことが証明されています。意味論は、人間の知覚の観点ではなく、オブジェクトの固有の特性の観点から、抽象化の形式として定義します。したがって、自動的に学習することができます。これは、抽象化と部分の2つの異なる階層を持つグラフによって促進されます。これにより、オブジェクトの表現がより正確で用途が広くなります。以前のセマンティックネットワークには、アモルファスの階層が1つしかなく、構築と走査が困難でした。私たちのシステムは、両方の階層を同時にトラバースするアルゴリズムによって学習と認識の両方を実行し、トップダウン戦略とボトムアップ戦略の利点を組み合わせます。これにより、次元が減少し、ビッグデータトレーニングの力ずくで済む必要がなくなります。
We present a system for object recognition based on a semantic graph representation, which the system can learn from image examples. This graph is based on intrinsic properties of objects such as structure and geometry, so it is more robust than the current machine learning methods that can be fooled by changing a few pixels. Current methods have proved to be powerful but brittle because they ignore the structure and semantics of the objects. We define semantics as a form of abstraction, in terms of the intrinsic properties of the object, not in terms of human perception. Thus, it can be learned automatically. This is facilitated by the graph having two distinct hierarchies: abstraction and parts, which also makes its representation of objects more accurate and versatile. Previous semantic networks had only one amorphous hierarchy and were difficult to build and traverse. Our system performs both the learning and recognition by an algorithm that traverses both hierarchies at the same time, combining the advantages of top-down and bottom-up strategies. This reduces dimensionality and obviates the need for the brute force of big data training.