arXiv reaDer
物理学:人間と機械の視覚からの物理的予測の評価
Physion: Evaluating Physical Prediction from Vision in Humans and Machines
機械学習アルゴリズムは多くの困難な視覚的タスクに優れていますが、それらがありふれた現実世界の物理的イベントについて予測できるかどうかは不明です。ここでは、この機能を正確に測定する視覚的および物理的な予測ベンチマークを提示します。リジッドボディとソフトボディの衝突、安定したマルチオブジェクト構成、ローリングとスライド、投射物の動きなど、さまざまな物理現象を現実的にシミュレートする際に、データセットは既存のベンチマークよりも包括的な課題を提示します。さらに、モデルの予測を人間の判断と直接比較できるように、刺激に対する人間の応答を収集しました。さまざまな物理的予測を行う能力について、アーキテクチャ、学習目的、入出力構造、トレーニングデータが異なる一連のアルゴリズムを比較します。物理的状態にアクセスできるグラフニューラルネットワークが人間の行動を最もよく捉えているのに対し、視覚入力のみを受け取るモデルの中で、オブジェクト中心の表現または事前トレーニングを備えたモデルが最もよく機能しますが、人間の精度にははるかに及ばないことがわかります。これは、シーンの物理的に意味のある表現を抽出することが、人間のような視覚的予測を達成するための主なボトルネックであることを示唆しています。したがって、ベンチマークで改善すべき領域を特定し、物理的理解のこの重要な側面の進捗状況を測定する方法を示します。
While machine learning algorithms excel at many challenging visual tasks, it is unclear that they can make predictions about commonplace real world physical events. Here, we present a visual and physical prediction benchmark that precisely measures this capability. In realistically simulating a wide variety of physical phenomena -- rigid and soft-body collisions, stable multi-object configurations, rolling and sliding, projectile motion -- our dataset presents a more comprehensive challenge than existing benchmarks. Moreover, we have collected human responses for our stimuli so that model predictions can be directly compared to human judgments. We compare an array of algorithms -- varying in their architecture, learning objective, input-output structure, and training data -- on their ability to make diverse physical predictions. We find that graph neural networks with access to the physical state best capture human behavior, whereas among models that receive only visual input, those with object-centric representations or pretraining do best but fall far short of human accuracy. This suggests that extracting physically meaningful representations of scenes is the main bottleneck to achieving human-like visual prediction. We thus demonstrate how our benchmark can identify areas for improvement and measure progress on this key aspect of physical understanding.
updated: Thu Jun 17 2021 17:20:27 GMT+0000 (UTC)
published: Tue Jun 15 2021 16:13:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト