arXiv reaDer
想像してみろ! 3Dツール合成のための創発的なアフォーダンスの活用
Imagine That! Leveraging Emergent Affordances for 3D Tool Synthesis
この論文では、視覚ベースの生成モデルの潜在空間によってキャプチャされた情報の豊富さを探ります。このモデルは、教師なし生成学習とタスクベースのパフォーマンス予測子を組み合わせて、シナリオとスティックのようなツールを含む、到達タスクからの視覚的観察を前提として、タスク関連のオブジェクトアフォーダンスを学習および活用します。生成モデルの学習された埋め込みは、3Dツールジオメトリの変動要因(長さ、幅、形状など)をキャプチャしますが、パフォーマンスプレディクターは、タスクの成功と相関する埋め込みのサブ多様体を識別します。さまざまなシナリオの中で、パフォーマンス予測子からのバックプロパゲーションを介して潜在空間をトラバースすることで、目前のタスクに適したツールを想像できることを示します。私たちの結果は、アフォーダンス(到達するための効用のような)が潜在空間の滑らかな軌道に沿ってエンコードされていることを示しています。高レベルのパフォーマンス基準(タスクの成功など)のみを考慮してこれらの緊急アフォーダンスにアクセスすると、エージェントはターゲットを絞った意図的な方法でツールのジオメトリを操作できます。
In this paper we explore the richness of information captured by the latent space of a vision-based generative model. The model combines unsupervised generative learning with a task-based performance predictor to learn and to exploit task-relevant object affordances given visual observations from a reaching task, involving a scenario and a stick-like tool. While the learned embedding of the generative model captures factors of variation in 3D tool geometry (e.g. length, width, and shape), the performance predictor identifies sub-manifolds of the embedding that correlate with task success. Within a variety of scenarios, we demonstrate that traversing the latent space via backpropagation from the performance predictor allows us to imagine tools appropriate for the task at hand. Our results indicate that affordances-like the utility for reaching-are encoded along smooth trajectories in latent space. Accessing these emergent affordances by considering only high-level performance criteria (such as task success) enables an agent to manipulate tool geometries in a targeted and deliberate way.
updated: Wed Oct 07 2020 04:05:19 GMT+0000 (UTC)
published: Mon Sep 30 2019 09:55:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト