arXiv reaDer
Break and Make:LEGOBricksを使用したインタラクティブな構造理解
Break and Make: Interactive Structural Understanding Using LEGO Bricks
複雑な空間的関係を持つ幾何学的構造の視覚的理解は、人間の知性の基本的な要素です。子供の頃、私たちは観察からだけでなく、私たちの周りの世界と相互作用することによって、つまり物事を分解して再び組み立てることによって、構造について推論する方法を学びます。構造と構成性について推論する能力により、物事を構築するだけでなく、複雑なシステムを理解してリバースエンジニアリングすることもできます。パーツベースの幾何学的理解のためのインタラクティブな推論の研究を進めるために、BreakandMakeと呼ばれるLEGOブロックを使用した挑戦的な新しいアセンブリ問題を提案します。この問題では、エージェントにLEGOモデルが与えられ、インタラクティブに検査して分解することにより、その構造を理解しようとします。この検査期間の後、エージェントは、低レベルのアクションプリミティブを使用してモデルを最初から再構築することにより、理解を証明する必要があります。この問題の研究を容易にするために、学習エージェントがLEGOモデルを組み立て、分解、操作できる完全にインタラクティブな3DシミュレーターであるLTRONを構築しました。このシミュレーターを、インターネットにアップロードされたファン製のLEGO作品の新しいデータセットと組み合わせて、1,000を超えるユニークなレンガの形を含む複雑なシーンを提供します。この困難な問題をどのように進めるかについてのガイダンスを提供するシーケンス間モデルを使用して、この問題を解決するための第一歩を踏み出します。シミュレーターとデータは、github.com / aaronwalsman/ltronで入手できます。追加のトレーニングコードとPyTorchの例は、github.com / aaronwalsman/ltron-torch-eccv22で入手できます。
Visual understanding of geometric structures with complex spatial relationships is a fundamental component of human intelligence. As children, we learn how to reason about structure not only from observation, but also by interacting with the world around us -- by taking things apart and putting them back together again. The ability to reason about structure and compositionality allows us to not only build things, but also understand and reverse-engineer complex systems. In order to advance research in interactive reasoning for part-based geometric understanding, we propose a challenging new assembly problem using LEGO bricks that we call Break and Make. In this problem an agent is given a LEGO model and attempts to understand its structure by interactively inspecting and disassembling it. After this inspection period, the agent must then prove its understanding by rebuilding the model from scratch using low-level action primitives. In order to facilitate research on this problem we have built LTRON, a fully interactive 3D simulator that allows learning agents to assemble, disassemble and manipulate LEGO models. We pair this simulator with a new dataset of fan-made LEGO creations that have been uploaded to the internet in order to provide complex scenes containing over a thousand unique brick shapes. We take a first step towards solving this problem using sequence-to-sequence models that provide guidance for how to make progress on this challenging problem. Our simulator and data are available at github.com/aaronwalsman/ltron. Additional training code and PyTorch examples are available at github.com/aaronwalsman/ltron-torch-eccv22.
updated: Wed Jul 27 2022 18:33:09 GMT+0000 (UTC)
published: Wed Jul 27 2022 18:33:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト