arXiv reaDer
CAD-Estate: RGB ビデオでの大規模 CAD モデルの注釈
CAD-Estate: Large-scale CAD Model Annotation in RGB Videos
我々は、オブジェクトのグローバルに一貫した 3D 表現を使用して、複雑なマルチオブジェクト シーンのビデオに注釈を付ける方法を提案します。各オブジェクトにデータベースからの CAD モデルで注釈を付け、9-DoF ポーズ変換を使用してシーンの 3D 座標フレームに配置します。私たちの方法は半自動であり、深度センサーを必要とせずに、一般に入手可能な RGB ビデオで動作します。多くの手順は自動的に実行され、人間が実行するタスクは単純で明確に指定されており、3D では限られた推論のみが必要です。これによりクラウドソーシングが可能になり、YouTube の不動産ビデオに注釈を付けることで大規模なデータセットを構築できるようになりました。当社のデータセット CAD-Estate は、21K ビデオの 3D 表現に配置された 12K の固有の CAD モデルの 108K インスタンスを提供します。実際のシーン上の CAD モデルの注釈を含む既存の最大のデータセットである Scan2CAD と比較して、CAD-Estate には 8 倍のインスタンスと 4 倍の固有の CAD モデルがあります。自動 3D オブジェクト再構成と姿勢推定のタスクのために CAD-Estate で Mask2CAD モデルを事前トレーニングする利点を紹介し、それが人気のある Scan2CAD ベンチマークの改善につながることを示します。 2023年7月中旬までにデータを公開する予定です。
We propose a method for annotating videos of complex multi-object scenes with a globally-consistent 3D representation of the objects. We annotate each object with a CAD model from a database, and place it in the 3D coordinate frame of the scene with a 9-DoF pose transformation. Our method is semi-automatic and works on commonly-available RGB videos, without requiring a depth sensor. Many steps are performed automatically, and the tasks performed by humans are simple, well-specified, and require only limited reasoning in 3D. This makes them feasible for crowd-sourcing and has allowed us to construct a large-scale dataset by annotating real-estate videos from YouTube. Our dataset CAD-Estate offers 108K instances of 12K unique CAD models placed in the 3D representations of 21K videos. In comparison to Scan2CAD, the largest existing dataset with CAD model annotations on real scenes, CAD-Estate has 8x more instances and 4x more unique CAD models. We showcase the benefits of pre-training a Mask2CAD model on CAD-Estate for the task of automatic 3D object reconstruction and pose estimation, demonstrating that it leads to improvements on the popular Scan2CAD benchmark. We will release the data by mid July 2023.
updated: Thu Jun 15 2023 10:12:02 GMT+0000 (UTC)
published: Thu Jun 15 2023 10:12:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト