arXiv reaDer
HomebrewedDB:3Dオブジェクトの6D姿勢推定のためのRGB-Dデータセット
HomebrewedDB: RGB-D Dataset for 6D Pose Estimation of 3D Objects
  6Dオブジェクトポーズ検出器を作成および評価するための最も重要な前提条件には、ラベル付き6Dポーズを含むデータセットがあります。ディープラーニングの出現により、そのようなデータセットの需要は継続的に増大しています。いくつかは存在するという事実にもかかわらず、それらは希少であり、通常、シーケンスごとに単一のオブジェクトなどのセットアップが制限されているか、テクスチャのない工業用部品などの特定のオブジェクトタイプに焦点を当てています。さらに、2つの重要なコンポーネントが無視されることがよくあります:実際のデータとスケーラビリティの代わりに利用可能な3Dモデルのみを使用したトレーニング、つまり、オブジェクトごとに1つの検出器をトレーニングするのではなく、すべてのオブジェクトを検出する1つの方法をトレーニングします遮蔽、照明条件の変化、オブジェクトの外観の変化などのその他の課題、および正確に定義されたベンチマークは存在しないか、異なるデータセットに散在しています。このペーパーでは、上記の課題をカバーする6D姿勢推定のデータセットを提示します。主に3Dモデル(テクスチャ付きおよびテクスチャレスの両方)、スケーラビリティ、閉塞、および光条件とオブジェクトの外観の変化からのトレーニングを対象としています。データセットには、さまざまな難易度の13シーンにわたる33個のオブジェクト(17個のおもちゃ、8個の家庭用および8個の産業関連オブジェクト)が含まれています。また、さまざまな検出器の特性をテストするための一連のベンチマークも提示します。特に、オブジェクトの数に関するスケーラビリティと、変化する光の状態、閉塞、乱雑さに対する耐性に焦点を当てています。また、最新のDPOD検出器を使用して、提示されたベンチマークのベースラインを設定しました。このようなデータセットを作成することの難しさを考慮して、将来、他の研究者がこのデータセットを拡張したり、独自のデータセットを作成できるようにコードをリリースする予定です。
Among the most important prerequisites for creating and evaluating 6D object pose detectors are datasets with labeled 6D poses. With the advent of deep learning, demand for such datasets is growing continuously. Despite the fact that some of exist, they are scarce and typically have restricted setups, such as a single object per sequence, or they focus on specific object types, such as textureless industrial parts. Besides, two significant components are often ignored: training using only available 3D models instead of real data and scalability, i.e. training one method to detect all objects rather than training one detector per object. Other challenges, such as occlusions, changing light conditions and changes in object appearance, as well precisely defined benchmarks are either not present or are scattered among different datasets. In this paper we present a dataset for 6D pose estimation that covers the above-mentioned challenges, mainly targeting training from 3D models (both textured and textureless), scalability, occlusions, and changes in light conditions and object appearance. The dataset features 33 objects (17 toy, 8 household and 8 industry-relevant objects) over 13 scenes of various difficulty. We also present a set of benchmarks to test various desired detector properties, particularly focusing on scalability with respect to the number of objects and resistance to changing light conditions, occlusions and clutter. We also set a baseline for the presented benchmarks using a state-of-the-art DPOD detector. Considering the difficulty of making such datasets, we plan to release the code allowing other researchers to extend this dataset or make their own datasets in the future.
updated: Mon Sep 30 2019 18:49:11 GMT+0000 (UTC)
published: Fri Apr 05 2019 17:16:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト