arXiv reaDer
測光的に困難なオブジェクトのマルチモーダル データセット取得
Multi-Modal Dataset Acquisition for Photometrically Challenging Object
この論文では、精度、サイズ、リアリズム、測光が難しい物体に適したイメージング モダリティの観点から、3D ビジョン タスク用の現在のデータセットの限界について説明します。私たちは、既存の 3D 認識と 6D オブジェクトの姿勢データセットを強化する新しい注釈および取得パイプラインを提案します。私たちのアプローチは、ロボットの順運動学、外部赤外線トラッカー、および改善されたキャリブレーションおよび注釈手順を統合します。ロボットのエンドエフェクターに取り付けられたマルチモーダル センサー リグを紹介し、それが高精度のデータセットの作成にどのように統合されるかを示します。さらに、より広範囲の視点をカバーするためにフリーハンド手順を導入します。どちらのアプローチでも、正確なオブジェクトとカメラのポーズの注釈を備えた高品質の 3D データが得られます。私たちの手法は既存のデータセットの制限を克服し、3D ビジョン研究に貴重なリソースを提供します。
This paper addresses the limitations of current datasets for 3D vision tasks in terms of accuracy, size, realism, and suitable imaging modalities for photometrically challenging objects. We propose a novel annotation and acquisition pipeline that enhances existing 3D perception and 6D object pose datasets. Our approach integrates robotic forward-kinematics, external infrared trackers, and improved calibration and annotation procedures. We present a multi-modal sensor rig, mounted on a robotic end-effector, and demonstrate how it is integrated into the creation of highly accurate datasets. Additionally, we introduce a freehand procedure for wider viewpoint coverage. Both approaches yield high-quality 3D data with accurate object and camera pose annotations. Our methods overcome the limitations of existing datasets and provide valuable resources for 3D vision research.
updated: Mon Aug 21 2023 10:38:32 GMT+0000 (UTC)
published: Mon Aug 21 2023 10:38:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト