自動化されたロボットシステムは、比較的高い精度と再現性を備えながら、可能な限り堅牢で、一般的にフェイルセーフである必要があります。ディープラーニングベースの方法は、3Dスキャンおよび画像処理タスクへのアプローチ方法に関する研究標準になりつつありますが、このデータを処理するための業界標準は依然として分析ベースです。私たちの論文は、分析手法はテスト、更新、および保守のために堅牢性が低く、困難であると主張しています。この論文は、3Dスキャンにおけるビンの6Dポーズ推定の特定のタスクに焦点を当てています。したがって、正確な注釈を付けた構造化光スキャナーによってキャプチャされた合成データと実際のスキャンで構成される高品質のデータセットを提示します。さらに、6Dビンポーズ推定には、工業標準としての分析手法とベースラインデータ駆動方式の2つの異なる手法を提案します。両方のアプローチは相互評価されており、私たちの実験は、合成データを使用して実際のスキャンのトレーニングを強化すると、提案されたデータ駆動型神経モデルが改善されることを示しています。提案された方法は、将来拡張する予定の比較的小さな初期データセットでトレーニングおよび評価されるため、このポジションペーパーは予備的なものです。
An automated robotic system needs to be as robust as possible and fail-safe in general while having relatively high precision and repeatability. Although deep learning-based methods are becoming research standard on how to approach 3D scan and image processing tasks, the industry standard for processing this data is still analytically-based. Our paper claims that analytical methods are less robust and harder for testing, updating, and maintaining. This paper focuses on a specific task of 6D pose estimation of a bin in 3D scans. Therefore, we present a high-quality dataset composed of synthetic data and real scans captured by a structured-light scanner with precise annotations. Additionally, we propose two different methods for 6D bin pose estimation, an analytical method as the industrial standard and a baseline data-driven method. Both approaches are cross-evaluated, and our experiments show that augmenting the training on real scans with synthetic data improves our proposed data-driven neural model. This position paper is preliminary, as proposed methods are trained and evaluated on a relatively small initial dataset which we plan to extend in the future.