arXiv reaDer
コンテキスト認識データ拡張とカスケードマスクR-CNNを使用したアセンブリ命令を理解するためのオブジェクト検出
Object Detection for Understanding Assembly Instruction Using Context-aware Data Augmentation and Cascade Mask R-CNN
組み立て命令を理解することは、ロボットのタスク計画能力を強化し、高度なロボットアプリケーションを可能にする可能性があります。 2D組み立て指示画像から主要なコンポーネントを認識するために、私たちは主に、指示に関する多くの情報が含まれている吹き出し領域のセグメント化に焦点を当てています。このために、Cascade Mask R-CNNを適用し、組み立て命令のコンテキストを考慮して画像カットをランダムに組み合わせる、吹き出しセグメンテーション用のコンテキスト認識データ拡張スキームを開発しました。提案された拡張スキームは、コンポーネントの場所の分布を考慮しながら、トレーニング可能なデータの多様性を高めることにより、既存の拡張アルゴリズムと比較してより良いセグメンテーションパフォーマンスを達成することを示しました。また、深層学習は、工具や部品など、組み立て手順の重要なオブジェクトを検出することで、組み立て手順を理解するのに役立つことを示しました。
Understanding assembly instruction has the potential to enhance the robot s task planning ability and enables advanced robotic applications. To recognize the key components from the 2D assembly instruction image, We mainly focus on segmenting the speech bubble area, which contains lots of information about instructions. For this, We applied Cascade Mask R-CNN and developed a context-aware data augmentation scheme for speech bubble segmentation, which randomly combines images cuts by considering the context of assembly instructions. We showed that the proposed augmentation scheme achieves a better segmentation performance compared to the existing augmentation algorithm by increasing the diversity of trainable data while considering the distribution of components locations. Also, we showed that deep learning can be useful to understand assembly instruction by detecting the essential objects in the assembly instruction, such as tools and parts.
updated: Thu Jan 07 2021 12:10:27 GMT+0000 (UTC)
published: Thu Jan 07 2021 12:10:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト