ALET (Automated Labeling of Equipment and Tools): A Dataset, a Baseline and a Usecase for Tool Detection in the Wild
現実的な環境で人間と協力するロボットは、使用および操作できるツールを検出できる必要があります。ただし、実際の設定でこの課題に対処する利用可能なデータセットまたは研究はありません。このホワイトペーパーでは、農業、ガーデニング、オフィス、石工、車両、木工、ワークショップツールを検出するための広範なデータセット(METU-ALET)を提供することで、このギャップを埋めます。シーンは、ツールを使用する人間の有無にかかわらず、洗練された環境に対応しています。私たちが検討するシーンでは、ツールの小規模、関節の性質、オクルージョン、クラス間の不変性など、オブジェクト検出にいくつかの課題があります。さらに、最先端のディープオブジェクト検出器(Faster Rを含む)をトレーニングして比較します。 -データセットのCNN、Cascade R-CNN、RepPoint、RetinaNet)。検出器は、特に小規模なツールや他のツールの一部と視覚的に類似しているツールを検出するのが難しいことがわかります。これは、データセットと紙の重要性をサポートします。データセット、コード、およびトレーニング済みモデルを使用して、私たちの作業は、ツールとロボットアプリケーションでのそれらの使用に関するさらなる研究の基礎を提供します。
Robots collaborating with humans in realistic environments will need to be able to detect the tools that can be used and manipulated. However, there is no available dataset or study that addresses this challenge in real settings. In this paper, we fill this gap by providing an extensive dataset (METU-ALET) for detecting farming, gardening, office, stonemasonry, vehicle, woodworking and workshop tools. The scenes correspond to sophisticated environments with or without humans using the tools. The scenes we consider introduce several challenges for object detection, including the small scale of the tools, their articulated nature, occlusion, inter-class invariance, etc. Moreover, we train and compare several state of the art deep object detectors (including Faster R-CNN, Cascade R-CNN, RepPoint and RetinaNet) on our dataset. We observe that the detectors have difficulty in detecting especially small-scale tools or tools that are visually similar to parts of other tools. This in turn supports the importance of our dataset and paper. With the dataset, the code and the trained models, our work provides a basis for further research into tools and their use in robotics applications.
updated: Sun Dec 13 2020 15:31:44 GMT+0000 (UTC)
published: Fri Oct 25 2019 13:29:10 GMT+0000 (UTC)
