arXiv reaDer
FPCC: Fast Point Cloud Clustering for Instance Segmentation
インスタンスのセグメンテーションは、ロボット工学、自動運転車、人間とコンピューターの相互作用など、多くの実際のアプリケーションにおける重要な前処理タスクです。 2次元(2D)画像タスクのディープラーニングの急速な開発と比較して、3Dポイントクラウドのディープラーニングベースのインスタンスセグメンテーションには、まだ開発の余地がたくさんあります。特に、同じクラスの多数の遮蔽されたオブジェクトを区別することは、ロボットによるビンピッキングで見られる非常に困難な問題です。通常のビンピッキングシーンでは、多くの同一のオブジェクトが積み重ねられ、オブジェクトのモデルがわかっています。したがって、セマンティック情報は無視できます。代わりに、ビンピッキングの焦点はインスタンスのセグメンテーションに置かれます。このタスク要件に基づいて、ビンピッキングシーンのインスタンスセグメンテーションのための高速点群クラスタリング(FPCC)を提案します。 FPCCには、FPCC-Netという名前のネットワークと高速クラスタリングアルゴリズムが含まれています。 FPCC-netには2つのサブネットがあり、1つはクラスタリングの幾何学的中心を推測するためのもので、もう1つは各ポイントの特徴を記述するためのものです。 FPCC-Netは、各ポイントの特徴を抽出し、各インスタンスの幾何学的中心点を同時に推測します。その後、提案されたクラスタリングアルゴリズムは、残りのポイントを特徴埋め込み空間内の最も近い幾何学的中心にクラスタリングします。実験によると、FPCCはビンピッキングシーンの既存の作業を上回り、計算効率が高いことが示されています。コードとデータはで入手できます。
Instance segmentation is an important pre-processing task in numerous real-world applications, such as robotics, autonomous vehicles, and human-computer interaction. Compared with the rapid development of deep learning for two-dimensional (2D) image tasks, deep learning-based instance segmentation of 3D point cloud still has a lot of room for development. In particular, distinguishing a large number of occluded objects of the same class is a highly challenging problem, which is seen in a robotic bin-picking. In a usual bin-picking scene, many indentical objects are stacked together and the model of the objects is known. Thus, the semantic information can be ignored; instead, the focus in the bin-picking is put on the segmentation of instances. Based on this task requirement, we propose a Fast Point Cloud Clustering (FPCC) for instance segmentation of bin-picking scene. FPCC includes a network named FPCC-Net and a fast clustering algorithm. FPCC-net has two subnets, one for inferring the geometric centers for clustering and the other for describing features of each point. FPCC-Net extracts features of each point and infers geometric center points of each instance simultaneously. After that, the proposed clustering algorithm clusters the remaining points to the closest geometric center in feature embedding space. Experiments show that FPCC also surpasses the existing works in bin-picking scenes and is more computationally efficient. Our code and data are available at
updated: Fri Aug 06 2021 11:04:09 GMT+0000 (UTC)
published: Tue Dec 29 2020 05:58:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト