3D インスタンス セグメンテーションではトップダウンがボトムアップに勝る
Top-Down Beats Bottom-Up in 3D Instance Segmentation
ほとんどの 3D インスタンスのセグメンテーション方法は、通常、リソースを大量に消費する後処理を含む、ボトムアップ戦略を利用します。ポイント グループ化の場合、ボトムアップ方式は、ドメイン固有であり、慎重に調整する必要があるハイパーパラメーターの形式で、オブジェクトに関する事前の仮定に依存します。それどころか、TD3D を使用して 3D インスタンスのセグメンテーションに対処します。つまり、エンドツーエンドでトレーニングされた、トップダウンで完全にデータ駆動型のシンプルなアプローチです。その単純な完全畳み込みパイプラインにより、標準的なベンチマークである ScanNet v2、その拡張である ScanNet200、および S3DIS で驚くほど優れたパフォーマンスを発揮します。その上、私たちの方法は、現在の最先端のグループ化ベースのアプローチよりも推論がはるかに高速です。コードは で入手できます。
Most 3D instance segmentation methods exploit a bottom-up strategy, typically including resource-exhaustive post-processing. For point grouping, bottom-up methods rely on prior assumptions about the objects in the form of hyperparameters, which are domain-specific and need to be carefully tuned. On the contrary, we address 3D instance segmentation with a TD3D: top-down, fully data-driven, simple approach trained in an end-to-end manner. With its straightforward fully-convolutional pipeline, it performs surprisingly well on the standard benchmarks: ScanNet v2, its extension ScanNet200, and S3DIS. Besides, our method is much faster on inference than the current state-of-the-art grouping-based approaches. Code is available at .
updated: Tue Mar 21 2023 07:37:12 GMT+0000 (UTC)
published: Mon Feb 06 2023 15:38:21 GMT+0000 (UTC)
