arXiv reaDer
3D-VField:ロバストな3Dオブジェクト検出のために点群を逆に変形することを学ぶ
3D-VField: Learning to Adversarially Deform Point Clouds for Robust 3D Object Detection
点群での3Dオブジェクト検出は、ポイント間の幾何学的関係に依存しているため、非標準のオブジェクト形状は、メソッドの検出機能を妨げる可能性があります。ただし、セーフティクリティカルな設定では、損傷した車や珍しい車の誤検出などの危険な問題を回避するために、配布外のサンプルとロングテールサンプルの堅牢性が基本です。この作業では、トレーニング中に変形した点群を考慮に入れることにより、3Dオブジェクト検出器のドメイン外データへの一般化を大幅に改善します。これは、3D-VFieldを使用して実現します。これは、敵対的な方法で学習したベクトルを介してオブジェクトをもっともらしく変形させる新しい方法です。私たちのアプローチでは、3Dポイントをセンサービュー光線に沿ってスライドするように制限しますが、それらを追加したり削除したりすることはありません。得られたベクトルは転送可能で、サンプルに依存せず、形状の滑らかさとオクルージョンを保持します。トレーニング中にこれらのベクトル場によって生成された変形で通常のサンプルを補強することにより、KITTIのみでトレーニングしている場合でも、損傷/変形した車などのさまざまな形状のオブジェクトに対する堅牢性が大幅に向上します。この目的に向けて、オープンソースのCrashDを提案し、共有します。これは、さまざまなクラッシュシナリオを使用した、現実的な損傷車と希少車の合成データセットです。 KITTI、Waymo、CrashD、SUN RGB-Dに関する広範な実験により、屋内と屋外の両方のシーンで、ドメイン外のデータ、さまざまなモデルとセンサー、つまりLiDARとToFカメラに対する技術の高い一般化可能性が示されています。 CrashDデータセットは、https://crashd-cars.github.ioで入手できます。
As 3D object detection on point clouds relies on the geometrical relationships between the points, non-standard object shapes can hinder a method's detection capability. However, in safety-critical settings, robustness on out-of-distribution and long-tail samples is fundamental to circumvent dangerous issues, such as the misdetection of damaged or rare cars. In this work, we substantially improve the generalization of 3D object detectors to out-of-domain data by taking into account deformed point clouds during training. We achieve this with 3D-VField: a novel method that plausibly deforms objects via vectors learned in an adversarial fashion. Our approach constrains 3D points to slide along their sensor view rays while neither adding nor removing any of them. The obtained vectors are transferrable, sample-independent and preserve shape smoothness and occlusions. By augmenting normal samples with the deformations produced by these vector fields during training, we significantly improve robustness against differently shaped objects, such as damaged/deformed cars, even while training only on KITTI. Towards this end, we propose and share open source CrashD: a synthetic dataset of realistic damaged and rare cars, with a variety of crash scenarios. Extensive experiments on KITTI, Waymo, our CrashD and SUN RGB-D show the high generalizability of our techniques to out-of-domain data, different models and sensors, namely LiDAR and ToF cameras, for both indoor and outdoor scenes. Our CrashD dataset is available at https://crashd-cars.github.io.
updated: Thu Dec 09 2021 08:50:54 GMT+0000 (UTC)
published: Thu Dec 09 2021 08:50:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト