arXiv reaDer
オブジェクトとビュー全体でLiDAR外れ値を割り引くことにより、2Dオブジェクトの場所を3Dに引き上げる
Lifting 2D Object Locations to 3D by Discounting LiDAR Outliers across Objects and Views
2Dマスクオブジェクト予測と生のLiDARポイントクラウドをオブジェクトの完全な3Dバウンディングボックスに自動変換するためのシステムを紹介します。 LiDARポイントクラウドは部分的であるため、バウンディングボックスをポイントクラウドに直接適合させることは無意味です。代わりに、良好な結果を得るには、データセット内のすべてのオブジェクト間で、複数のフレームにわたって共同で情報を共有する必要があることをお勧めします。次に、ベースラインに3つの改善を加えます。まず、モデルを介して回転予測を逆伝播しながら、この空間での直接最適化を介してオブジェクトの回転を予測する際のあいまいさに対処します。次に、外れ値を明示的にモデル化し、その典型的なパターンを学習することでネットワークにタスクを課します。これにより、外れ値をより適切に割り引くことができます。第三に、ビデオデータが利用可能な場合、時間的な一貫性を強制します。これらの貢献により、これらの方法は非常に複雑なパイプライン、3Dモデル、および事前情報の追加の人間注釈付き外部ソースを使用するという事実にもかかわらず、私たちの方法は以前の作業を大幅に上回っています。
We present a system for automatic converting of 2D mask object predictions and raw LiDAR point clouds into full 3D bounding boxes of objects. Because the LiDAR point clouds are partial, directly fitting bounding boxes to the point clouds is meaningless. Instead, we suggest that obtaining good results requires sharing information between all objects in the dataset jointly, over multiple frames. We then make three improvements to the baseline. First, we address ambiguities in predicting the object rotations via direct optimization in this space while still backpropagating rotation prediction through the model. Second, we explicitly model outliers and task the network with learning their typical patterns, thus better discounting them. Third, we enforce temporal consistency when video data is available. With these contributions, our method significantly outperforms previous work despite the fact that those methods use significantly more complex pipelines, 3D models and additional human-annotated external sources of prior information.
updated: Sat Oct 09 2021 14:50:26 GMT+0000 (UTC)
published: Thu Sep 16 2021 13:01:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト