arXiv reaDer
OriCon3D: 向きと信頼度を使用した効果的な 3D オブジェクト検出
OriCon3D: Effective 3D Object Detection using Orientation and Confidence
1枚の画像から立体物を検出し、その位置を推定する手法を紹介します。私たちの方法は、同様の最先端技術 [1] の上に構築されていますが、精度が向上しています。この研究で採用されたアプローチでは、中心点予測のみを利用する他のフレームワークとは対照的に、深層畳み込みニューラル ネットワーク (DCNN) を使用してオブジェクトの一般的な 3D プロパティを最初に推定します。次に、これらの推定値を 2D バウンディング ボックスによって提供される幾何学的制約と組み合わせて、完全な 3D バウンディング ボックスを生成します。ネットワークの最初の出力は、離散連続損失を使用して 3D オブジェクトの向きを推定します [1]。 2 番目の出力は、最小の分散で 3D オブジェクトの寸法を予測します。ここでは、軽量の特徴抽出器とカスタマイズされたマルチビン アーキテクチャを強化することによる拡張機能も紹介します。これらの推定値を 2D バウンディング ボックスの幾何学的制約と組み合わせることで、KITTI 3D 検出ベンチマーク [2] のベースライン [1] よりも正確に (または比較的) 3D オブジェクトのポーズを決定できます。
We introduce a technique for detecting 3D objects and estimating their position from a single image. Our method is built on top of a similar state-of-the-art technique [1], but with improved accuracy. The approach followed in this research first estimates common 3D properties of an object using a Deep Convolutional Neural Network (DCNN), contrary to other frameworks that only leverage centre-point predictions. We then combine these estimates with geometric constraints provided by a 2D bounding box to produce a complete 3D bounding box. The first output of our network estimates the 3D object orientation using a discrete-continuous loss [1]. The second output predicts the 3D object dimensions with minimal variance. Here we also present our extensions by augmenting light-weight feature extractors and a customized multibin architecture. By combining these estimates with the geometric constraints of the 2D bounding box, we can accurately (or comparatively) determine the 3D object pose better than our baseline [1] on the KITTI 3D detection benchmark [2].
updated: Thu Apr 27 2023 19:52:47 GMT+0000 (UTC)
published: Thu Apr 27 2023 19:52:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト