arXiv reaDer
コンテキストアウェアな特徴抽出による残差3Dシーンフロー学習
Residual 3D Scene Flow Learning with Context-Aware Feature Extraction
シーンフロー推定は、点群または画像の2つの連続するフレーム間の点ごとまたはピクセルごとの3D変位ベクトルを予測するタスクであり、サービスロボットや自動運転などの分野で重要な用途があります。これまでの多くの作品では、点群に基づくシーンフローの推定について多くのことを検討してきましたが、これまで気づかなかった、または十分に解決されていない2つの問題があります。近所; 2)長距離移動を伴う点群の隣接するフレーム間のシーンフローは、不正確に推定される可能性があります。最初の問題を解決するために、この論文では、ユークリッド空間のコンテキスト構造情報を活用し、ローカルポイントフィーチャのソフトアグリゲーションの重みを学習するために、新しいコンテキスト認識セット畳み込み層を提案します。このデザインは、繰り返しパターンを使用したシーン理解中のコンテキスト構造情報の人間の知覚に触発されています。コンテキストアウェアセット畳み込みレイヤーは、シーンフロー推定のための3Dポイントクラウドのコンテキストアウェアポイント機能ピラミッドモジュールに組み込まれています。 2番目の問題では、遠距離恋愛に対処するために、残余流リファインメント層に明示的な残余流学習構造が提案されます。 FlyingThings3DおよびKITTIシーンフローデータセットに関する実験とアブレーション研究は、提案された各コンポーネントの有効性を示しています。定性的な結果は、あいまいなフレーム間関連付けと長距離移動推定の問題が適切に処理されていることを示しています。 FlyingThings3DとKITTIの両方のシーンフローデータセットの定量的結果は、提案された方法が最先端のパフォーマンスを達成し、他のすべての以前の作品を少なくとも25%上回っていることを示しています。
Scene flow estimation is the task to predict the point-wise or pixel-wise 3D displacement vector between two consecutive frames of point clouds or images, which has important application in fields such as service robots and autonomous driving. Although many previous works have explored greatly on scene flow estimation based on point clouds, there are two problems that have not been noticed or well solved before: 1) Points of adjacent frames in repetitive patterns may be wrongly associated due to similar spatial structure in their neighbourhoods; 2) Scene flow between adjacent frames of point clouds with long-distance movement may be inaccurately estimated. To solve the first problem, a novel context-aware set convolution layer is proposed in this paper to exploit contextual structure information of Euclidean space and learn soft aggregation weights for local point features. This design is inspired by human perception of contextual structure information during scene understanding with repetitive patterns. The context-aware set convolution layer is incorporated in a context-aware point feature pyramid module of 3D point clouds for scene flow estimation. For the second problem, an explicit residual flow learning structure is proposed in the residual flow refinement layer to cope with long-distance movement. The experiments and ablation study on FlyingThings3D and KITTI scene flow datasets demonstrate the effectiveness of each proposed component. The qualitative results show that the problems of ambiguous inter-frame association and long-distance movement estimation are well handled. Quantitative results on both FlyingThings3D and KITTI scene flow datasets show that the proposed method achieves state-of-the-art performance, surpassing all other previous works to the best of our knowledge by at least 25%.
updated: Sat Jan 15 2022 10:41:16 GMT+0000 (UTC)
published: Fri Sep 10 2021 06:15:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト