arXiv reaDer
Sparse4D v2: スパース モデルとのリカレント テンポラル フュージョン
Sparse4D v2: Recurrent Temporal Fusion with Sparse Model
スパース アルゴリズムは、マルチビューの時間認識タスクに優れた柔軟性を提供します。この論文では、Sparse4D の拡張バージョンを紹介します。このバージョンでは、マルチフレーム特徴サンプリングの再帰的形式を実装することで時間融合モジュールを改善しています。画像特徴と構造化アンカー特徴を効果的に分離することにより、Sparse4D は時間特徴の非常に効率的な変換を可能にし、それによりスパース特徴のフレームごとの送信のみを通じて時間融合を容易にします。反復的時間的融合アプローチには、2 つの主な利点があります。まず、時間融合の計算量が O(T) から O(1) に軽減され、推論速度とメモリ使用量が大幅に向上します。第 2 に、長期情報の融合が可能になり、時間的融合によりパフォーマンスがより顕著に向上します。私たちが提案するアプローチである Sparse4Dv2 は、スパース知覚アルゴリズムのパフォーマンスをさらに強化し、nuScenes 3D 検出ベンチマークで最先端の結果を達成します。コードは https://github.com/linxuewu/Sparse4D で入手できます。
Sparse algorithms offer great flexibility for multi-view temporal perception tasks. In this paper, we present an enhanced version of Sparse4D, in which we improve the temporal fusion module by implementing a recursive form of multi-frame feature sampling. By effectively decoupling image features and structured anchor features, Sparse4D enables a highly efficient transformation of temporal features, thereby facilitating temporal fusion solely through the frame-by-frame transmission of sparse features. The recurrent temporal fusion approach provides two main benefits. Firstly, it reduces the computational complexity of temporal fusion from O(T) to O(1), resulting in significant improvements in inference speed and memory usage. Secondly, it enables the fusion of long-term information, leading to more pronounced performance improvements due to temporal fusion. Our proposed approach, Sparse4Dv2, further enhances the performance of the sparse perception algorithm and achieves state-of-the-art results on the nuScenes 3D detection benchmark. Code will be available at https://github.com/linxuewu/Sparse4D.
updated: Tue May 23 2023 12:53:58 GMT+0000 (UTC)
published: Tue May 23 2023 12:53:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト