arXiv reaDer
Recurrent Transformer を使用したイベントベースの単眼高密度深度推定
Event-based Monocular Dense Depth Estimation with Recurrent Transformers
高い時間解像度と高いダイナミック レンジを提供するイベント カメラは、単眼深度推定における一般的な課題 (モーション ブラーや低照度など) に対処するための新しい視点をもたらしました。ただし、非同期イベントからのまばらな空間情報と豊富な時間的手がかりを効果的に活用する方法は、依然として挑戦的な取り組みです。この目的のために、再帰トランスフォーマーを備えた新しいイベントベースの単眼深度推定器、つまりEReFormerを提案します。これは、連続イベントストリームを処理する再帰メカニズムを備えた最初の純粋なトランスフォーマーです。技術的には、空間モデリングのために、空間トランスフォーマー融合モジュールを備えた新しいトランスベースのエンコーダー/デコーダーが提示され、CNN ベースの方法よりも優れたグローバル コンテキスト情報モデリング機能を備えています。時間モデリングでは、再帰メカニズムをトランスフォーマーに導入するゲート リカレント ビジョン トランスフォーマー ユニットを設計し、高価な GPU メモリ コストを軽減しながら時間モデリング機能を向上させます。実験結果は、私たちの EReFormer が、合成データセットと現実世界のデータセットの両方で、最先端の方法よりも優れていることを示しています。私たちの仕事が、イベントベースのビジョンコミュニティで素晴らしいトランスフォーマーを開発するためのさらなる研究を引き付けることを願っています.当社のオープンソース コードは、補足資料に記載されています。
Event cameras, offering high temporal resolutions and high dynamic ranges, have brought a new perspective to address common challenges (e.g., motion blur and low light) in monocular depth estimation. However, how to effectively exploit the sparse spatial information and rich temporal cues from asynchronous events remains a challenging endeavor. To this end, we propose a novel event-based monocular depth estimator with recurrent transformers, namely EReFormer, which is the first pure transformer with a recursive mechanism to process continuous event streams. Technically, for spatial modeling, a novel transformer-based encoder-decoder with a spatial transformer fusion module is presented, having better global context information modeling capabilities than CNN-based methods. For temporal modeling, we design a gate recurrent vision transformer unit that introduces a recursive mechanism into transformers, improving temporal modeling capabilities while alleviating the expensive GPU memory cost. The experimental results show that our EReFormer outperforms state-of-the-art methods by a margin on both synthetic and real-world datasets. We hope that our work will attract further research to develop stunning transformers in the event-based vision community. Our open-source code can be found in the supplemental material.
updated: Tue Dec 06 2022 07:06:59 GMT+0000 (UTC)
published: Tue Dec 06 2022 07:06:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト