arXiv reaDer
ステレオ イベントおよびインテンシティ カメラによるビデオ フレーム補間
Video Frame Interpolation with Stereo Event and Intensity Camera
ステレオ イベント強度カメラのセットアップは、低遅延のイベント カメラと、正確な明るさとテクスチャ情報をキャプチャする強度カメラの両方の利点を活用するために広く適用されています。ただし、このようなセットアップでは一般にクロスモダリティ視差が発生します。これは、特に複雑な動きとさまざまな深度を伴う現実世界のシーン、既存のイベントベースのビデオ フレーム補間 (E-VFI) のポーズ アーティファクトと歪みを伴う現実世界のシーンでは、ステレオ補正のみで除去するのは困難です。 )が近づいてきます。この問題に取り組むために、我々は、2 つの連続するキーフレームとそれらの間で発行されるイベント ストリームで構成される位置ずれした入力から高品質の中間フレームと対応する視差を生成する、新しいステレオ イベント ベースの VFI (SE-VFI) ネットワーク (SEVFI-Net) を提案します。具体的には、視差を軽減し、特徴領域での空間的位置合わせを実現する特徴集約モジュール (FAM) を提案します。次に、融合された機能を利用して正確なオプティカル フローと視差の推定を達成し、フロー ベースおよび合成ベースの方法を通じてより良い補間結果を達成します。また、イベント カメラと RGB-D カメラで構成されるステレオ ビジュアル取得システムを構築し、複雑な動きとさまざまな深度を持つ多様なシーンを含む新しいステレオ イベント強度データセット (SEID) を収集します。公開されている現実世界のステレオ データセット、つまり DSEC と MVSEC、および SEID データセットに関する実験では、提案した SEVFI-Net が最先端の方法を大幅に上回るパフォーマンスを示しています。
The stereo event-intensity camera setup is widely applied to leverage the advantages of both event cameras with low latency and intensity cameras that capture accurate brightness and texture information. However, such a setup commonly encounters cross-modality parallax that is difficult to be eliminated solely with stereo rectification especially for real-world scenes with complex motions and varying depths, posing artifacts and distortion for existing Event-based Video Frame Interpolation (E-VFI) approaches. To tackle this problem, we propose a novel Stereo Event-based VFI (SE-VFI) network (SEVFI-Net) to generate high-quality intermediate frames and corresponding disparities from misaligned inputs consisting of two consecutive keyframes and event streams emitted between them. Specifically, we propose a Feature Aggregation Module (FAM) to alleviate the parallax and achieve spatial alignment in the feature domain. We then exploit the fused features accomplishing accurate optical flow and disparity estimation, and achieving better interpolated results through flow-based and synthesis-based ways. We also build a stereo visual acquisition system composed of an event camera and an RGB-D camera to collect a new Stereo Event-Intensity Dataset (SEID) containing diverse scenes with complex motions and varying depths. Experiments on public real-world stereo datasets, i.e., DSEC and MVSEC, and our SEID dataset demonstrate that our proposed SEVFI-Net outperforms state-of-the-art methods by a large margin.
updated: Mon Jul 17 2023 04:02:00 GMT+0000 (UTC)
published: Mon Jul 17 2023 04:02:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト