フレームベースのカメラのシャッタースピードが遅く、露出時間が長いと、視覚的なぼやけやフレーム間の情報の損失が発生し、キャプチャされたビデオの全体的な品質が低下することがよくあります。この目的のために、イベントベースのモーションブラー除去とぼやけたビデオエンハンスメントのためのフレーム補間の統一されたフレームワークを提示します。ここでは、イベントの非常に低い遅延を利用して、モーションブラーを軽減し、中間フレーム予測を容易にします。具体的には、ぼやけたフレームと鮮明な潜像との間のマッピング関係は、最初に学習可能な二重積分ネットワークによって予測され、次に、連続するぼやけた入力および同時発生イベントからの情報を利用することによって粗い結果を洗練するために融合ネットワークが提案される。ぼやけたフレーム、潜像、およびイベントストリーム間の相互制約を調査することにより、実際のぼやけたビデオやイベントを使用したネットワークトレーニングを可能にする自己監視学習フレームワークをさらに提案します。広範な実験は、私たちの方法が最先端のアプローチと比べて遜色がなく、合成データセットと実世界のデータセットの両方で驚くべきパフォーマンスを達成することを示しています。
Slow shutter speed and long exposure time of frame-based cameras often cause visual blur and loss of inter-frame information, degenerating the overall quality of captured videos. To this end, we present a unified framework of event-based motion deblurring and frame interpolation for blurry video enhancement, where the extremely low latency of events is leveraged to alleviate motion blur and facilitate intermediate frame prediction. Specifically, the mapping relation between blurry frames and sharp latent images is first predicted by a learnable double integral network, and a fusion network is then proposed to refine the coarse results via utilizing the information from consecutive blurry inputs and the concurrent events. By exploring the mutual constraints among blurry frames, latent images, and event streams, we further propose a self-supervised learning framework to enable network training with real-world blurry videos and events. Extensive experiments demonstrate that our method compares favorably against the state-of-the-art approaches and achieves remarkable performance on both synthetic and real-world datasets.