イベントカメラは、生物の影響を受けたセンサーであり、シーンの時間的進化を収集します。ピクセル単位の明るさの変化をキャプチャし、非同期イベントの対応するストリームを出力します。従来のカメラに比べて複数の利点がありますが、従来のデータ処理およびビジョンアルゴリズムの限られた適用性により、それらの使用は部分的に妨げられています。この目的のために、イベントカメラの出力ストリームを活用してRGBフレームを合成するフレームワークを提示し、カラーキーフレームの初期セットまたは周期セットと中間イベントのシーケンスに依存します。既存の作業とは異なり、敵対的アーキテクチャとリカレントモジュールを組み合わせた、ディープラーニングベースのフレーム合成方法を提案します。 4つのパブリックデータセットの定性的な結果とピクセルごとの定量的、知覚的、セマンティック評価により、合成画像の品質が確認されます。
Event cameras are biologically-inspired sensors that gather the temporal evolution of the scene. They capture pixel-wise brightness variations and output a corresponding stream of asynchronous events. Despite having multiple advantages with respect to traditional cameras, their use is partially prevented by the limited applicability of traditional data processing and vision algorithms. To this aim, we present a framework which exploits the output stream of event cameras to synthesize RGB frames, relying on an initial or a periodic set of color key-frames and the sequence of intermediate events. Differently from existing work, we propose a deep learning-based frame synthesis method, consisting of an adversarial architecture combined with a recurrent module. Qualitative results and quantitative per-pixel, perceptual, and semantic evaluation on four public datasets confirm the quality of the synthesized images.