arXiv reaDer
E2V-SDE:非同期イベントからニューラル確率微分方程式による高速で連続的なビデオ再構成まで
E2V-SDE: From Asynchronous Events to Fast and Continuous Video Reconstruction via Neural Stochastic Differential Equations
イベントカメラは、シーン内の明るさの変化に非同期で、ピクセルごとに独立して応答します。これらのカメラは、その特性により、高ダイナミックレンジ(HDR)、高時間分解能、低消費電力という明確な機能を備えています。ただし、イベントカメラの結果は、コンピュータービジョンタスクの代替表現に処理する必要があります。また、通常はノイズが多く、イベントが少ないエリアではパフォーマンスが低下します。近年、多くの研究者がイベントからビデオを再構築しようと試みました。ただし、不規則で不連続なデータからの一時的な情報が不足しているため、高品質のビデオは提供されません。これらの困難を克服するために、確率微分方程式(SDE)によって潜在空間でダイナミクスが支配されるE2V-SDEを導入します。したがって、E2V-SDEは、任意のタイムステップで画像を迅速に再構築し、見えないデータに対して現実的な予測を行うことができます。さらに、画像の鮮明度と時間的一貫性を向上させるために、さまざまな画像合成手法の採用に成功しました。シミュレートされたデータセットと実際のデータセットで広範な実験を行うことにより、さまざまなビデオ再構成設定の下で、モデルが最先端のアプローチよりも優れていることを確認します。画質に関しては、LPIPSスコアが最大12%向上し、再構成速度はET-Netより87%高速です。
Event cameras respond to brightness changes in the scene asynchronously and independently for every pixel. Due to the properties, these cameras have distinct features: high dynamic range (HDR), high temporal resolution, and low power consumption. However, the results of event cameras should be processed into an alternative representation for computer vision tasks. Also, they are usually noisy and cause poor performance in areas with few events. In recent years, numerous researchers have attempted to reconstruct videos from events. However, they do not provide good quality videos due to a lack of temporal information from irregular and discontinuous data. To overcome these difficulties, we introduce an E2V-SDE whose dynamics are governed in a latent space by Stochastic differential equations (SDE). Therefore, E2V-SDE can rapidly reconstruct images at arbitrary time steps and make realistic predictions on unseen data. In addition, we successfully adopted a variety of image composition techniques for improving image clarity and temporal consistency. By conducting extensive experiments on simulated and real-scene datasets, we verify that our model outperforms state-of-the-art approaches under various video reconstruction settings. In terms of image quality, the LPIPS score improves by up to 12% and the reconstruction speed is 87% higher than that of ET-Net.
updated: Thu Oct 13 2022 18:30:09 GMT+0000 (UTC)
published: Wed Jun 15 2022 15:05:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト