arXiv reaDer
フレーム化されたイベント ビデオ ソースの非同期強度表現
An Asynchronous Intensity Representation for Framed and Event Video Sources
非同期センシングを備えた人間の視覚システムを模倣するように設計されたニューロモルフィック「イベント」カメラは、高速で高ダイナミック レンジのアプリケーションの新しい領域を解き放ちます。ただし、研究者は多くの場合、アプリケーションのイベント データのフレーム化された表現に戻るか、特定のカメラのイベント データ タイプ用に特注のアプリケーションを構築します。ビデオ システムの次の時代を先導し、新しいイベント カメラ設計に対応し、従来のアプリケーションでの非同期ビデオの利点を探るには、ソースに依存しない非同期ビデオ表現が必要であると主張します。このホワイト ペーパーでは、フレーム化されたデータ ソースとフレーム化されていないデータ ソースの両方に対して、新しい非同期強度表現を紹介します。私たちの表現は、グリッドベースの表現と比較して、強度の精度を高め、ピクセルあたりのサンプル数を大幅に削減できることを示しています。フレーム化されたソースでは、同様のピクセル値の一時的な平均化によって少量の損失を許容することで、VMAF 品質スコアをわずか 4.5 低下させながら、代表的なサンプル レートを半分以上削減できることを示しています。また、2000 倍の時間解像度を維持しながら、フレーム化されたカメラ データとイベント カメラ データを強度表現に融合およびトランスコードする最先端の方法よりも低いレイテンシを示します。私たちの方法は、イベントカメラ用のリアルタイムの強度ベースのアプリケーションを構築するために必要な計算効率と時間的粒度を提供すると主張します。
Neuromorphic "event" cameras, designed to mimic the human vision system with asynchronous sensing, unlock a new realm of high-speed and high dynamic range applications. However, researchers often either revert to a framed representation of event data for applications, or build bespoke applications for a particular camera's event data type. To usher in the next era of video systems, accommodate new event camera designs, and explore the benefits to asynchronous video in classical applications, we argue that there is a need for an asynchronous, source-agnostic video representation. In this paper, we introduce a novel, asynchronous intensity representation for both framed and non-framed data sources. We show that our representation can increase intensity precision and greatly reduce the number of samples per pixel compared to grid-based representations. With framed sources, we demonstrate that by permitting a small amount of loss through the temporal averaging of similar pixel values, we can reduce our representational sample rate by more than half, while incurring a drop in VMAF quality score of only 4.5. We also demonstrate lower latency than the state-of-the-art method for fusing and transcoding framed and event camera data to an intensity representation, while maintaining 2000× the temporal resolution. We argue that our method provides the computational efficiency and temporal granularity necessary to build real-time intensity-based applications for event cameras.
updated: Fri Jan 20 2023 19:46:23 GMT+0000 (UTC)
published: Fri Jan 20 2023 19:46:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト