arXiv reaDer
高解像度イベントカメラによる歩行者検知
Pedestrian detection with high-resolution event camera
コンピュータービジョンアルゴリズムのダイナミックな発展にもかかわらず、ドローンや自動運転車などの自動運転車の認識および制御システムの実装には、依然として多くの課題が残されています。従来のカメラでキャプチャされたビデオ ストリームは、厳しい照明条件によるモーション ブラーや画質の低下などの問題が発生しやすいことがよくあります。さらに、フレーム レート (通常は 1 秒あたり 30 または 60 フレーム) が、特定のシナリオでは制限要因となる可能性があります。イベント カメラ (DVS -- ダイナミック ビジョン センサー) は、上記の問題に対処する潜在的に興味深いテクノロジーです。この論文では、歩行者検出タスクのために深層学習を使用してイベント データを処理する 2 つの方法を比較します。ビデオ フレーム、畳み込みニューラル ネットワーク、および非同期スパース畳み込みニューラル ネットワークの形式で表現を使用しました。得られた結果は、イベント カメラの可能性を示し、高解像度 (1280 x 720 ピクセル) の映像に使用される方法の精度と効率の評価を可能にします。
Despite the dynamic development of computer vision algorithms, the implementation of perception and control systems for autonomous vehicles such as drones and self-driving cars still poses many challenges. A video stream captured by traditional cameras is often prone to problems such as motion blur or degraded image quality due to challenging lighting conditions. In addition, the frame rate - typically 30 or 60 frames per second - can be a limiting factor in certain scenarios. Event cameras (DVS -- Dynamic Vision Sensor) are a potentially interesting technology to address the above mentioned problems. In this paper, we compare two methods of processing event data by means of deep learning for the task of pedestrian detection. We used a representation in the form of video frames, convolutional neural networks and asynchronous sparse convolutional neural networks. The results obtained illustrate the potential of event cameras and allow the evaluation of the accuracy and efficiency of the methods used for high-resolution (1280 x 720 pixels) footage.
updated: Mon May 29 2023 10:57:59 GMT+0000 (UTC)
published: Mon May 29 2023 10:57:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト