arXiv reaDer
ビデオオブジェクト検出のための動きベクトル外挿
Motion Vector Extrapolation for Video Object Detection
ビデオオブジェクト検出のための計算効率の高いディープニューラルネットワークアーキテクチャの継続的な成功にもかかわらず、パフォーマンスは、速度対精度対計算リソースの大きなトリレンマに絶えず到達しています(2つ選択)。このトリレンマを克服するためにビデオデータの時間情報を利用する現在の試みは、オブジェクト検出モデルの最先端によってボトルネックになっています。既成の物体検出器を既存のオプティカルフローベースの動き推定技術と並行して使用することにより、ビデオ物体検出を実行する技術を提示します。ベンチマークMOT20データセットでの一連の実験を通じて、私たちのアプローチは、精度を犠牲にすることなく、特定のオブジェクト検出器のベースライン遅延を大幅に削減することを示しています。精度の低下を最小限に抑えながら、元のレイテンシーの最大25分の1のレイテンシー削減を実現できます。 MOVEXは、一般的なCPUベースのシステムで低遅延のビデオオブジェクト検出を可能にするため、GPUコンピューティングの領域を超えた高性能のビデオオブジェクト検出を可能にします。コードはhttps://github.com/juliantrue/movexで入手できます。
Despite the continued successes of computationally efficient deep neural network architectures for video object detection, performance continually arrives at the great trilemma of speed versus accuracy versus computational resources (pick two). Current attempts to exploit temporal information in video data to overcome this trilemma are bottlenecked by the state-of-the-art in object detection models. We present, a technique which performs video object detection through the use of off-the-shelf object detectors alongside existing optical flow based motion estimation techniques in parallel. Through a set of experiments on the benchmark MOT20 dataset, we demonstrate that our approach significantly reduces the baseline latency of any given object detector without sacrificing any accuracy. Further latency reduction, up to 25x lower than the original latency, can be achieved with minimal accuracy loss. MOVEX enables low latency video object detection on common CPU based systems, thus allowing for high performance video object detection beyond the domain of GPU computing. The code is available at https://github.com/juliantrue/movex.
updated: Sun Apr 18 2021 17:26:37 GMT+0000 (UTC)
published: Sun Apr 18 2021 17:26:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト