arXiv reaDer
残差計算を行わない車両の検出と分類: ランダム摂動注入による HEVC 画像デコードの高速化
Vehicle Detection and Classification without Residual Calculation: Accelerating HEVC Image Decoding with Random Perturbation Injection
ビデオ分析、特に交通監視の分野では、ビデオ データを処理および理解するための効率的かつ効果的な方法に対するニーズが高まっています。従来のフル ビデオ デコード技術は計算量が多く、時間がかかる可能性があるため、研究者は圧縮領域での代替アプローチを模索しています。この研究では、特に交通監視アプリケーション向けに設計された、高効率ビデオ符号化 (HEVC) ビットストリームから画像を再構成するための新しいランダム摂動ベースの圧縮ドメイン法を紹介します。私たちの知る限り、私たちの方法は、残差値をランダムな摂動に置き換えることを初めて提案し、ビデオ理解タスクに関連する情報を保持しながら元の画像の凝縮された表現を作成し、特に主要なユースケースとして車両の検出と分類に焦点を当てています。残差データを使用しないことにより、私たちの提案方法は画像再構成プロセスに必要なデータを大幅に削減し、より効率的な情報の保存と送信を可能にします。これは、監視アプリケーションに関係する膨大な量のビデオ データを考慮する場合に特に重要です。公開されている BIT-Vehicle データセットに適用すると、従来の完全デコード手法と比較して再構築速度が大幅に向上し、提案した手法はピクセル ドメイン手法より約 56% 高速であることが実証されました。さらに、ピクセル ドメイン法と同等の 99.9% の検出精度と、ピクセル ドメイン法よりわずか 0.98% 低い 96.84% の分類精度を達成しました。さらに、データ サイズが大幅に削減され、より効率的なストレージと送信が可能になることを紹介します。私たちの研究により、速度とデータ サイズが重要な要素となる交通監視アプリケーションにおける圧縮ドメイン方式の可能性が確立されました。
In the field of video analytics, particularly traffic surveillance, there is a growing need for efficient and effective methods for processing and understanding video data. Traditional full video decoding techniques can be computationally intensive and time-consuming, leading researchers to explore alternative approaches in the compressed domain. This study introduces a novel random perturbation-based compressed domain method for reconstructing images from High Efficiency Video Coding (HEVC) bitstreams, specifically designed for traffic surveillance applications. To the best of our knowledge, our method is the first to propose substituting random perturbations for residual values, creating a condensed representation of the original image while retaining information relevant to video understanding tasks, particularly focusing on vehicle detection and classification as key use cases. By not using residual data, our proposed method significantly reduces the data needed in the image reconstruction process, allowing for more efficient storage and transmission of information. This is particularly important when considering the vast amount of video data involved in surveillance applications. Applied to the public BIT-Vehicle dataset, we demonstrate a significant increase in the reconstruction speed compared to the traditional full decoding approach, with our proposed method being approximately 56% faster than the pixel domain method. Additionally, we achieve a detection accuracy of 99.9%, on par with the pixel domain method, and a classification accuracy of 96.84%, only 0.98% lower than the pixel domain method. Furthermore, we showcase the significant reduction in data size, leading to more efficient storage and transmission. Our research establishes the potential of compressed domain methods in traffic surveillance applications, where speed and data size are critical factors.
updated: Sun May 14 2023 22:04:00 GMT+0000 (UTC)
published: Sun May 14 2023 22:04:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト