企業は、ビデオ分析のために大規模なカメラネットワークをますます導入しています。多くのターゲットアプリケーションには、共通の問題テンプレートが必要です。ライブビデオの大規模なカメラネットワークを介して、目的のオブジェクトまたはアクティビティ(高速化車両、侵入など)を検索および追跡します。このようなクロスカメラ分析は計算とデータ集約型であり、カメラの数と時間とともにコストが増加します。このコストの課題に対処するために、効率的なクロスカメラビデオ分析のための新しいシステムであるReXCamを紹介します。 ReXCamは、実際のカメラネットワークのダイナミクスの空間的および時間的局所性を活用して、クエリIDの推論時間検索をガイドします。オフラインプロファイリングフェーズでは、ReXCamは、過去のトラフィックパターンで観察された局所性をエンコードするクロスカメラ相関モデルを構築します。推論時に、ReXCamはこのモデルを適用して、クエリIDの現在の位置と空間的および時間的に相関しないフレームをフィルターします。不定期に検出されなかった場合、ReXCamは最近フィルター処理されたビデオフレームに対して高速リプレイ検索を実行し、適切な回復を可能にします。これらの技術を組み合わせることで、ReXCamは8台のカメラのデータセットで計算の負荷を8.3倍、シミュレートされた130台のカメラのデータセットで23倍から38倍削減できます。 ReXCamは、5台のAWS DeepLensカメラのテストベッドに実装およびデプロイされています。
Enterprises are increasingly deploying large camera networks for video analytics. Many target applications entail a common problem template: searching for and tracking an object or activity of interest (e.g. a speeding vehicle, a break-in) through a large camera network in live video. Such cross-camera analytics is compute and data intensive, with cost growing with the number of cameras and time. To address this cost challenge, we present ReXCam, a new system for efficient cross-camera video analytics. ReXCam exploits spatial and temporal locality in the dynamics of real camera networks to guide its inference-time search for a query identity. In an offline profiling phase, ReXCam builds a cross-camera correlation model that encodes the locality observed in historical traffic patterns. At inference time, ReXCam applies this model to filter frames that are not spatially and temporally correlated with the query identity's current position. In the cases of occasional missed detections, ReXCam performs a fast-replay search on recently filtered video frames, enabling gracefully recovery. Together, these techniques allow ReXCam to reduce compute workload by 8.3x on an 8-camera dataset, and by 23x - 38x on a simulated 130-camera dataset. ReXCam has been implemented and deployed on a testbed of 5 AWS DeepLens cameras.