arXiv reaDer
リアルタイムの自動カメラ パラメータ チューニングによるビデオ分析の精度の向上
Enhancing Video Analytics Accuracy via Real-time Automated Camera Parameter Tuning
ビデオ分析パイプライン (VAP) では、リモート サーバーで実行されるオブジェクト検出や顔認識などの分析ユニット (AU) は、高精度を達成するために高品質のビデオ ストリームをキャプチャする監視カメラに大きく依存しています。最新の IP カメラには、ビデオ ストリーム キャプチャの品質に直接影響する多数のカメラ パラメータが付属しています。露出、フォーカス、ホワイト バランスなどのパラメータのいくつかは、カメラ内部で自動的に調整されますが、残りのパラメータは調整されません。このようなカメラ パラメーターを非自動 (NAUTO) パラメーターと呼びます。このホワイトペーパーでは、環境条件の変化がAUからの洞察の精度に重大な悪影響を与える可能性があることを最初に示しますが、そのような悪影響は、環境条件の変化に応じてNAUTOカメラパラメーターを動的に調整することで軽減できる可能性があります.次に、私たちの知る限りでは、環境条件の不利な変化に対応して VAP 内の AU の精度を最適化するために NAUTO カメラ パラメーターを動的に適応させる最初のフレームワークである CamTuner を提示します。 CamTuner は SARSA 強化学習に基づいており、2 つの新しいコンポーネントが組み込まれています。軽量の分析品質推定器と、オフラインの RL トレーニングを大幅に高速化する仮想カメラです。私たちの制御された実験と実際の VAP 展開は、デフォルトのカメラ設定を使用した VAP と比較して、CamTuner が大企業の駐車場で 15.9% の追加の人物と 2.6% ~ 4.2% の追加の車を (誤検出なしで) 検出することにより、VAP の精度を向上させることを示しています。 5G スマート交通交差点シナリオでは、多くの車両と 9.7% の追加の車があり、正確で信頼性の高い自動車両衝突予測 (AVCP) の新しいユースケースが可能になります。 CamTuner は、ディープ ラーニング モデルの改良による段階的な改善を超えて、ビデオ分析の精度を大幅に向上させる新しい方法への扉を開きます。
In Video Analytics Pipelines (VAP), Analytics Units (AUs) such as object detection and face recognition running on remote servers critically rely on surveillance cameras to capture high-quality video streams in order to achieve high accuracy. Modern IP cameras come with a large number of camera parameters that directly affect the quality of the video stream capture. While a few of such parameters, e.g., exposure, focus, white balance are automatically adjusted by the camera internally, the remaining ones are not. We denote such camera parameters as non-automated (NAUTO) parameters. In this paper, we first show that environmental condition changes can have significant adverse effect on the accuracy of insights from the AUs, but such adverse impact can potentially be mitigated by dynamically adjusting NAUTO camera parameters in response to changes in environmental conditions. We then present CamTuner, to our knowledge, the first framework that dynamically adapts NAUTO camera parameters to optimize the accuracy of AUs in a VAP in response to adverse changes in environmental conditions. CamTuner is based on SARSA reinforcement learning and it incorporates two novel components: a light-weight analytics quality estimator and a virtual camera that drastically speed up offline RL training. Our controlled experiments and real-world VAP deployment show that compared to a VAP using the default camera setting, CamTuner enhances VAP accuracy by detecting 15.9% additional persons and 2.6%-4.2% additional cars (without any false positives) in a large enterprise parking lot and 9.7% additional cars in a 5G smart traffic intersection scenario, which enables a new usecase of accurate and reliable automatic vehicle collision prediction (AVCP). CamTuner opens doors for new ways to significantly enhance video analytics accuracy beyond incremental improvements from refining deep-learning models.
updated: Thu Sep 15 2022 20:47:47 GMT+0000 (UTC)
published: Thu Jul 08 2021 16:43:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト