arXiv reaDer
社会的距離の違反を特定するためのコンピュータビジョンと時間グラフを使用した公共のシーンの全体的な解釈
Holistic Interpretation of Public Scenes Using Computer Vision and Temporal Graphs to Identify Social Distancing Violations
COVID-19のパンデミックは、前例のない世界的な公衆衛生危機を引き起こしました。その固有の性質を考慮して、このパンデミックの拡大を抑制するための主要な戦略として、社会的距離の測定が提案されています。したがって、これらのプロトコルに違反している状況を特定することは、病気の蔓延を抑え、持続可能なライフスタイルを促進することに影響を及ぼします。この論文は、CCTV映像を分析して、COVID-19感染の脅威レベルの評価を提供するための新しいコンピュータビジョンベースのシステムを提案します。このシステムは、複数のフレームにまたがるCCTV映像の情報コンテンツを全体的にキャプチャして解釈し、時間と空間にわたる社会的距離プロトコルのさまざまな違反のインスタンスを認識し、グループの行動を特定するよう努めています。この機能は、主に時間的なグラフベースの構造を利用してCCTVフッテージの情報を表し、グラフを全体的に解釈して特定のシーンの脅威レベルを定量化する戦略によって実現されます。個々のコンポーネントはさまざまなシナリオでテストおよび検証され、システム全体が人間の専門家の意見に照らしてテストされます。結果は、脅威レベルの人々への依存、彼らの物理的近接性、相互作用、防護服、およびグループダイナミクスを反映しています。システムのパフォーマンスの精度は76%であるため、都市で展開可能な脅威監視システムを使用して、社会の正常性と持続可能性を実現できます。
The COVID-19 pandemic has caused an unprecedented global public health crisis. Given its inherent nature, social distancing measures are proposed as the primary strategies to curb the spread of this pandemic. Therefore, identifying situations where these protocols are violated, has implications for curtailing the spread of the disease and promoting a sustainable lifestyle. This paper proposes a novel computer vision-based system to analyze CCTV footage to provide a threat level assessment of COVID-19 spread. The system strives to holistically capture and interpret the information content of CCTV footage spanning multiple frames to recognize instances of various violations of social distancing protocols, across time and space, as well as identification of group behaviors. This functionality is achieved primarily by utilizing a temporal graph-based structure to represent the information of the CCTV footage and a strategy to holistically interpret the graph and quantify the threat level of the given scene. The individual components are tested and validated on a range of scenarios and the complete system is tested against human expert opinion. The results reflect the dependence of the threat level on people, their physical proximity, interactions, protective clothing, and group dynamics. The system performance has an accuracy of 76%, thus enabling a deployable threat monitoring system in cities, to permit normalcy and sustainability in the society.
updated: Wed Aug 17 2022 18:18:28 GMT+0000 (UTC)
published: Mon Dec 13 2021 05:52:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト