arXiv reaDer
テキストクエリを使用した監視における人の検索:レビュー
Person Retrieval in Surveillance Using Textual Query: A Review
バイオメトリクス、コンピュータービジョン、自然言語処理の研究の最近の進歩により、テキストクエリを使用して監視ビデオから人を検索する機会が発見されました。監視システムの主な目的は、説明を使用して人物を特定することです。たとえば、ピンクのTシャツと白いスカートを着た短い女性が黒い財布を持っています。彼女の髪は茶色い。このような説明には、性別、身長、衣服の種類、衣服の色、髪の色、アクセサリーなどの属性が含まれています。このような属性は、正式にはソフトバイオメトリクスとして知られています。テキストクエリには人のソフトな生体認証属性が含まれているため、人間の説明と機械の間のセマンティックギャップを埋めるのに役立ちます。また、特定の人物を取得するために大量の監視映像を手動で検索することもできません。したがって、視覚と言語ベースのアルゴリズムを使用した自動人物検索が一般的になりつつあります。他の最先端のレビューと比較して、この論文の貢献は次のとおりです。1。特定の困難な条件に対して最も識別力のあるソフトバイオメトリクスを推奨します。 2.客観的なパフォーマンス評価のために、ベンチマークデータセットと取得方法を統合します。 3.機能、分類子、ソフト生体認証属性の数、ディープニューラルネットワークのタイプ、およびパフォーマンス測定に基づく手法の完全なスナップショット。 4.手作りの特徴に基づく方法から、自然言語の記述に基づくエンドツーエンドのアプローチまで、人の検索を包括的にカバーします。
Recent advancement of research in biometrics, computer vision, and natural language processing has discovered opportunities for person retrieval from surveillance videos using textual query. The prime objective of a surveillance system is to locate a person using a description, e.g., a short woman with a pink t-shirt and white skirt carrying a black purse. She has brown hair. Such a description contains attributes like gender, height, type of clothing, colour of clothing, hair colour, and accessories. Such attributes are formally known as soft biometrics. They help bridge the semantic gap between a human description and a machine as a textual query contains the person's soft biometric attributes. It is also not feasible to manually search through huge volumes of surveillance footage to retrieve a specific person. Hence, automatic person retrieval using vision and language-based algorithms is becoming popular. In comparison to other state-of-the-art reviews, the contribution of the paper is as follows: 1. Recommends most discriminative soft biometrics for specifiic challenging conditions. 2. Integrates benchmark datasets and retrieval methods for objective performance evaluation. 3. A complete snapshot of techniques based on features, classifiers, number of soft biometric attributes, type of the deep neural networks, and performance measures. 4. The comprehensive coverage of person retrieval from handcrafted features based methods to end-to-end approaches based on natural language description.
updated: Thu May 06 2021 03:17:13 GMT+0000 (UTC)
published: Thu May 06 2021 03:17:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト