arXiv reaDer
Booster-SHOT: 注意を払ってマルチビュー歩行者検出を行うためのスタック ホモグラフィ変換のブースト
Booster-SHOT: Boosting Stacked Homography Transformations for Multiview Pedestrian Detection with Attention
マルチビュー アグリゲーションの改善は、マルチビュー歩行者検出に不可欠です。これは、一連のキャリブレーションされたカメラでキャプチャされた画像から鳥瞰図の歩行者占有マップを取得することを目的としています。ディープ ニューラル ネットワークのアテンション モジュールの成功に触発されて、最初にホモグラフィ アテンション モジュール (HAM) を提案します。これは、新しいチャネル ゲートと空間ゲートを利用することで、既存のエンド ツー エンドのマルチビュー検出アプローチのパフォーマンスを向上させることが示されています。さらに、Booster-SHOT を提案します。これは、提案された HAM と、ビュー コヒーレント拡張やスタック ホモグラフィ変換などの以前のアプローチの要素を組み込んだマルチビュー歩行者検出へのエンド ツー エンドの畳み込みアプローチです。 Booster-SHOT は、Wildtrack と MultiviewX の MODA でそれぞれ 92.9% と 94.2% を達成し、最新技術を Wildtrack で 1.4%、MultiviewX で 0.5% 上回っており、全体として標準評価の最先端のパフォーマンスを達成しています。マルチビューの歩行者検出に使用されるメトリック。
Improving multi-view aggregation is integral for multi-view pedestrian detection, which aims to obtain a bird's-eye-view pedestrian occupancy map from images captured through a set of calibrated cameras. Inspired by the success of attention modules for deep neural networks, we first propose a Homography Attention Module (HAM) which is shown to boost the performance of existing end-to-end multiview detection approaches by utilizing a novel channel gate and spatial gate. Additionally, we propose Booster-SHOT, an end-to-end convolutional approach to multiview pedestrian detection incorporating our proposed HAM as well as elements from previous approaches such as view-coherent augmentation or stacked homography transformations. Booster-SHOT achieves 92.9% and 94.2% for MODA on Wildtrack and MultiviewX respectively, outperforming the state-of-the-art by 1.4% on Wildtrack and 0.5% on MultiviewX, achieving state-of-the-art performance overall for standard evaluation metrics used in multi-view pedestrian detection.
updated: Fri Aug 19 2022 08:24:40 GMT+0000 (UTC)
published: Fri Aug 19 2022 08:24:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト