arXiv reaDer
HuPR: ミリ波レーダーを使用した人間の姿勢推定のベンチマーク
HuPR: A Benchmark for Human Pose Estimation Using Millimeter Wave Radar
このホワイト ペーパーでは、新しい人間の姿勢推定ベンチマークであるミリ波レーダーを使用した人間の姿勢 (HuPR) を紹介します。これには、同期された視覚および無線信号コンポーネントが含まれます。このデータセットは、クロス キャリブレーションされた mmWave レーダー センサーと単眼 RGB カメラを使用して作成され、レーダー ベースの人間の姿勢推定のクロス モダリティ トレーニングを行います。ミリ波レーダーを使用して人間の姿勢を推定することには、2 つの利点があります。まず、暗い環境や低照度環境に強いです。第二に、人間が視覚的に認識できないため、病室の監視システムなど、プライバシーに配慮したアプリケーションに広く適用できます。ベンチマークに加えて、トレーニング用の人体関節を表すグラウンド トゥルース 2D キーポイントを活用するクロスモダリティ トレーニング フレームワークを提案します。これは、単眼カメラ入力画像に基づいて事前トレーニング済みの 2D ポーズ推定ネットワークから体系的に生成されます。手間のかかる手動のラベル注釈作業を回避します。このフレームワークは、レーダー データから速度情報をより適切に抽出する新しいレーダー前処理方法、マルチスケール レーダー機能を融合する Cross-and Self-Attention Module (CSAM)、および Pose Refinement Graph Convolutional Networks (PRGCN) で構成されています。予測されたキーポイント信頼度ヒートマップを改良します。 HuPR ベンチマークに関する集中的な実験では、従来の前処理ソリューションや以前の無線周波数ベースの方法と比較して、提案されたスキームがレーダー データのみでより優れた人間の姿勢推定パフォーマンスを達成することが示されています。
This paper introduces a novel human pose estimation benchmark, Human Pose with Millimeter Wave Radar (HuPR), that includes synchronized vision and radio signal components. This dataset is created using cross-calibrated mmWave radar sensors and a monocular RGB camera for cross-modality training of radar-based human pose estimation. There are two advantages of using mmWave radar to perform human pose estimation. First, it is robust to dark and low-light conditions. Second, it is not visually perceivable by humans and thus, can be widely applied to applications with privacy concerns, e.g., surveillance systems in patient rooms. In addition to the benchmark, we propose a cross-modality training framework that leverages the ground-truth 2D keypoints representing human body joints for training, which are systematically generated from the pre-trained 2D pose estimation network based on a monocular camera input image, avoiding laborious manual label annotation efforts. The framework consists of a new radar pre-processing method that better extracts the velocity information from radar data, Cross- and Self-Attention Module (CSAM), to fuse multi-scale radar features, and Pose Refinement Graph Convolutional Networks (PRGCN), to refine the predicted keypoint confidence heatmaps. Our intensive experiments on the HuPR benchmark show that the proposed scheme achieves better human pose estimation performance with only radar data, as compared to traditional pre-processing solutions and previous radio-frequency-based methods.
updated: Sat Oct 22 2022 22:28:40 GMT+0000 (UTC)
published: Sat Oct 22 2022 22:28:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト