コンピューター ビジョンと機械学習技術の進歩により、RGB カメラ、LiDAR、レーダーからの 2D および 3D の人間の姿勢推定が大幅に発展しました。ただし、画像からの人間の姿勢の推定は、関心のある多くのシナリオで一般的なオクルージョンと照明によって悪影響を受けます。一方、レーダーおよび LiDAR テクノロジーには、高価で電力を大量に消費する特殊なハードウェアが必要です。さらに、これらのセンサーを非公開エリアに配置すると、プライバシーに関する重大な懸念が生じます。これらの制限に対処するために、最近の研究では、WiFi アンテナ (1D センサー) を身体のセグメンテーションとキーポイント身体検出に使用することが調査されています。このホワイト ペーパーでは、コンピューター ビジョンで一般的に使用されるディープ ラーニング アーキテクチャと組み合わせた WiFi 信号の使用についてさらに詳しく説明し、高密度の人間のポーズの対応を推定します。私たちは、WiFi 信号の位相と振幅を人間の 24 の領域内の UV 座標にマッピングするディープ ニューラル ネットワークを開発しました。調査の結果、私たちのモデルは、WiFi 信号のみを入力として利用することで、画像ベースのアプローチに匹敵するパフォーマンスで、複数の被験者の密集したポーズを推定できることが明らかになりました。これにより、低コストで広くアクセスでき、プライバシーを保護する人間のセンシング用アルゴリズムへの道が開かれます。
Advances in computer vision and machine learning techniques have led to significant development in 2D and 3D human pose estimation from RGB cameras, LiDAR, and radars. However, human pose estimation from images is adversely affected by occlusion and lighting, which are common in many scenarios of interest. Radar and LiDAR technologies, on the other hand, need specialized hardware that is expensive and power-intensive. Furthermore, placing these sensors in non-public areas raises significant privacy concerns. To address these limitations, recent research has explored the use of WiFi antennas (1D sensors) for body segmentation and key-point body detection. This paper further expands on the use of the WiFi signal in combination with deep learning architectures, commonly used in computer vision, to estimate dense human pose correspondence. We developed a deep neural network that maps the phase and amplitude of WiFi signals to UV coordinates within 24 human regions. The results of the study reveal that our model can estimate the dense pose of multiple subjects, with comparable performance to image-based approaches, by utilizing WiFi signals as the only input. This paves the way for low-cost, broadly accessible, and privacy-preserving algorithms for human sensing.