arXiv reaDer
人間のポーズを使用したビデオベースの落下検出
Video Based Fall Detection Using Human Poses
深い畳み込みニューラルネットワークの最近の進歩により、ビデオベースの落下検出精度が大幅に向上しました。ただし、照明の変化、複雑な背景など、これらのアプローチの精度と一般化能力を低下させるいくつかの課題がまだ存在します。一方、計算コストが大きいと、既存の落下検出アプローチの適用が制限されます。これらの問題を軽減するために、人間のポーズを使用したビデオベースの転倒検出アプローチがこの論文で提案されています。最初に、軽量ポーズ推定器がビデオシーケンスから2Dポーズを抽出し、次に2Dポーズが3Dポーズに持ち上げられます。次に、推定された3Dポーズを使用して転倒イベントを認識する堅牢な転倒検出ネットワークを導入します。これにより、それぞれのフィールドが増加し、畳み込みが拡張されることで計算コストが低く抑えられます。実験結果は、提案された落下検出アプローチが、大規模なベンチマークアクション認識データセットNTU RGB + Dで99.83%の高精度を達成し、非GPUプラットフォームで18 FPS、GPUプラットフォームで63FPSのリアルタイムパフォーマンスを達成することを示しています。
Video based fall detection accuracy has been largely improved due to the recent progress on deep convolutional neural networks. However, there still exists some challenges, such as lighting variation, complex background, which degrade the accuracy and generalization ability of these approaches. Meanwhile, large computation cost limits the application of existing fall detection approaches. To alleviate these problems, a video based fall detection approach using human poses is proposed in this paper. First, a lightweight pose estimator extracts 2D poses from video sequences and then 2D poses are lifted to 3D poses. Second, we introduce a robust fall detection network to recognize fall events using estimated 3D poses, which increases respective filed and maintains low computation cost by dilated convolutions. The experimental results show that the proposed fall detection approach achieves a high accuracy of 99.83% on large benchmark action recognition dataset NTU RGB+D and real-time performance of 18 FPS on a non-GPU platform and 63 FPS on a GPU platform.
updated: Thu Jul 29 2021 03:02:12 GMT+0000 (UTC)
published: Thu Jul 29 2021 03:02:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト