arXiv reaDer
センサーベースの人間活動の認識とセグメンテーションのためのマルチタスク ディープ ラーニング アプローチ
A Multi-Task Deep Learning Approach for Sensor-based Human Activity Recognition and Segmentation
センサーベースの人間の活動のセグメンテーションと認識は、多くの現実世界のアプリケーションで重要かつ困難な問題であり、近年、深層学習コミュニティからますます注目を集めています。既存の深層学習の作業のほとんどは、事前にセグメント化されたセンサー ストリームに基づいて設計されており、アクティビティのセグメント化と認識を 2 つの別個のタスクとして扱っています。実際には、データ ストリームのセグメンテーションの実行は非常に困難です。活動のセグメンテーションと認識の両方が、互いに補完して 2 つのタスクのパフォーマンスを向上させることができる独自の情報を伝える可能性があると考えています。この論文では、最初に、2 つのタスクを同時に解決する新しいマルチタスク ディープ ニューラル ネットワークを提案します。提案されたニューラル ネットワークは、選択的畳み込みを採用し、長時間または短時間のアクティビティをセグメント化するためのマルチスケール ウィンドウを備えています。最初に、異なるスケールの複数のウィンドウが、特徴シーケンスの各ユニットを中心に生成されます。次に、ウィンドウごとに、アクティビティ クラスと実際のアクティビティ境界へのオフセットを予測するようにモデルをトレーニングします。最後に、重複するウィンドウは非最大抑制によって除外され、同じアクティビティの隣接するウィンドウが連結されてセグメンテーション タスクが完了します。 8 つの一般的なベンチマーク データセットに対して広範な実験が行われ、結果は、提案された方法が、アクティビティの認識とセグメンテーションの両方で最先端の方法より優れていることを示しています。
Sensor-based human activity segmentation and recognition are two important and challenging problems in many real-world applications and they have drawn increasing attention from the deep learning community in recent years. Most of the existing deep learning works were designed based on pre-segmented sensor streams and they have treated activity segmentation and recognition as two separate tasks. In practice, performing data stream segmentation is very challenging. We believe that both activity segmentation and recognition may convey unique information which can complement each other to improve the performance of the two tasks. In this paper, we firstly proposes a new multitask deep neural network to solve the two tasks simultaneously. The proposed neural network adopts selective convolution and features multiscale windows to segment activities of long or short time durations. First, multiple windows of different scales are generated to center on each unit of the feature sequence. Then, the model is trained to predict, for each window, the activity class and the offset to the true activity boundaries. Finally, overlapping windows are filtered out by non-maximum suppression, and adjacent windows of the same activity are concatenated to complete the segmentation task. Extensive experiments were conducted on eight popular benchmarking datasets, and the results show that our proposed method outperforms the state-of-the-art methods both for activity recognition and segmentation.
updated: Mon Mar 20 2023 13:34:28 GMT+0000 (UTC)
published: Mon Mar 20 2023 13:34:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト