転倒検出は、健康と機械学習の両方の観点から重要な問題です。転倒は、場合によっては重傷、長期的な障害、さらには死に至る場合があります。機械学習の観点では、転倒がめったに起こらないという事実により、転倒のトレーニングデータがほとんどまたはまったくない、深刻なクラスの不均衡の問題が発生します。このホワイトペーパーでは、通常のアクティビティ(豊富に利用できる)のみで分類子をトレーニングし、転倒を異常として識別することにより、トレーニングデータがない場合の転倒を検出する代替の哲学を採用しています。このような分類器を実現するために、入力ビデオフレームを再構成するための時空間オートエンコーダと、元のビデオフレームと区別するための時空間畳み込みネットワークで構成される敵対学習フレームワークを使用します。 3Dコンボリューションは、入力ビデオフレームから空間的および時間的特徴を学習するために使用されます。時空間オートエンコーダの敵対的学習により、日常生活の通常の活動を効率的に再構築することができます。したがって、目に見えない検出をレンダリングすることは、このフレームワーク内でもっともらしいです。サーマルカメラや深度カメラなど、個人のプライバシーを(完全または部分的に)保持できるカメラセンシングモダリティで、提案されたフレームワークのパフォーマンスをテストしました。 3つの公開データセットの結果は、提案された時空間敵対的フレームワークが他のベースラインフレームベース(または空間)敵対的学習方法よりも優れたパフォーマンスを発揮したことを示しています。
Fall detection is an important problem from both the health and machine learning perspective. A fall can lead to severe injuries, long term impairments or even death in some cases. In terms of machine learning, it presents a severely class imbalance problem with very few or no training data for falls owing to the fact that falls occur rarely. In this paper, we take an alternate philosophy to detect falls in the absence of their training data, by training the classifier on only the normal activities (that are available in abundance) and identifying a fall as an anomaly. To realize such a classifier, we use an adversarial learning framework, which comprises of a spatio-temporal autoencoder for reconstructing input video frames and a spatio-temporal convolution network to discriminate them against original video frames. 3D convolutions are used to learn spatial and temporal features from the input video frames. The adversarial learning of the spatio-temporal autoencoder will enable reconstructing the normal activities of daily living efficiently; thus, rendering detecting unseen falls plausible within this framework. We tested the performance of the proposed framework on camera sensing modalities that may preserve an individual's privacy (fully or partially), such as thermal and depth camera. Our results on three publicly available datasets show that the proposed spatio-temporal adversarial framework performed better than other baseline frame based (or spatial) adversarial learning methods.