対照学習は、大量のラベルなしデータと少量のラベル付きデータを使用した教師あり学習に匹敵するパフォーマンスを達成できるため、センサーデータに基づく人間活動認識(HAR)に適用されています。対照学習の事前トレーニングタスクは、通常、インスタンスの識別です。これは、各インスタンスが単一のクラスに属することを指定しますが、これは、同じクラスのサンプルを否定的な例と見なします。このような事前トレーニングタスクは、主に分類タスクである人間の活動認識タスクを助長しません。この問題に対処するために、SimCLRに従って、クラスターCLHARと呼ばれるHARでのクラスタリングによるネガティブセレクションという新しい対照学習フレームワークを提案します。 SimCLRと比較すると、教師なしクラスタリング手法を使用して、同じクラスターの他のサンプルをネガティブサンプルと見なさないようにマスクするソフトラベルを生成することにより、対照損失関数のネガティブペアを再定義します。 ClusterCLHARは、USC-HAD、MotionSense、およびUCI-HARの3つのベンチマークデータセットで、平均F1スコアを評価指標として使用して評価します。実験結果は、自己監視学習と半教師あり学習でHARに適用されるすべての最先端の方法よりも優れていることを示しています。
Contrastive learning has been applied to Human Activity Recognition (HAR) based on sensor data owing to its ability to achieve performance comparable to supervised learning with a large amount of unlabeled data and a small amount of labeled data. The pre-training task for contrastive learning is generally instance discrimination, which specifies that each instance belongs to a single class, but this will consider the same class of samples as negative examples. Such a pre-training task is not conducive to human activity recognition tasks, which are mainly classification tasks. To address this problem, we follow SimCLR to propose a new contrastive learning framework that negative selection by clustering in HAR, which is called ClusterCLHAR. Compared with SimCLR, it redefines the negative pairs in the contrastive loss function by using unsupervised clustering methods to generate soft labels that mask other samples of the same cluster to avoid regarding them as negative samples. We evaluate ClusterCLHAR on three benchmark datasets, USC-HAD, MotionSense, and UCI-HAR, using mean F1-score as the evaluation metric. The experiment results show that it outperforms all the state-of-the-art methods applied to HAR in self-supervised learning and semi-supervised learning.