この作業は、日常生活動作が自然に行われる大規模なデータセットを構築することを目的としています。自発的に実行される活動は、ビジョンコミュニティによってしばしば無視される多くの現実世界の課題につながります。これには、同様のアクティビティが存在するためにクラス間が低く、クラス内の分散が大きい、カメラのフレーミングが低い、解像度が低い、アクティビティのロングテール分布、およびオクルージョンが含まれます。この目的のために、Toyota Smarthome Untrimmed(TSU)データセットを提案します。これは、現実世界のシナリオでの複雑なアクティビティの検出に対処するために、豊富で高密度の注釈を付けた自発的なアクティビティを提供します。
This work aims at building a large scale dataset with daily-living activities performed in a natural manner. Activities performed in a spontaneous manner lead to many real-world challenges that are often ignored by the vision community. This includes low inter-class due to the presence of similar activities and high intra-class variance, low camera framing, low resolution, long-tail distribution of activities, and occlusions. To this end, we propose the Toyota Smarthome Untrimmed (TSU) dataset, which provides spontaneous activities with rich and dense annotations to address the detection of complex activities in real-world scenarios.