arXiv reaDer
疑似3D注視を使用した画像ベースの相互注視検出の強化
Boosting Image-based Mutual Gaze Detection using Pseudo 3D Gaze
相互の視線検出、つまり2人がお互いを見ているかどうかを予測することは、人間の相互作用を理解する上で重要な役割を果たします。この作業では、画像ベースの相互視線検出のタスクに焦点を当て、トレーニングフェーズで補助的な3D視線推定タスクを使用してパフォーマンスを向上させるシンプルで効果的なアプローチを提案します。相互注視ラベルから推定される疑似3D注視ラベルを使用して3D注視推定ブランチをトレーニングすることにより、追加のラベル付けコストなしでパフォーマンスの向上を実現します。 3D視線推定と相互視線検出ブランチ間で頭部画像エンコーダーを共有することにより、相互視線検出ブランチのみをトレーニングすることで学習するよりも優れた頭部機能を実現します。 3つの画像データセットでの実験結果は、提案されたアプローチが追加の注釈なしで検出性能を大幅に改善することを示しています。この作品はまた、29.2Kの画像で相互注視ラベルで注釈が付けられた33.1Kの人間のペアで構成される新しい画像データセットを紹介します。
Mutual gaze detection, i.e., predicting whether or not two people are looking at each other, plays an important role in understanding human interactions. In this work, we focus on the task of image-based mutual gaze detection, and propose a simple and effective approach to boost the performance by using an auxiliary 3D gaze estimation task during the training phase. We achieve the performance boost without additional labeling cost by training the 3D gaze estimation branch using pseudo 3D gaze labels deduced from mutual gaze labels. By sharing the head image encoder between the 3D gaze estimation and the mutual gaze detection branches, we achieve better head features than learned by training the mutual gaze detection branch alone. Experimental results on three image datasets show that the proposed approach improves the detection performance significantly without additional annotations. This work also introduces a new image dataset that consists of 33.1K pairs of humans annotated with mutual gaze labels in 29.2K images.
updated: Tue Dec 22 2020 17:20:59 GMT+0000 (UTC)
published: Thu Oct 15 2020 15:01:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト