arXiv reaDer
Speak2Label: Using Domain Knowledge for Creating a Large Scale Driver Gaze Zone Estimation Dataset
人間の行動分析データのラベル付けは、複雑で時間のかかる作業です。この論文では、ドライバーの視線ゾーン推定のために画像ベースの視線行動データセットにラベルを付けるための完全自動技術を提案した。ドメイン知識はデータ記録パラダイムに追加され、後のラベルは音声からテキストへの変換(STT)を使用して自動的に生成されます。データ内の被験者の照明と民族性の違いによるSTTプロセスのノイズを除去するために、音声周波数とエネルギーが分析されます。結果として得られるDriverGaze in the Wild(DGW)データセットには、夕方を含む1日のさまざまな時間帯にキャプチャされた586の記録が含まれています。大規模なデータセットには、18〜63歳の年齢範囲の338人の被験者が含まれています。データはさまざまな照明条件で記録されるため、畳み込みニューラルネットワーク(CNN)で照明ロバストレイヤーが提案されます。広範な実験は、実際の条件に似たデータセットの分散と、提案されたCNNパイプラインの有効性を示しています。提案されたネットワークは、視線予測タスク用に微調整されています。これは、提案されたDGWデータセットでネットワークによって学習された表現の識別性を示します。プロジェクトページ:
Labelling of human behavior analysis data is a complex and time consuming task. In this paper, a fully automatic technique for labelling an image based gaze behavior dataset for driver gaze zone estimation is proposed. Domain knowledge is added to the data recording paradigm and later labels are generated in an automatic manner using Speech To Text conversion (STT). In order to remove the noise in the STT process due to different illumination and ethnicity of subjects in our data, the speech frequency and energy are analysed. The resultant Driver Gaze in the Wild (DGW) dataset contains 586 recordings, captured during different times of the day including evenings. The large scale dataset contains 338 subjects with an age range of 18-63 years. As the data is recorded in different lighting conditions, an illumination robust layer is proposed in the Convolutional Neural Network (CNN). The extensive experiments show the variance in the dataset resembling real-world conditions and the effectiveness of the proposed CNN pipeline. The proposed network is also fine-tuned for the eye gaze prediction task, which shows the discriminativeness of the representation learnt by our network on the proposed DGW dataset. Project Page:
updated: Mon Oct 18 2021 04:37:58 GMT+0000 (UTC)
published: Mon Apr 13 2020 14:47:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト