動物に大きく依存しているため、動物のニーズを理解することで動物の健康を改善することは私たちの倫理的義務です。いくつかの研究は、動物のニーズがしばしば彼らの顔を通して表現されることを示しています。人間の顔の自動理解に向けて著しい進歩が遂げられましたが、残念ながら動物の顔の場合はそうではありませんでした。動物の顔を解釈できる自動システムを開発する大きなスペースと適切なニーズが存在します。多くの変革的影響の中で、そのような技術は動物のヘルスケアをより良く、より安く育て、動物の心理学の理解をさらに促進します。基礎となる研究の進歩は、動物種の幅広いスペクトルをカバーする動物の顔の適切に注釈が付けられたデータセットの欠如によって主に妨げられると考えています。この目的のために、334の多様な種から21.9Kの顔と生物分類学全体で21の動物の注文を特徴とする、動物の顔の大規模で階層的な注釈付きデータセットを紹介します。これらの顔は、「野生の」状態でキャプチャされ、主要な顔の特徴に関する9つのランドマークで常に注釈が付けられています。提案されたデータセットは、設計によって構造化され、スケーラブルです。その開発には、6K時間以上の厳密な手動注釈作業を含む4つの体系的な段階がありました。斬新な問題設定の下で、既存のアートを使用して、顔の位置合わせのベンチマークを行います。結果は、その挑戦的な性質、独自の属性を示し、斬新で適応性があり、一般化された顔指向CVアルゴリズムの明確な見通しを提示します。マルチタスクアプリケーションと改善の余地があることを示すために、顔検出およびきめの細かい認識タスクのデータセットをさらにベンチマークします。実験は、このデータセットが多くの関連するCVタスク全体でアルゴリズムの進歩を推進し、動物の顔の行動を監視するための新しいシステムの開発を促進することを示しています。データセットを公開します。
Being heavily reliant on animals, it is our ethical obligation to improve their well-being by understanding their needs. Several studies show that animal needs are often expressed through their faces. Though remarkable progress has been made towards the automatic understanding of human faces, this has regrettably not been the case with animal faces. There exists significant room and appropriate need to develop automatic systems capable of interpreting animal faces. Among many transformative impacts, such a technology will foster better and cheaper animal healthcare, and further advance animal psychology understanding. We believe the underlying research progress is mainly obstructed by the lack of an adequately annotated dataset of animal faces, covering a wide spectrum of animal species. To this end, we introduce a large-scale, hierarchical annotated dataset of animal faces, featuring 21.9K faces from 334 diverse species and 21 animal orders across biological taxonomy. These faces are captured `in-the-wild' conditions and are consistently annotated with 9 landmarks on key facial features. The proposed dataset is structured and scalable by design; its development underwent four systematic stages involving rigorous, manual annotation effort of over 6K man-hours. We benchmark it for face alignment using the existing art under novel problem settings. Results showcase its challenging nature, unique attributes and present definite prospects for novel, adaptive, and generalized face-oriented CV algorithms. We further benchmark the dataset for face detection and fine-grained recognition tasks, to demonstrate multi-task applications and room for improvement. Experiments indicate that this dataset will push the algorithmic advancements across many related CV tasks and encourage the development of novel systems for animal facial behaviour monitoring. We will make the dataset publicly available.