近年、産業用アプリケーションの強い要求に支えられて、漫画メディアで注目が高まっています。このメディアを理解するための最初のステップとして、漫画の顔認識は、提案されているデータセットがほとんどないため、重要ですがあまり探索されていないタスクです。この作業では、最初に、アイデンティティ、バウンディングボックス、ポーズ、およびその他の補助属性で注釈が付けられた5,013の漫画のキャラクターの389,678枚の画像で構成される、新しい挑戦的なベンチマークデータセットを示します。 iCartoonFaceという名前のデータセットは、現在、最大のスケール、高品質、豊富な注釈が付けられており、ほぼ重複、オクルージョン、外観の変更など、画像認識の分野で複数回発生しています。さらに、半自動ラベリングアルゴリズムを使用して、漫画メディアに2種類の注釈(顔認識と顔検出)を提供します。この挑戦的なデータセットをさらに調査するために、3つの判別正則化を使用して人間と漫画のドメイン知識を共同で利用するマルチタスクドメイン適応アプローチを提案します。したがって、提案されたデータセットのベンチマーク分析を実行し、漫画の顔認識タスクにおける提案されたアプローチの優位性を検証します。この一般公開は、幅広い実用的なアプリケーションシナリオでより多くの研究の注目を集めると信じています。
Recent years have witnessed increasing attention in cartoon media, powered by the strong demands of industrial applications. As the first step to understand this media, cartoon face recognition is a crucial but less-explored task with few datasets proposed. In this work, we first present a new challenging benchmark dataset, consisting of 389,678 images of 5,013 cartoon characters annotated with identity, bounding box, pose, and other auxiliary attributes. The dataset, named iCartoonFace, is currently the largest-scale, high-quality, richannotated, and spanning multiple occurrences in the field of image recognition, including near-duplications, occlusions, and appearance changes. In addition, we provide two types of annotations for cartoon media, i.e., face recognition, and face detection, with the help of a semi-automatic labeling algorithm. To further investigate this challenging dataset, we propose a multi-task domain adaptation approach that jointly utilizes the human and cartoon domain knowledge with three discriminative regularizations. We hence perform a benchmark analysis of the proposed dataset and verify the superiority of the proposed approach in the cartoon face recognition task. We believe this public availability will attract more research attention in broad practical application scenarios.