arXiv reaDer
ImageSubject:被験者検出のための大規模なデータセット
ImageSubject: A Large-scale Dataset for Subject Detection
主な被写体は、写真家が強調したいオブジェクトであるため、通常、画像やビデオに存在します。人間の視聴者はそれらを簡単に識別できますが、アルゴリズムはそれらを他のオブジェクトと混同することがよくあります。主要な被写体を検出することは、機械が画像やビデオの内容を理解するのに役立つ重要な手法です。オブジェクトのレイアウトと画像のコンテキストを理解し、それらの中から主要な主題を見つけるためのモデルのトレーニングを目的とした新しいデータセットを提示します。これは3つの側面で達成されます。プロの撮影スキルを持つ監督が作成した映画のショットから画像を収集することで、多様性の高いデータセットを収集します。具体的には、21,540の映画のショットから107,700の画像が含まれています。サブジェクトと非サブジェクトの前景オブジェクトの2つのクラスのバウンディングボックスラベルでラベルを付けました。データセットの詳細な分析を提示し、タスクを顕著性検出およびオブジェクト検出と比較します。 ImageSubjectは、写真家が強調したい画像内の被写体をローカライズしようとする最初のデータセットです。さらに、変圧器ベースの検出モデルは、他の一般的なモデルアーキテクチャの中で最良の結果を提供することがわかります。最後に、潜在的なアプリケーションについて説明し、データセットの重要性について結論を出します。
Main subjects usually exist in the images or videos, as they are the objects that the photographer wants to highlight. Human viewers can easily identify them but algorithms often confuse them with other objects. Detecting the main subjects is an important technique to help machines understand the content of images and videos. We present a new dataset with the goal of training models to understand the layout of the objects and the context of the image then to find the main subjects among them. This is achieved in three aspects. By gathering images from movie shots created by directors with professional shooting skills, we collect the dataset with strong diversity, specifically, it contains 107 700 images from 21 540 movie shots. We labeled them with the bounding box labels for two classes: subject and non-subject foreground object. We present a detailed analysis of the dataset and compare the task with saliency detection and object detection. ImageSubject is the first dataset that tries to localize the subject in an image that the photographer wants to highlight. Moreover, we find the transformer-based detection model offers the best result among other popular model architectures. Finally, we discuss the potential applications and conclude with the importance of the dataset.
updated: Sun Jan 09 2022 22:49:59 GMT+0000 (UTC)
published: Sun Jan 09 2022 22:49:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト