arXiv reaDer
Bag of Genres for Video Retrieval
多くの場合、動画は複数のコンセプトやジャンルで構成されています。たとえば、ニュースビデオにはスポーツ、アクション、自然などが含まれている場合があります。したがって、そのような概念/ジャンルの配布をコンパクトで効果的な表現でエンコードすることは困難な作業です。この意味で、ジャンル分類器によって定義された視覚辞書に基づく、BagofGenres表現を提案します。各視覚的単語は、分類空間内の領域に対応します。 Bag ofGenresビデオベクターには、ビデオコンテンツ内の各ジャンルのアクティベーションの概要が含まれています。 2012年のMediaEvalTagging Taskのデータセットを使用したビデオジャンル検索と、EVVEデータセットを使用したビデオイベント検索の提案された方法を評価します。結果は、提案された方法が、既存の機能よりもはるかにコンパクトな表現を提供するという利点を備えた、最先端の方法と同等またはそれ以上の結果を達成することを示しています。
Often, videos are composed of multiple concepts or even genres. For instance, news videos may contain sports, action, nature, etc. Therefore, encoding the distribution of such concepts/genres in a compact and effective representation is a challenging task. In this sense, we propose the Bag of Genres representation, which is based on a visual dictionary defined by a genre classifier. Each visual word corresponds to a region in the classification space. The Bag of Genres video vector contains a summary of the activations of each genre in the video content. We evaluate the proposed method for video genre retrieval using the dataset of MediaEval Tagging Task of 2012 and for video event retrieval using the EVVE dataset. Results show that the proposed method achieves results comparable or superior to state-of-the-art methods, with the advantage of providing a much more compact representation than existing features.
updated: Sat Dec 26 2020 14:17:03 GMT+0000 (UTC)
published: Sat May 30 2015 00:35:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト