arXiv reaDer
屋外の自然シーンの記憶力を理解し、予測する
Understanding and Predicting the Memorability of Outdoor Natural Scenes
記憶力は、一瞥した後の画像の記憶のしやすさを測定し、雑誌の表紙や観光宣伝資料などのデザインに貢献する可能性があります。最近の作品は、一般的な画像、オブジェクト画像、または顔写真を思い出深いものにする視覚的特徴に光を当てています。ただし、これらの方法では、屋外の自然シーン画像の記憶力を効果的に予測することはできません。以前の作品のこの欠点を克服するために、この論文では、「屋外の自然のシーンを正確に思い出深いものにするもの」に答える試みを提供します。この目的のために、まず、大規模な屋外自然シーン画像記憶可能性(LNSIM)データベースを確立します。このデータベースには、グラウンドトゥルース記憶可能性スコアとマルチラベルシーンカテゴリ注釈を含む2,632の屋外自然シーン画像が含まれています。次に、以前の作品と同様に、データベースをマイニングして、低レベル、中レベル、および高レベルの手作りの機能が屋外の自然シーンの記憶にどのように影響するかを調査します。特に、シーンカテゴリの高レベルの特徴は屋外の自然シーンの記憶力とかなり相関しており、ディープニューラルネットワーク(DNN)によって学習された深い特徴も記憶力スコアの予測に効果的であることがわかります。さらに、深い特徴とカテゴリー特徴を組み合わせることで、記憶力予測のパフォーマンスをさらに高めることができます。したがって、学習したカテゴリ関連の機能を利用する、エンドツーエンドのDNNベースの屋外自然シーン記憶可能性(DeepNSM)予測子を提案します。次に、実験結果は、最先端の方法を超えて、DeepNSMモデルの有効性を検証します。最後に、DeepNSMモデルのパフォーマンスが優れている理由を理解し、DeepNSMモデルが屋外の自然シーンの記憶力を正確に予測できる場合と失敗している場合を調査します。コード:github.com/JiaxinLu-home/Natural-Scene-Memorability-Dataset。
Memorability measures how easily an image is to be memorized after glancing, which may contribute to designing magazine covers, tourism publicity materials, and so forth. Recent works have shed light on the visual features that make generic images, object images or face photographs memorable. However, these methods are not able to effectively predict the memorability of outdoor natural scene images. To overcome this shortcoming of previous works, in this paper, we provide an attempt to answer: "what exactly makes outdoor natural scenes memorable". To this end, we first establish a large-scale outdoor natural scene image memorability (LNSIM) database, containing 2,632 outdoor natural scene images with their ground truth memorability scores and the multi-label scene category annotations. Then, similar to previous works, we mine our database to investigate how low-, middle- and high-level handcrafted features affect the memorability of outdoor natural scenes. In particular, we find that the high-level feature of scene category is rather correlated with outdoor natural scene memorability, and the deep features learnt by deep neural network (DNN) are also effective in predicting the memorability scores. Moreover, combining the deep features with the category feature can further boost the performance of memorability prediction. Therefore, we propose an end-to-end DNN based outdoor natural scene memorability (DeepNSM) predictor, which takes advantage of the learned category-related features. Then, the experimental results validate the effectiveness of our DeepNSM model, exceeding the state-of-the-art methods. Finally, we try to understand the reason of the good performance for our DeepNSM model, and also study the cases that our DeepNSM model succeeds or fails to accurately predict the memorability of outdoor natural scenes. Code: github.com/JiaxinLu-home/Natural-Scene-Memorability-Dataset.
updated: Tue Nov 23 2021 13:05:39 GMT+0000 (UTC)
published: Tue Oct 09 2018 09:25:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト