arXiv reaDer
子供の目を通しての自己教師あり学習
Self-supervised learning through the eyes of a child
生まれてから数か月以内に、子供たちは自分の周りの世界について意味のある期待を抱きます。この初期の知識のどれだけが感覚データに適用される一般的な学習メカニズムを通して説明することができますか、そしてそれのどれだけがより実質的な生来の誘導バイアスを必要としますか?この基本的な質問に完全に対処することは現在不可能ですが、データ収集技術の改善と最近の深層学習の進歩のおかげで、高レベルの視覚カテゴリの開発など、より狭く定義されたドメインで実際の進歩を遂げることが期待できます。この論文では、私たちの目標は、現代の自己教師あり深層学習方法と、3人の幼児の視点から記録された最近の縦方向の自己中心的なビデオデータセットを利用することによって、そのような進歩を正確に達成することです(Sullivan et al。、2020)。私たちの結果は、一般的な自己教師あり学習の目的を使用して、発達的に現実的な自然のビデオから強力で高レベルの視覚的表現の出現を示しています。
Within months of birth, children develop meaningful expectations about the world around them. How much of this early knowledge can be explained through generic learning mechanisms applied to sensory data, and how much of it requires more substantive innate inductive biases? Addressing this fundamental question in its full generality is currently infeasible, but we can hope to make real progress in more narrowly defined domains, such as the development of high-level visual categories, thanks to improvements in data collecting technology and recent progress in deep learning. In this paper, our goal is precisely to achieve such progress by utilizing modern self-supervised deep learning methods and a recent longitudinal, egocentric video dataset recorded from the perspective of three young children (Sullivan et al., 2020). Our results demonstrate the emergence of powerful, high-level visual representations from developmentally realistic natural videos using generic self-supervised learning objectives.
updated: Tue Dec 15 2020 18:24:16 GMT+0000 (UTC)
published: Fri Jul 31 2020 17:33:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト