arXiv reaDer
自己教師あり学習によるコンテキストからの理由
Reason from Context with Self-supervised Learning
自己教師あり学習 (SSL) は、知識の伝達に役立つ差別的な視覚的特徴を捉えることを学習します。オブジェクトの認識や検出など、現在のダウンストリーム タスクのオブジェクト中心の性質によりよく対応するために、コンテキスト バイアスを抑制したり、オブジェクトをコンテキストから切り離したりするためのさまざまな方法が提案されています。それにもかかわらず、これらの方法は、小さなオブジェクトや不明瞭なオブジェクトを認識または推測するなど、関連するコンテキストからオブジェクトの同一性を推論する必要がある状況では不十分であることが判明する可能性があります。 SSL 文献の最初の取り組みとして、(a) Context Reasoning (SeCo) のための外部メモリを使用した新しい自己教師あり方法を提案することにより、SSL レジーム内で視覚的推論のためにコンテキスト関連を強化できるかどうか、およびその方法を調査します。 ) 2 つの新しいダウンストリーム タスク、リフト ザ フラップとオブジェクト プライミングを導入し、コンテキスト推論における「何」と「どこ」の問題に対処します。両方のタスクで、SeCo はすべての最先端 (SOTA) SSL メソッドを大幅に上回りました。私たちのネットワーク分析により、SeCo で提案されている外部メモリは、事前のコンテキスト知識を保存することを学習し、フラップを持ち上げるタスクでターゲットのアイデンティティの推論を容易にすることが明らかになりました。さらに、心理物理実験を実施し、オブジェクト プライミング データセット (HOP) に人間のベンチマークを導入しました。私たちの結果は、SeCo が人間のような行動を示すことを示しています。
Self-supervised learning (SSL) learns to capture discriminative visual features useful for knowledge transfers. To better accommodate the object-centric nature of current downstream tasks such as object recognition and detection, various methods have been proposed to suppress contextual biases or disentangle objects from contexts. Nevertheless, these methods may prove inadequate in situations where object identity needs to be reasoned from associated context, such as recognizing or inferring tiny or obscured objects. As an initial effort in the SSL literature, we investigate whether and how contextual associations can be enhanced for visual reasoning within SSL regimes, by (a) proposing a new Self-supervised method with external memories for Context Reasoning (SeCo), and (b) introducing two new downstream tasks, lift-the-flap and object priming, addressing the problems of "what" and "where" in context reasoning. In both tasks, SeCo outperformed all state-of-the-art (SOTA) SSL methods by a significant margin. Our network analysis revealed that the proposed external memory in SeCo learns to store prior contextual knowledge, facilitating target identity inference in the lift-the-flap task. Moreover, we conducted psychophysics experiments and introduced a Human benchmark in Object Priming dataset (HOP). Our results demonstrate that SeCo exhibits human-like behaviors.
updated: Tue Apr 11 2023 07:17:38 GMT+0000 (UTC)
published: Wed Nov 23 2022 10:02:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト