arXiv reaDer
時空間推論のためのオブジェクトベースの注意:柔軟な分散アーキテクチャを備えた優れた神経シンボリックモデル
Object-based attention for spatio-temporal reasoning: Outperforming neuro-symbolic models with flexible distributed architectures
ニューラルネットワークは、さまざまな知覚タスクで成功を収めていますが、より高いレベルの推論を必要とするタスクを解決できないとよく言われます。 2つの新しいタスクドメイン、CLEVRERとCATERは、オブジェクト間の時空間相互作用のコンテキストで、知覚ではなく推論に焦点を当てるために最近開発されました。これらのドメインでの最初の実験では、論理エンジンと言語パーサーをニューラル知覚フロントエンドと結合するニューロシンボリックアプローチが、完全に学習された分散ネットワークよりも大幅に優れていることがわかりました。これは、上記の論文をサポートするために採用された発見です。ここでは、逆に、適切な誘導バイアスを備えた完全に学習されたニューラルネットワークが、これらのタスクの両方で、特に知覚よりも推論を最も強調する質問で、以前のすべてのニューラルシンボリックモデルよりも大幅に優れたパフォーマンスを発揮できることを示します。私たちのモデルは、自己注意と学習された「ソフト」オブジェクト中心の表現の両方、およびBERTスタイルの半教師あり予測損失を批判的に利用します。これらの柔軟なバイアスにより、利用可能なラベル付きデータの60%未満を使用して、モデルが以前のニューロシンボリックな最先端技術を超えることができます。一緒に、これらの結果は、これらのデータセットを含む以前の研究によって提示された神経記号論に反論し、ニューラルネットワークが実際に物理的イベントの因果的で動的な構造について効果的に推論することを学ぶことができるという証拠を提供します。
Neural networks have achieved success in a wide array of perceptual tasks, but it is often stated that they are incapable of solving tasks that require higher-level reasoning. Two new task domains, CLEVRER and CATER, have recently been developed to focus on reasoning, as opposed to perception, in the context of spatio-temporal interactions between objects. Initial experiments on these domains found that neuro-symbolic approaches, which couple a logic engine and language parser with a neural perceptual front-end, substantially outperform fully-learned distributed networks, a finding that was taken to support the above thesis. Here, we show on the contrary that a fully-learned neural network with the right inductive biases can perform substantially better than all previous neural-symbolic models on both of these tasks, particularly on questions that most emphasize reasoning over perception. Our model makes critical use of both self-attention and learned "soft" object-centric representations, as well as BERT-style semi-supervised predictive losses. These flexible biases allow our model to surpass the previous neuro-symbolic state-of-the-art using less than 60% of available labelled data. Together, these results refute the neuro-symbolic thesis laid out by previous work involving these datasets, and they provide evidence that neural networks can indeed learn to reason effectively about the causal, dynamic structure of physical events.
updated: Tue Dec 15 2020 18:57:40 GMT+0000 (UTC)
published: Tue Dec 15 2020 18:57:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト