arXiv reaDer
確率的外転と実行による抽象的な時空間推論
Abstract Spatial-Temporal Reasoning via Probabilistic Abduction and Execution
時空間推論は、その要求が厳しいが独特の性質のために、人工知能(AI)の挑戦的なタスクです:念頭に置いた時空間知識に基づいて表現および推論することに関する理論的要件、および能力のある高レベルの認知システムに適用される要件空間と時間の中でナビゲートし行動することの最近の作品は、この種の抽象的な推論タスクであるRaven's Progressive Matrices(RPM)に焦点を当てています。精度の点で人間レベルのパフォーマンスを達成するRPMの有望な進歩にもかかわらず、現代のアプローチには、一般化に関する人間のような推論の扱いも、答えを生成する可能性もありません。このギャップを埋めるために、神経シンボリックな確率的外転と実行(PrAE)学習者を提案します。 PrAE学習者の中心は、オブジェクトの精神的な操作に似た、確率的なシーン表現での確率的な外転と実行のプロセスです。具体的には、モノリシックモデルから知覚と推論を解きほぐします。神経視覚知覚フロントエンドは、オブジェクトの属性を予測し、後でシーン推論エンジンによって集約されて、確率的なシーン表現を生成します。シンボリック論理的推論バックエンドでは、PrAE学習者は表現を使用して隠されたルールを誘拐します。確率的表現のルールを実行することにより、答えが予測されます。システム全体は、視覚的な属性の注釈なしで、合成による分析の方法でエンドツーエンドでトレーニングされます。広範な実験は、PrAE学習者が構成間の一般化を改善し、候補から単にカテゴリを選択する以前の作業とは対照的に、答えをレンダリングできることを示しています。
Spatial-temporal reasoning is a challenging task in Artificial Intelligence (AI) due to its demanding but unique nature: a theoretic requirement on representing and reasoning based on spatial-temporal knowledge in mind, and an applied requirement on a high-level cognitive system capable of navigating and acting in space and time. Recent works have focused on an abstract reasoning task of this kind -- Raven's Progressive Matrices (RPM). Despite the encouraging progress on RPM that achieves human-level performance in terms of accuracy, modern approaches have neither a treatment of human-like reasoning on generalization, nor a potential to generate answers. To fill in this gap, we propose a neuro-symbolic Probabilistic Abduction and Execution (PrAE) learner; central to the PrAE learner is the process of probabilistic abduction and execution on a probabilistic scene representation, akin to the mental manipulation of objects. Specifically, we disentangle perception and reasoning from a monolithic model. The neural visual perception frontend predicts objects' attributes, later aggregated by a scene inference engine to produce a probabilistic scene representation. In the symbolic logical reasoning backend, the PrAE learner uses the representation to abduce the hidden rules. An answer is predicted by executing the rules on the probabilistic representation. The entire system is trained end-to-end in an analysis-by-synthesis manner without any visual attribute annotations. Extensive experiments demonstrate that the PrAE learner improves cross-configuration generalization and is capable of rendering an answer, in contrast to prior works that merely make a categorical choice from candidates.
updated: Fri Mar 26 2021 02:42:18 GMT+0000 (UTC)
published: Fri Mar 26 2021 02:42:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト