因果推論は、人間や他の知的な動物が物理的な世界と相互作用するために不可欠な能力でした。この作業では、目標指向タスクを完了するための因果推論の能力を人工エージェントに付与することを提案します。潜在的な因果構造を持つ新しい環境でタスクを実行するために学習された目標条件付きポリシーを文脈化するために使用できる、有向非循環グラフの形で因果知識を誘導する学習ベースのアプローチを開発します。因果誘導モデルと目標条件ポリシーの注意メカニズムを活用して、エージェントの視覚的観察から因果グラフを増分的に生成し、誘導されたグラフをアクションの決定に選択的に使用できるようにします。私たちの実験は、私たちの方法が以前は見えなかった因果構造を持つ新しい環境で新しいタスクを完了するために効果的に一般化することを示しています。
Causal reasoning has been an indispensable capability for humans and other intelligent animals to interact with the physical world. In this work, we propose to endow an artificial agent with the capability of causal reasoning for completing goal-directed tasks. We develop learning-based approaches to inducing causal knowledge in the form of directed acyclic graphs, which can be used to contextualize a learned goal-conditional policy to perform tasks in novel environments with latent causal structures. We leverage attention mechanisms in our causal induction model and goal-conditional policy, enabling us to incrementally generate the causal graph from the agent's visual observations and to selectively use the induced graph for determining actions. Our experiments show that our method effectively generalizes towards completing new tasks in novel environments with previously unseen causal structures.