アブダクティブ推論は、与えられた一連の不完全な観測に対して最も可能性の高い推論を行うことを目的としています。この作業では、与えられた状況で、モデルが「現在の状態に到達するために人間が実行したアクションは何か?」という質問に答える、誘拐行動推論と呼ばれる新しいタスクを提案します。与えられた状態に対して、アクション セット予測、アクション シーケンス予測、およびアブダクティブ アクション検証の 3 つのアブダクティブ推論問題を調査します。 Transformers、Graph ニューラル ネットワーク、CLIP、BLIP、エンドツーエンドのトレーニング済み Slow-Fast、Resnet50-3D モデルなど、いくつかの SOTA モデルのベンチマークを行います。新しく提案されたオブジェクト リレーショナル BiGED モデルは、Action Genome データセットでのこの困難なタスクにおいて、他のすべての方法よりも優れています。コードが利用可能になります。
Abductive reasoning aims to make the most likely inference for a given set of incomplete observations. In this work, we propose a new task called abductive action inference, in which given a situation, the model answers the question `what actions were executed by the human in order to arrive in the current state?'. Given a state, we investigate three abductive inference problems: action set prediction, action sequence prediction, and abductive action verification. We benchmark several SOTA models such as Transformers, Graph neural networks, CLIP, BLIP, end-to-end trained Slow-Fast, and Resnet50-3D models. Our newly proposed object-relational BiGED model outperforms all other methods on this challenging task on the Action Genome dataset. Codes will be made available.