Learning Dynamics of Attention: Human Prior for Interpretable Machine Reasoning
 関連する人間の事前条件がなければ、ニューラルネットワークは解釈できない特徴を学習する可能性があります。フォーカス遷移の注意のダイナミクス(DAFT)を人間の機械推論の事前として提案します。 DAFTは、神経常微分方程式を使用して連続動的システムとしてモデル化することにより、注意に基づく推論を正則化する新しい方法です。概念実証として、最先端の視覚的推論モデルにDAFTを追加します。私たちの実験では、DAFTを適用すると、より少ない推論ステップを使用しながら元のモデルと同様のパフォーマンスが得られることが明らかになり、不必要なステップをスキップすることを暗黙的に学習することが示されます。また、特定のモデルの焦点が質問について推論している間にどれだけドリフトするかを定量化することにより、効果的な推論ステップサイズを表す新しいメトリックである総遷移時間(TLT)を提案します。 DAFTを追加すると、TLTが低くなり、解釈可能なアテンションマップを作成することに加えて、より短い推論パスに向かって人間の方法に実際に従うことを示します。コードはで入手できます。
Without relevant human priors, neural networks may learn uninterpretable features. We propose Dynamics of Attention for Focus Transition (DAFT) as a human prior for machine reasoning. DAFT is a novel method that regularizes attention-based reasoning by modelling it as a continuous dynamical system using neural ordinary differential equations. As a proof of concept, we augment a state-of-the-art visual reasoning model with DAFT. Our experiments reveal that applying DAFT yields similar performance to the original model while using fewer reasoning steps, showing that it implicitly learns to skip unnecessary steps. We also propose a new metric, Total Length of Transition (TLT), which represents the effective reasoning step size by quantifying how much a given model's focus drifts while reasoning about a question. We show that adding DAFT results in lower TLT, demonstrating that our method indeed obeys the human prior towards shorter reasoning paths in addition to producing more interpretable attention maps. Our code is available at
updated: Mon Dec 23 2019 05:37:28 GMT+0000 (UTC)
published: Tue May 28 2019 08:13:37 GMT+0000 (UTC)
