arXiv reaDer
答えが正しい理由を示してください!構成的時間的注意を使用した説明可能なAIに向けて
Show Why the Answer is Correct! Towards Explainable AI using Compositional Temporal Attention
視覚的質問応答(VQA)モデルは、最近大きな成功を収めています。 VQAモデルの成功にもかかわらず、それらはほとんどがブラックボックスモデルであり、予測された回答についての理由を提供しないため、自律システムやサイバーセキュリティなどのセーフティクリティカルへの適用性について疑問が生じます。現在の最先端技術は、より複雑な質問に失敗しているため、構成性を活用することができません。これらのモデルのブラックボックス効果を最小限に抑え、構成性をより有効に活用するために、特定の質問を理解し、モジュールのプールからさまざまな比較的浅い深層学習モジュールを動的に組み立てることができる動的ニューラルネットワーク(DMN)を提案します。ネットワークを形成します。構成性の活用を増やすために、これらの深層学習ベースのモジュールに構成的な時間的注意を組み込みます。これにより、複雑な質問の理解が深まり、モジュールが特定の回答を予測する理由についての推論も提供されます。 2つのベンチマークデータセットVQA2.0とCLEVRの実験的分析は、モデルが視覚的な質問応答タスクの以前のアプローチよりも優れているだけでなく、より良い推論を提供することを示しています。したがって、安全性やセキュリティなどのミッションクリティカルなアプリケーションで信頼性が高くなります。
Visual Question Answering (VQA) models have achieved significant success in recent times. Despite the success of VQA models, they are mostly black-box models providing no reasoning about the predicted answer, thus raising questions for their applicability in safety-critical such as autonomous systems and cyber-security. Current state of the art fail to better complex questions and thus are unable to exploit compositionality. To minimize the black-box effect of these models and also to make them better exploit compositionality, we propose a Dynamic Neural Network (DMN), which can understand a particular question and then dynamically assemble various relatively shallow deep learning modules from a pool of modules to form a network. We incorporate compositional temporal attention to these deep learning based modules to increase compositionality exploitation. This results in achieving better understanding of complex questions and also provides reasoning as to why the module predicts a particular answer. Experimental analysis on the two benchmark datasets, VQA2.0 and CLEVR, depicts that our model outperforms the previous approaches for Visual Question Answering task as well as provides better reasoning, thus making it reliable for mission critical applications like safety and security.
updated: Sat May 15 2021 04:51:51 GMT+0000 (UTC)
published: Sat May 15 2021 04:51:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト